• java字符串应用之表达式解析器


     一、表达式的组成
        1、数字
        2、运算符:+ - / * ^ % =
        3、圆括号
        4、变量
    二、运算符优先级
        由高到低分别为:+-(正负号)、^、*/%、+-、=
        优先级相等的运算符按照从左到右的顺序计算
    三、关键技术点
        1、确定运算的优先级,从高到低分别为:原子元素表达式,包括数字和变量;括号表达式;一元表达式,取数的负数;指数表达式;乘、除、取模表达式;加、减表达式;赋值表达式。
        2、对于每一级别的运算,都由一个方法实现,在方法中先完成比自己高一级别的运算,再处理本级别的运算。因此,在计算整个表达式的主方法中,只需要调用最低级别的运算的实现方法即可。
        3、确定表达式中的分隔符,(+、-、*、/、%、^、=、(、)、)。利用这些分隔符将表达式分成多段,每一段叫做一个token,分隔符也算token。
        4、用长度为26的int数组vars存储变量的值。
        5、Character的isWhitespace方法判断字符是否为空白符,用于去掉表达式中的空白符。
        6、Character的isLetter方法判断字符是否为字母,用于提取表达式中的变量
        7、Character的isDigit方法判断字符是否为数字,用于获取表达式中的数字
        
    四、演示实例

    /** *//**
     * 文件名ExpressionParser.java
     */
    package book.oo.String;

    /** *//**
     * 表达式解析器
     * @author joe
     *
     */
    public class ExpressionParser ...{
        //4种标记类型
        public static final int NONE_TOKEN = 0;    //标记为空或者结束符
        public static final int DELIMITER_TOKEN = 1;    //标记为分隔符
        public static final int VARIABLE_TOKEN = 2;    //标记为变量
        public static final int NUMBER_TOKEN = 3;    //标记为数字
        
        //4种错误类型
        public static final int SYNTAX_ERROR = 0;    //语法错误
        public static final int UNBALPARENS_ERROR = 1;    //括号没有结束错误
        public static final int NOEXP_ERROR = 2;    //表达式为空错误
        public static final int DIVBYZERO_ERROR = 3;    //被0除错误
        
        //针对4种错误类型定义的4个错误提示
        public static final String[] ERROR_MESSAGES = ...{"Syntax Error", "Unbalanced " +
                "Parentheses", "No Expression Present", "Division by Zero"};
        
        //表达式的结束标记
        public static final String EOE = ""/0";
     
     private String exp; //表达式字符串
     private int expIndex; //解析器当前指针在表达式中的位置
     private String token; //解析器当前处理的标记
     private int tokenType; //解析器当前处理的标记类型
     private double[] vars = new double[26]; //变量数组
     /**
      * 
      */
     public ExpressionParser() {
     }
     
     /**
      * 解析一个表达式,返回表达式的值
      */
     public double evaluate(String expStr) throws Exception {
      double result;
      this.exp = expStr;
      this.expIndex = 0;
      
      //获取第一个标记
      this.getToken();
      if (this.token.equals(EOE)) {
       //没有表达式异常
       this.handleError(NOEXP_ERROR);
      }
      
      result = this.parseAssign(); //处理赋值语句
      //处理完赋值语句,应该就是表达式结束符,如果不是,则返回异常
      if(!this.token.equals(EOE)) {
       this.handleError(SYNTAX_ERROR);
      }
      return result;
     }
     
     /**
      * 处理赋值语句
      */
     public double parseAssign() throws Exception {
      double result; //结果
      int varIndex; //变量下标
      String oldToken; //旧标记
      int oldTokenType; //旧标记的类型
      
      //如果标记类型是变量
      if (this.tokenType == VARIABLE_TOKEN) {
       //保存当前标记
       oldToken = new String(this.token);
       oldTokenType = this.tokenType;
       //取得变量的索引,本解析器只支持一个字母的变量
       //如果用户的变量字母长度大于1,则取第一个字母当作变量
       varIndex = Character.toUpperCase(this.token.charAt(0)) - ''A'';
       
       //获得下一个标记
       this.getToken();
       //如果当前标记不是等号=
       if(!this.token.equals("=")) {
        this.putBack(); //回滚
        //不是一个赋值语句,将标记恢复到上一个标记
        this.token = new String(oldToken);
        this.tokenType = oldTokenType;
       } else {
        //如果当前标记是等号=,即给变量赋值,形式如:a = 3 + 5;
        //则计算等号后面表达式的值,然后再将得到的值赋给变量
        this.getToken();
        //因为加减法的优先级最低,所以计算加减法表达式
        result = this.parseAddOrSub();
        //将表达式的值赋给变量,并存在实例变量vars中
        this.vars[varIndex] = result;
        return result;
       }
      }
      //如果当前标记类型不是变量,或者不是赋值语句,则用加减法计算表达式的值
      return this.parseAddOrSub();
     }
     
     /** 计算加减法表达式 */
     private double parseAddOrSub() throws Exception {
      char op; //运算符
      double result; //结果
      double partialResult; //子表达式的结果
      
      result = this.pareseMulOrDiv(); //用乘除法计算当前表达式的值
      //如果当前标记的第一个字母是加减号,则继续进行加减运算
      while ((op = this.token.charAt(0)) == ''+'' || op == ''-'') {
       this.getToken(); //取下一个标记
       //用乘除法计算当前子表达式的值
       partialResult = this.pareseMulOrDiv();
       switch(op) {
       case ''-'':
        //如果是减法,则用已处理的子表达式的值减去当前子表达式的值
        result = result - partialResult;
        break;
       case ''+'':
        //如果是加法,用已处理的子表达式的值加上当前子表达式的值
        result = result + partialResult;
        break;
       }
      }
      return result;
     }
     /**
      * 计算乘除法表达式,包括取模运算
      */
     private double pareseMulOrDiv() throws Exception {
      char op; //运算符
      double result; //结果
      double partialResult; //子表达式结果
      //用指数运算计算当前子表达式的值
      result = this.parseExponent();
      //如果当前标记的第一个字母是乘、除或者取模运算,则继续进行乘除法运算
      while ((op = this.token.charAt(0)) == ''*'' || op == ''/'' || op == ''%'') {
       this.getToken(); //取下一标记
       //用指数运算计算当前子表达式的值
       partialResult = this.parseExponent();
       switch (op) {
       case ''*'':
        //如果是乘法,则用已处理子表达式的值乘以当前子表达式的值
        result = result * partialResult;
        break;
       case ''/'':
        //如果是除法,判断当前字表达式的值是否为0,如果为0,则抛出被0除异常
        if(partialResult == 0.0) {
         this.handleError(DIVBYZERO_ERROR);
        }
        //除数不为0,则进行除法运算
        result = result / partialResult;
        break;
       case ''%'':
        //如果是取模运算,也要判断当前子表达式的值是否为0
        if(partialResult == 0.0) {
         this.handleError(DIVBYZERO_ERROR);
        }
        result = result % partialResult;
        break;
       }
      }
      return result;
     }
     
     /**
      * 计算指数表达式
      */
     private double parseExponent() throws Exception {
      double result; //结果
      double partialResult; //子表达式的值
      double ex; //指数的底数
      int t; //指数的幂
      
      //用一元运算计算当前子表达式的值(底数)
      result = this.parseUnaryOperator();
      //如果当前标记为“^”,则为指数运算
      if (this.token.equals("^")) {
       //获取下一标记,即获得指数的幂
       this.getToken();
       partialResult = this.parseExponent();
       ex = result;
       if(partialResult == 0.0) {
        //如果指数的幂为0,则指数的值为1
        result = 1.0;
       } else {
        //否则,指数的值为个数为指数幂的底数相乘的结果
        for (t = (int) partialResult - 1; t > 0; t--) {
         result =result * ex;
        }
       }
      }
      return result;
     }
     
     /**
      * 计算一元运算,+,-,表示正数和负数 
      */
     private double parseUnaryOperator() throws Exception{
      double result; //结果
      String op; //运算符
      op = "";
      //如果当前标记类型为分隔符,而且分隔符的值等于+或者-
      if((this.tokenType == DELIMITER_TOKEN) && this.token.equals("+") || this.token.equals("-")) {
       op = this.token;
       this.getToken();
      }
      //用括号运算计算当前子表达式的值
      result = this.parseBracket();
      if(op.equals("-")) {
       //如果运算符为-,则表示负数,将子表达式的值变为负数
       result = -result;
      }
      return result;
     }
     
     /**
      * 计算括号运算
      */
     private double parseBracket() throws Exception {
      double result; //结果
      //如果当前标记为左括号,则表示是一个括号运算
      if (this.token.equals("(")) {
       this.getToken(); //取下一标记
       result = this.parseAddOrSub(); //用加减法运算计算子表达式的值
       //如果当前标记不等于右括号,抛出括号不匹配异常
       if (!this.token.equals(")")) {
        this.handleError(UNBALPARENS_ERROR);
       }
       this.getToken(); //否则取下一个标记
      } else {
       //如果不是左括号,表示不是一个括号运算,则用原子元素运算计算子表达式值
       result = this.parseAtomElement();
      }
      return result;
     }
     
     /**
      * 计算原子元素运算,包括变量和数字 
      */
     private double parseAtomElement() throws Exception {
      double result = 0.0; //结果
      
      switch(this.tokenType) {
      case NUMBER_TOKEN:
       //如果当前标记类型为数字
       try {
        //将数字的字符串转换成数字值
        result = Double.parseDouble(this.token);
       } catch (NumberFormatException exc) {
        this.handleError(SYNTAX_ERROR);
       }
       this.getToken(); //取下一个标记
       break;
      case VARIABLE_TOKEN:
       //如果当前标记类型是变量,则取变量的值
       result = this.findVar(token);
       this.getToken();
       break;
      default:
       this.handleError(SYNTAX_ERROR);
       break;
      }
      return result;
     }
     
     /**
      * 根据变量名获取变量的值,如果变量名长度大于1,则只取变量的第一个字符 
      */
     private double findVar(String vname) throws Exception {
      if (!Character.isLetter(vname.charAt(0))) {
       this.handleError(SYNTAX_ERROR);
       return 0.0;
      }
      //从实例变量数组vars中取出该变量的值
      return vars[Character.toUpperCase(vname.charAt(0)) - ''A''];
     }
     
     /** 
      * 回滚,将解析器当前指针往前移到当前标记位置
      */
     private void putBack() {
      if (this.token == EOE) {
       return;
      }
      //解析器当前指针往前移动
      for (int i = 0; i < this.token.length(); i++ ){
       this.expIndex--;
      }
     }
     
     /**
      * 处理异常情况
      */
     private void handleError(int errorType) throws Exception {
      //遇到异常情况时,根据错误类型,取得异常提示信息,将提示信息封装在异常中抛出
      throw new Exception(ERROR_MESSAGES[errorType]);
     }
     
     /**
      * 获取下一个标记
      */
     private void getToken() {
      //设置初始值
      this.token = "";
      this.tokenType = NONE_TOKEN;
      
      //检查表达式是否结束,如果解析器当前指针已经到达了字符串长度,
      //则表明表达式已经结束,置当前标记的值为EOE
      if(this.expIndex == this.exp.length()) {
       this.token = EOE;
       return;
      }
      
      //跳过表达式中的空白符
      while (this.expIndex < this.exp.length() 
        && Character.isWhitespace(this.exp.charAt(this.expIndex))) {
       ++this.expIndex;
      }
      
      //再次检查表达式是否结束
      if (this.expIndex == this.exp.length()) {
       this.token = EOE;
       return;
      }
      
      //取得解析器当前指针指向的字符
      char currentChar = this.exp.charAt(this.expIndex);
      //如果当前字符是一个分隔符,则认为这是一个分隔符标记
      //给当前标记和标记类型赋值,并将指针后移
      if(isDelim(currentChar)) {
       this.token += currentChar;
       this.expIndex++;
       this.tokenType = DELIMITER_TOKEN;
      } else if (Character.isLetter(currentChar)) {
       //如果当前字符是一个字母,则认为是一个变量标记
       //将解析器指针往后移,知道遇到一个分隔符,之间的字符都是变量的组成部分
       while(!isDelim(currentChar)) {
        this.token += currentChar;
        this.expIndex++;
        if(this.expIndex >= this.exp.length()) {
         break;
        } else {
         currentChar = this.exp.charAt(this.expIndex);
        }
       }
       this.tokenType = VARIABLE_TOKEN; //设置标记类型为变量
      } else if (Character.isDigit(currentChar)) {
       //如果当前字符是一个数字,则认为当前标记的类型为数字
       //将解析器指针后移,知道遇到一个分隔符,之间的字符都是该数字的组成部分
       while(!isDelim(currentChar)) {
        this.token += currentChar;
        this.expIndex++;
        if (this.expIndex >= this.exp.length()) {
         break;
        } else {
         currentChar = this.exp.charAt(this.expIndex);
        }
       }
       this.tokenType = NUMBER_TOKEN; //设置标记类型为数字
      } else {
       //无法识别的字符,则认为表达式结束
       this.token = EOE;
       return;
      }
     }
     
     /**
      * 判断一个字符是否为分隔符
      * 表达式中的字符包括:
      * 加“+”、减“-”、乘“*”、除“/”、取模“%”、指数“^”、赋值“=”、左括号“(”、右括号“)”
      */
     private boolean isDelim(char c) {
      if (("+-*/%^=()".indexOf(c) != -1))
       return true;
      return false;
     }
     /**
      * @param args
      */
     public static void main(String[] args) throws Exception{
      ExpressionParser test = new ExpressionParser();
      
      String exp1 = "a = 5.0";
      System.out.println("exp1(/"a = 5.0/") = " + test.evaluate(exp1));
      
      String exp2 = "b = 3.0";
      System.out.println("exp2(/"b = 3.0/") = " + test.evaluate(exp2));
      
      String exp3 = "(a + b) * (a - b)";
      System.out.println("exp3(/"(a + b) * (a - b)/") = " + test.evaluate(exp3));
      
      String exp4 = "3*5-4/2";
      System.out.println("exp4(/"3*5-4/2/") = " + test.evaluate(exp4));
      
      String exp5 = "(4-2) * ((a + b) / (a - b))";
      System.out.println("exp5(/"(4 - 2) * ((a + b) / (a - b))/") = " + test.evaluate(exp5));
      
      String exp6 = "5 % 2";
      System.out.println("exp6(/"5 % 2/") = " + test.evaluate(exp6));
      
      String exp7 = "3^2 * 5 + 4";
      System.out.println("exp7(/"3^2 * 5 + 4/") = " + test.evaluate(exp7));
     }
    }
     

    输出结果:

    exp1("a = 5.0") = 5.0
    exp2("b = 3.0") = 3.0
    exp3("(a + b) * (a - b)") = 16.0
    exp4("3*5-4/2") = 13.0
    exp5("(4 - 2) * ((a + b) / (a - b))") = 8.0
    exp6("5 % 2") = 1.0
    exp7("3^2 * 5 + 4") = 49.0

    五、实例分析
        表达式的解析,实际就是一个表达式的分解过程。根据分隔符将表达式分成若干段。然后计算每一段的值,最后都会归结到一个原子表达式。


    文章出处:http://www.diybl.com/course/3_program/java/javaxl/20071126/87573.html

  • 相关阅读:
    中文短文本分类
    词袋和词向量模型
    【NLP-2017-SA】翻译-Recurrent Attention Network on Memory for Aspect Sentiment Analysis(2017emnlp)
    过拟合和欠拟合问题总结
    【Docker-6】-Docker删除运行过的镜像
    【Docker-5】-Docker运行自己的镜像
    【Docker-3】-Docker入门命令解读
    【Docker-4】-Docker启动nginx
    【Docker-2】windows下安装docker
    【Docker-1】docker简介
  • 原文地址:https://www.cnblogs.com/csguo/p/7614902.html
Copyright © 2020-2023  润新知