语法分析器的知识框图
懒得详细总结了。简单说下LR以及LL算法。
LR与LL代表两种对语法的分析方法,第一个字母代表程序的读入顺序,即从左向右读,第二个代表规则的推导,LR代表从右向左推导,LL代表从左向右推导。后边如果有数字的话,代表前看符号。LR算法相比较LL则可以分析更多的文法,也不需要进行一些改写。
LL算法是种主要是通过获取分析表实现对语法的判定。其中最主要是为了求得FIRST_S集(字符串的FIRST集)。其它一些集合的计算都是为了得到FIRST_S集合,利用FIRST_S集合可以很方便的构建分析表。然后利用一个栈加上分析表可以实现自顶向下分析。
LR算法主要需要解决的一个问题是移进(shift)与规约(reduce)冲突。最简单的是LR0算法很容易产生移进与规约冲突,所以有了改进的SLR(Small LR)算法,这个算法主要利用规约后的FOLLOW集是否包含接下来的字符从而判定是否该规约。这里由于对于某个非结束字符FOLLOW集合过大,所有又有了LR1的改进,利用一个前看符号,对不同状态的向前看一个字母。从而确定是否应该规约,这里需要注意这里的一个前看字符一般要比FOLLOW集要小,所以可以更好的减少移进与规约冲突的发生。而LALR(Look Ahead LR)算法则相当于LR1与SLR算法的一种折中算法。将一些状态的前看符号进行结合,从而减少移进与规约表的规模。对于移进与规约冲突的解决优化一般是按照以下排列:
LR1>LALR>SLR>LR0
当然,产生的移进与规约表的复杂度正好是相反的。