为什么要使用左角表?
一般的自顶向下的分析法中存在回溯现象,这种严重的限制了分析法,构造了推导树,但是有的时候会出现搜索空的情况,使分析效率很低。为了提高自顶向下的分析效率,减少盲目性,可以给CFG文法建立一个左角表(left-corner table)。
左角表中存有什么?
例如这个文法:
G = {Vn , Vt , S , P} Vn = {S , NP , VP , Aux , Wh2NP , Pron , PrN , predet , Det , Card , Ord , Quant , AP , Nom. N. V , Adj , Adv , Wh2Pron ,PP , GdVP , GdV , RelCL , who , that , and} Vt = {the , a , that , table , leg , Jack , lacks , hits ,…} S = S P : :1. S`NP VP ;2. S`VP ;3. S`Aux NP VP ;4. S`Wh2NP VP ;5. NP`Pron ;6. NP`PrN ;7. NP` (Det) (Card) (Ord) (Quant) (AP) Nominal ;8. NP`Nom N ;9. Wh2NP`Wh2Pron ;10. Nom`N Nom ; 11. Nom`N ;12. Nom`N PP(PP) (PP) ; 13. Nom`Nom GdVP ; 14. GdVP` GdV NP (GdVP表示 Gerund verb phrase , GdV表示Gerund verb) ;15. GdVP` GdV PP ;16. GdVP` GdV ;17. GdVP` GdV NP PP ;18. Nom`Nom RelCl(RelCL表示关系从句) ;19. RelCl `who VP(这个who是关系代词) ; 20. RelCl`that VP(这个that 是关系代词) ;21. AP `Adv Adj ;22. AP`Adj ;23. VP`V ;24. VP`V NP ;25. VP`V NP PP ;26. VP`V PP ;27. VP`V S ;28. VP`V that S(这个that 是关系代词) ;29.PP`Prep NP ; 30. NP`NP and NP ; 31. VP`VP and VP ; 32. S`S and S ; 33. Pron`{ I , you , he , …} ;34. N`{table , leg , …} ; 35. V`{lacks , hits , …} ; 36. PrN`{Jack , John , …} ; 37. P`{on , of , at , …} ;38. Aux`{does , has , …} ;39. Ord`{first , second , …} ;40. Det`{the , a , that , …} ; 41. Card`{one , two , …}
他的左角可以为如图所示:
传统自上而下分析法和左脚分析法的对比
1. S`NP VP
2. S`VP
3. S`Aux NP VP
4. S`Wh2NP VP
就拿分析S来说,例如我们要匹配的第1个词是the
使用传统的自上而下的方法分析:
我们需要搜索S`VP , S`Aux NP VP , S`Wh2NP VP来搜索,这个过程当中,要做很多的空搜索。
如果使用左角分析法:
很快就可以通过查表得到the的对应的Det。这样大大的节省了时间。
下面这个例子展示了,是如何匹配“The table that lacks a leg hits Jack”这个句子的:
从分析的过程中看,虽然使用了左角分析法,避免了大量的空搜索。但是,在分析过程中,仍然出现了7词回溯。
有的科学家已经提出了其他改良的更高效的算法,在这里不做讨论。
参考文献:一种无回溯的自然语言分析算法 冯志伟 (教育部语言文字应用研究所 北京 100010)