stanford自然语言处理开源了很多工具,很实用也很方便,记录下来,以备后用。
第一篇就从句法分析开始吧(所用的平台都是java+eclipse)。
《一》操作
1.http://www-nlp.stanford.edu/software/lex-parser.shtml先从这边下载(想把附件贴上来,但是不知道是不支持还是我摸索不出来,只得作罢!)
各种版本的变化(主页上贴来):
下完解压后的文件:
2.新建java project(stanfordparser)
3.在java项目中的根目录新建package文件夹,用来存放工程额外附加的jar包(stanford-parser.jar、stanford-parser-3.3.1-models.jar、stanford-parser-3.3.1-javadoc.jar)。
将stanford-parser-3.3.1-sources.jar解压,会有两个文件夹,将这两个文件夹edu、META-INF和ParserDemo.java一起放入src文件夹。
然后就可以运行示例程序了。不同语言的句法分析可通过修改程序中的模型参数来操作。
《二》相关知识
这个项目是以纯文本作为输入,输出支持多种格式,包括:词性标注、短语结构句法分析和依存句法分析。
默认情况下不输出词性标注的结果:
输出:
修改后的语句是:
输出:
树结构: