环境:Ubuntu 16.04+anaconda3
一、pyltp
1. 安装
直接用pip安装:
pip install pyltp
然后下载语言模型库,网址:https://pan.baidu.com/share/link?shareid=1988562907&uk=2738088569#list/path=%2F
这里我下载的是最新的3.4.0的版本,路径随意。
2. 使用
import pyltp
安装成功之后,尝试import发现报错:undefined symbol: _ZTISt19__codecvt_utf8_baseIwE
然后各种百度,无果,最后还是在谷歌第一条就搜到了解决方法,附上链接:https://github.com/HIT-SCIR/pyltp/issues/58
解决方法:
cd ~/anaconda2/lib rm libstdc++.so.6.0.19 ln -s /usr/lib/x86_64-linux-gnu/libstdc++.so.6 libstdc++.so.6.0.19
然后再尝试import,成功!
二、StanfordCoreNLP
按照以下逐步安装:
1. jdk-8u181-linux-x64.tar.gz(Java环境):参考https://blog.csdn.net/yan3013216087/article/details/78307258
2. stanford-corenlp-full-2018-02-27.zip(Stanford NLP程序包):链接:https://stanfordnlp.github.io/CoreNLP/,点击下方的download corenlp 3.9.1
3. stanford-chinese-corenlp-2018-02-27-models.jar(Stanford中文语言模型):跟上步一样的链接,然后点击下方的Chinese下载:
4. stanford-corenlp-master.zip(用Python实现的API接口,非常方便!):链接https://github.com/Lynten/stanford-corenlp,按照说明里的安装与使用就可以,是查到的最方便的了!也可以直接调用Chinese里的模型。