1.一篇关于LDA原理的文章
http://blog.csdn.net/v_july_v/article/details/41209515?utm_source=tuicool&utm_medium=referral
2.一堆工具包
http://mengjunxie.github.io/ae-lda/topic-modeling.html
3.其中c++工具包 http://gibbslda.sourceforge.net/
需要在linux系统上运行
GibbsLDA ++,
4.其中python的使用教程
gensim http://radimrehurek.com/gensim/index.html
中文版使用教程 http://blog.csdn.net/a1368783069/article/details/52088302
目前,暂时选择使用gensim
使用gensim
1.下载gensim,安装,https://pypi.python.org/pypi/gensim,选择的是gensim-1.0.1.win32-py2.7.exe (md5)版本
2.import gensim出现错误 No module named smart_open
解决办法:安装smart_open,https://pypi.python.org/pypi/smart_open,
使用命令 pip install smart_open-1.5.1.tar.gz
3.出现warning,855
UserWarning: detected Windows; aliasing chunkize to chunkize_serial
warnings.warn("detected Windows; aliasing chunkize to chunkize_serial")
解决办法:
在导入gensim 之前,可以使用此代码抑制消息:
import warnings
warnings.filterwarnings(action='ignore', category=UserWarning, module='gensim')
import gensim