黄聪：Python+NLTK自然语言处理学习（一）：环境搭建

黄聪：Python+NLTK自然语言处理学习（一）：环境搭建
最近开始学习Python+NLTK自然语言处理，在此分享自己的学习经验，因为是初学，肯定有很多很多不懂的地方，发布此文章绝非为了显示自己的水平，而是因为网络上对NLTK的资料实在太少了，我就想分享一下自己的心得，也希望能够得到更多高手的指点，希望高手们发现不对的地方耐心指点，切勿针锋相对，这样会打击小弟的学习动力的，呵呵～

好了，开始吧。

一、到NLTK的官网下载Python2.66（虽然Python已经到3.0了，但是2.x的比较稳定，兼容2.x的软件也比较多一些）、PyYAML和NLTK。

下载地址：http://www.nltk.org/download

二、讲这些都安装好，然后运行Python的IDE环境：

三、敲入下面的代码，进入NLTK数据源下载界面：
```
import nltk
nltk.download()
```
选择all，设置好下载路径（Download Directory），然后点击Download，系统就开始下载NLTK的数据包了，下载的时间比较漫长，大家要耐心等待。如果有个别数据包无法下载，你可以切换到All Packages标签页，双击指定的包来进行下载：

如果都不行的话，你还可以直接到 http://nltk.googlecode.com/svn/trunk/nltk_data/index.xml 去下载数据包，只要将数据包复制到你的Download Directory目录下即可。

四、安装NLTK
```
form nltk.book import  *
```
键入以上代码可以得到图中的显示，就说明NLTK数据包都安装好了～

五、实践。使用NLTK进行字符串查询
```
text1.concordance('monstrous')
```
说明：

text1为NLTK数据包中的一段数据源，是一大串字符串。（原文在数据包下载目录下的gutenberg.zip中的melville-moby_dick.txt）

text1.concordance('monstrous')这句话实现的是从这一大串字符串中找寻出包含monstrous这个单词的语句。

好了，这就是NLTK的一个简单的应用，自然语言的处理中查询是一个很重要的操作，希望大家能好好了解一下本篇文章，还是那句话，我也是初学，肯定有说得不好的地方，希望大家多多指点，但千万不要恶语相对，谢谢。如果喜欢本文，请在后面留个言哈～
作者：黄聪
出处：http://www.cnblogs.com/huangcong/
本文版权归作者和博客园共有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出原文连接，否则保留追究法律责任的权利。
相关阅读:
防止SQL注入攻击的注意事项【转载】
javascript小技巧之一【获取各种尺寸】
Web.config中maxRequestLength后面数字的单位问题
 javascript小技巧之二【对象、元素、事件】
我的博客
 初学测试用例
 初识我的博客
 自动生成小学四则运算题目
 【Yii】数据库读写方法：AR模型和DAO方法
 【阅读】看懂财经新闻的第一本书
原文地址：https://www.cnblogs.com/huangcong/p/2157437.html