Spacy 使用

# 前提是必须安装： python -m spacy download en
nlp = spacy.load('en')
text = u"you are best. it is lemmatize test for spacy. I love these books. amines (when protonated)"
doc = nlp(text)
# 观察分词
token = [t for t in doc]
# 分词我们就用这个orth_  可以识别标点符号
token2 = [token.orth_ for token in doc]
# 观察词干化
lemma = [l.lemma_ for l in doc]
# 词性标注
pos = [p.pos_ for p in doc]

相关阅读:
hdu 3265 Posters（线段树+扫描线+面积并）
hdu 3974 Assign the task（线段树）
hdu 1540 Tunnel Warfare（线段树）
poj 2777 Count Color（线段树（有点意思））
用Flask+Redis维护Cookies池
 用代理抓取微信文章
 Idea-常用快捷键列表
 用Flask+Redis维护代理池
 Selsnium-Chrome-PhantomJS-爬取淘宝美食
 分析Ajax请求抓取今日头条街拍图片
原文地址：https://www.cnblogs.com/demo-deng/p/10115976.html

最新文章
wave
DynamicSegmentTree
洛谷P3957 跳房子
 洛谷P2672 推销员
 eclipise快捷键，留给以后备用
 刚刚明白了for循环写三角形
 输出0到100之间的偶数，还有比这个更简单的代码吗？
关于三元运算符，输出从0-9但是中间忽略5
while循环出现的问题
 奇偶数判断2（if else+switch语句）

热门文章
奇偶数判断1（if，else if语句）
java &&与||短路的详解
 byte，short，int，long数据之间的倍数关系
 我的第一个关于数据类型的程序
 hdu 4614 Vases and Flowers（线段树）
poj 1177 Picture（线段树周长并）
hdu1255 覆盖的面积（线段树面积交）
Codeforces Round #383 (Div. 2)D. Arpa's weak amphitheater and Mehrdad's valuable Hoses（dp背包+并查集）
Codeforces Round #383 (Div. 2) C. Arpa's loud Owf and Mehrdad's evil plan（dfs+数学思想）
Codeforces Round #383 (Div. 2) B. Arpa’s obvious problem and Mehrdad’s terrible solution