Atitit nlp用到的技术与功能自然语言处理 v3 t99.docx
Atitit nlp用到的技术与常见类库
目录
-
- 语言处理基础技术 分词 相似度等
-
- 智能写作平台
- other
- 词性标注(Part-of Speech Tagging):
- 拼写更正(Spelling Correction):基于"你要找的是"风格的检查引擎
- 数据库文本挖掘(Database Text Mining)
- 字符串比较(String Comparison) :基于距离与相似度测量,包括权重距离,TF/IDF距离,Jaccard distance, Jaro-Winkler distance,等
- 语言辨别(Language Identification)
- 推荐系统
- 【NLP】十分钟快览自然语言处理学习总结 - 伏草惟存 - 博客园.mhtml
- 这个什么有详细的推荐算法
mail类库,poi类库(处理officex系列),jsoup html类库。
org.apache.tools.zip_1.9.6 处理zip库
java-unrar 处理rar文档
pdfbox-1.8.16.jar
Zip压缩文档抽取技术
Office pdf系列文档读取技术
Eml html系列温暖的读取技术
分词
LingPipe的优势是: 貌似不包含关键词提取 内容提取
FudanNLP进行新闻关键词提取
Html文档摘要提取
索引与 检索
-
- 分词,ik分词器
- 索引与检索类
Lucence imap类库mail。Jar zip库读取库
百度ai
Atitit nlp 自然语言处理的艺术 attilax著作 v2 t55.docx
Atitit nlp 自然语言处理attilax总结 dep
java 语义分析 开源 - fengbin2005 - ITeye博客.mhtml
(17条消息)利用FudanNLP进行新闻关键词提取 - qq_43685315的博客 - CSDN博客.mhtml
Atitit java的nlp自然语言处理类库v2 t99.docx