Text Mining and Analytics WEEK1 - 润新知

Text Mining and Analytics WEEK1
第一周目标
- 解释自然语言处理中的一些基本概念
- 解释不同的方式来表示文本数据
- 解释的两种基本的词联想以及如何从文本数据挖掘聚合关系
尝试回答以下问题
- 为了理解一个自然语言句子，计算机必须做些什么？
- 什么是歧义？
- 为什么自然语言处理（NLP）对计算机来说很困难？
- 什么是词袋表示？
- 为什么这个基于词法的表示比从文本的句法和语义分析派生的表达更健壮？
- 什么是聚合(paradigmatic)关系？
- 什么是组合(syntagmatic)关系？
- 从文本中发现聚合关系的一般思想是什么？
- 从文本中发现合成关系的一般思路是什么？
- 在计算上下文相似性时，为什么要进行词频(TF)转换呢？
- 如何BM25词频转换工作？
- 当计算上下文相似性时，为什么要做逆文档频率（IDF）权重？
相关阅读:
求助
 debian虚拟机试用
 算是业界新闻吧
 推荐一个图书分享网站
 日志
 写汇编报告小记
 水仙花数
 进程创建
 win32程序运行原理1
[解题报告]374 Big Mod
原文地址：https://www.cnblogs.com/yuuken/p/9463250.html

Copyright © 2020-2023 润新知