文本分类读书笔记

模型发展

　　模型简单简单、快速，直接把句子对应的词向量相加求和平均作为input，用基于霍夫曼树的分层softmaxt。可以作为一个baseline版本模型

CNN通过多个不同filter 、size的卷积核做特征检测，得到多个特征映射feature map，然后再通过pooling对检测的特征进行筛选，过滤噪音，提取关键信息，用于文本的分类。

　　CNN的本质是通过卷积运算和池化操作提取关键信息，比较擅长捕获原始语料的局部特征。

　　RNN：Recurrent,模型对每个元素执行相同的操作，当前时刻的计算依赖上一个时刻的计算结果。网络具有”记忆“功能

　　　　　RNN因为是个序列模型，因此更加擅长时序信息和长距离的依赖。RNN比较符合人类语音的特性，理解文章每一个词都是基于前面已经看过读过的词。

　　模型举例

　　CNN和RNN二者各有千秋，主要看应用场景。

相关阅读:
SQL SERVER 分布式事务(DTC)
.NET 笔试题--自已作答
设计模式-观察者模式
设计模式-迭代器模式
设计模式-责任链模式
C#中引用类型和值类型
另一个 OleDbParameterCollection 中已包含 OleDbParameter 错误分析及解决办法
R语言笔记-set.seed()函数
R中的sample函数
R语言包相关命令

原文地址：https://www.cnblogs.com/GuoJiaSheng/p/11206293.html