深度学习

深度学习

传统方法的局限性：

一：数据稀疏性:

语言是离散的符号系统，每个字符，单词都是离散型随机变量。而机器学习模型只接受向量。所以为了将文本转换成向量，通常要将离散符号按照其索引编码为One-hot向量。

然而近义词之间并不能通过这种方式编码成相似的向量。

将任意词语表示为固定长度为n的稠密向量，并且稠密向量的维度远小于词表体积，可以好好地解决相似性问题，并且由于向量的长度变短，能显著降低模型参数的数量。

这种思路被称为“词向量”。

二：人工特征工程的不足：

高级NLP任务需要有复杂的特征。然而传统的自然语言处理使用的是手工制定的特征模板。比如中文分词：使用的是上一个字符和当前字符的组合。命名实体识别：前后两个单词与当前单词经常组合。这样的特征模板会带来数据稀疏的困扰。即便有前人对特征工程的研究工作。他们使得某些数据集有相应的特征模板，但不适合所有领域。

三：误差传播问题：

流水线式的作业方式存在严重的误差传播问题，前一个模块产生的错误被输入到下一个模块中会产生更大的错误。

深度学习入门：

可以自动学习事物的向量表示(vectorial representation)的模型。在深度学习中，相对于传统机器学习，特征末班被多层感知机替代。

多层感知机通过权重矩阵对样本的上一个特征进行线性变换，通过非线性函数对特征强度进行激活。通常将输出层的特征输入到softmax函数得到一个后验概率分布。

然后将该分布与经验分布的交叉熵作为损失函数。由于该损失函数为非凸函数，一般采用梯度下降法进行优化。

（更多详见Pattern recognition and machine learning）

后验概率分布与先验概率分布：https://blog.csdn.net/qq_40597317/article/details/82388164
相关阅读:
对象形式传递
 解决DLNA方案的技术框架
 关于DLNA
MAC配置Xcode的Cocos2d-x环境
 什么叫做双缓冲？
Window7 Cocos2d-x配置开发环境
 Windows 8.1 Update 2更新了什么？
微软发布Windows Phone 8.1 Update 和中文版Cortana“小娜”
大开眼界游览Facebook香港办公室
 小米的“假照片”危机
原文地址：https://www.cnblogs.com/liuguangshou123/p/13766031.html

传统方法的局限性：

深度学习入门：