keras中TimeDistributed

TimeDistributed这个层还是比较难理解的。事实上通过这个层我们可以实现从二维像三维的过渡，甚至通过这个层的包装，我们可以实现图像分类视频分类的转化。

考虑一批32个样本，其中每个样本是一个由16个维度组成的10个向量的序列。该层的批输入形状然后(32, 10, 16)。

可以这么理解，输入数据是一个特征方程，X1+X2+...+X10=Y，从矩阵的角度看，拿出未知数，就是10个向量，每个向量有16个维度，这16个维度是评价Y的16个特征方向。

TimeDistributed层的作用就是把Dense层应用到这10个具体的向量上，对每一个向量进行了一个Dense操作，假设是下面这段代码：

model = Sequential()model.add(TimeDistributed(Dense(8), input_shape=(10, 16)))

输出还是10个向量，但是输出的维度由16变成了8，也就是（32,10,8）。

事实上，TimeDistributed层给予了模型一种一对多，多对多的能力，增加了模型的维度。

TimeDistributed层在每个时间步上均操作了Dense，由上面几个图明显可以看出了增加了模型实现一对多和多对多的能力。如果你使用正常的Dense层，你最后只会得到一个结果。

相关阅读:
Nginx出现413 Request Entity Too Large错误解决方法
Apache设置二级域名和虚拟主机
LNMP搭建03 -- 编译安装PHP
LNMP搭建04 -- 配置Nginx支持PHP
LNMP搭建01 -- 编译安装MySQL 5.6.14 和 LNMP相关的区别
LNMP搭建02 -- 编译安装Nginx
vagrant使用小结
LeetCode Count and Say
基于ArcGIS Flex API实现动态标绘（1.0）
HDU 2027 汉字统计

原文地址：https://www.cnblogs.com/zle1992/p/9083645.html