有些任务可以通过MLP多层感知器的神经网络,CNN卷积神经网络解决,因为那些任务内部的每一个前后无关联,无顺序,如MNIST手写数字子集,CIFAR子集等。
但是在自然语言处理中,每个字的前后有语义联系,或者在视频图像处理,或者在气象观测数据,股票交易数据方面,有前后的关联性,那么使用RNN网络,或者LSTM模型。
RNN模型的原理:
神经元的输出接入输入,使网络具有记忆功能。Xt输入,Ht输出,三条箭头的参数U,V,W是神经网络的参数,A是隐藏状态,代表记忆功能。
在时间上将该模型展开后如下:
输出为之前的各个参数相互的处理结果。