RMSprop:
全称为root mean square prop,提及这个算法就不得不提及上篇博文中的momentum算法
首先来看看momentum动量梯度下降法的过程:
在RMSprop中:
Compute dW,db on the current mini-batch
SdW = βSdW + (1-β)dW2
Sdb = βSdb + (1-β)db2
W = W - α(dW / sqrt.SdW+ε),b = b - α(db / sqrt.Sdb+ε)
所以也就是说RMSprop就是对动量梯度下降法中的dw和db每次除根号下的SdW和Sdb变形即可
注意:为了防止根号下的SdW和Sdb可能无限接近于0的情况,加上了一个很小的ε值即可,通常取ε=10-8