1.训练太慢
用nimibatch代替fullbatch
https://www.cnblogs.com/guoyaohua/p/8724433.html
2.过拟合
最直接的解决过拟合问题的办法是增加训练数据量
使用dropout层
3.损失率波动不下降,欠拟合(梯度消失)
Batch Normalization
4.训练开始时后出现损失函数值为nan(梯度爆炸)
学习率太大
1.训练太慢
用nimibatch代替fullbatch
https://www.cnblogs.com/guoyaohua/p/8724433.html
2.过拟合
最直接的解决过拟合问题的办法是增加训练数据量
使用dropout层
3.损失率波动不下降,欠拟合(梯度消失)
Batch Normalization
4.训练开始时后出现损失函数值为nan(梯度爆炸)
学习率太大