梯度消失和解决方案 - 润新知

梯度消失和解决方案

引自：http://www.mamicode.com/info-detail-2716063.html

累乘中一个梯度小于1，那么不断累乘，这个值会越来越小，梯度衰减很大，迅速接近0。在神经网络中是离输出层近的参数，梯度越大，远的参数，梯度越接近0。根本原因是sigmoid函数的缺陷。

方法：

1、好的初始化方法，逐层预训练，后向传播微调。

2、换激活函数，用relu，leaky——relu。靠的是使梯度靠近1或等于1，避免了在累乘过程中，结果迅速衰减。
相关阅读:
BSGS
聪聪可可（未完成）
强连通分量，缩点
 bozj 1823（未完成）
网络流
 bzoj1026
点分治 poj1741
bzoj 3270 博物馆
 高斯消元模板
 bzoj 3143 [Hnoi2013]游走
原文地址：https://www.cnblogs.com/lyp1010/p/13333759.html

Copyright © 2020-2023 润新知