权值衰减（weight decay）

权值衰减（weight decay）

神经网络经常加入weight decay来防止过拟合，optimizer使用SGD时我们所说的weight decay通常指L2 weight decay，即，加在loss中的L2正则项。

L2正则项在Michael Nielsen的Neural Networks and Deep Learning的第三章第2节有比较详细的介绍，下面就直接从书里截图过来：
相关阅读:
SQL 测试
 atoi的实现
 python基础3 ---python数据类型二
 python基础2 ---python数据类型一
 python基础1 ---python简介
 shell编程3 ---流程控制语句
 shell编程2 ---条件判断语句
 oldboyshell编程扩展内容
 nfs服务器
 shell编程1
原文地址：https://www.cnblogs.com/picassooo/p/16257990.html