降低损失：学习速率 - 润新知

降低损失：学习速率

Reference: https://developers.google.com/machine-learning/crash-course/reducing-loss/learning-rate

Learning Rate

正如之前所述，梯度矢量具有方向和大小。梯度下降法算法用梯度乘以一个称为学习速率（有时也称为步长）的标量，以确定下一个点的位置。例如，如果梯度大小为 2.5，学习速率为 0.01，则梯度下降法算法会选择距离前一个点 0.025 的位置作为下一个点。

超参数是编程人员在机器学习算法中用于调整的旋钮。大多数机器学习编程人员会花费相当多的时间来调整学习速率。如果你选择的学习速率过小，就会花费太长的学习时间：

学习速率过小

相反，如果你指定的学习速率过大，下一个点将永远在 U 形曲线的底部随意弹跳，就好像量子力学实验出现了严重错误一样：

学习速率过大

每个回归问题都存在一个Goldilocks学习速率。Goldilocks值与损失函数的平坦程度相关。如果你知道损失函数的梯度较小，则可以放心地试着采用更大的学习速率，以补偿较小的梯度并获得更大的步长。

学习速率恰恰好
相关阅读:
C#获取配置文件中的文件数据
 wpf MVVMLight的DataGrid绑定数据
 扫码支付自动跳转，可以使用第三方网站实现扫码二维码付款然后跳转到想要的页面展示想要内容或者是解压码或者是某个资源的下载页呢具体步骤（我以你上传一个压缩包到某种网盘或者可以下载的地址等让人付费解压为例）：
oracle数据库如何创建用户以及分配权限
 ORA-12547: TNS: 丢失连接
 springmvc中applicationapplicationContext头部代码
 No mapping found for HTTP request with URI
在Navicat新建用户
 myeclipse 项目引入 com.sun.image.codec.jpeg 的api报错解决方法
 java.lang.NullPointerException at org.apache.jsp.**_jsp.jspInit(**_jsp.java)tomcat启动异常解决方法
原文地址：https://www.cnblogs.com/agilestyle/p/12620057.html

Copyright © 2020-2023 润新知