day10

梯度下降算法

在这里w和b都是实数（在实践中w可以是更高的维度），我们要做的其实就是使得成本函数达到极小值，求得对应的w和b。

注：前面我们设计成本函数 J(w,b) 时，特意的使得它是一个凸函数,为的就是唯一的极值而不是多个局部最优解

虽然多个局部最优解可以通过随机初始化的方法解决，但在逻辑回归中我们还是选择凸函数。

我们前面的三个步骤中

同理对于二维的，也就是两个参数的 J(w,b) ，导数就变成了偏导

一个机器学习任务的核心是模型的定义以及模型的参数求解方式，对这两者进行抽象之后，可以确定一个唯一的计算逻辑，将这个逻辑用图表示，称之为计算图。计算图表现为有向无环图，定义了数据的流转方式，数据的计算方式，以及各种计算之间的相互依赖关系等。

可以说，一个神经网络的计算，都是按照前向或反向传播过程组织的。首先我们计算出一个新的网络的输出 (前向过程)，紧接着进行一个反向传播操作。后者我们用来计算出对应的梯度或导数，也就是链式求导。

在这里插入图片描述

蓝线：前向传播；红线：反向传播。计算图对于我们后面求dw时有帮助。

回顾之前的一些公式，并做简单说明。

注：1*n的矩阵和n*1的矩阵相乘得到的就是一个数，1*1的矩阵可以当成常数

然后就可以反向传播，利用链式求导求得想要的导数。

相关阅读:
今日总结
今日总结
每日总结
每日总结
小程序之navigator跳转方式
vue面试题（上）
ES6 中的 set 用法
维信小程序如何实现下拉刷新？
微信小程序的相关文件类型有哪些？？
vue中v-if与v-show的区别以及使用场景

原文地址：https://www.cnblogs.com/chenaiiu/p/14287823.html