01. 深度学习基本概念

01. 深度学习基本概念

一、神经网络
二、激活函数
三、评价神经网络的效果
四、梯度下降算法
五、参数与超参数区别
六、习题

一、神经网络 neural network

w11a1+w12a2+w13a3 + bias1=b1
w21a1+w22a2+w23a3 + bias2=b2

从网络层1到网络层2，可能是线性运算，可能是非线性运算。

二、激活函数
经典激活函数：Sigmoid函数

激活函数引入非线性，使得原本不可分变为可分，且可以被作为概率看待。

三、评价神经网络的效果
（1）使用随机值初始化神经网络参数随机设定权重w和偏移量bias
（2）损失函数评价神经网络效果的函数
损失函数

四、梯度下降算法
一次求导，朝着梯度最大的方向前进。 https://www.cnblogs.com/pinard/p/5970503.html

五、参数与超参数区别
超参数 α = 学习速率 learning rate。【调参点】

六、习题
1、“手工编程计算圆的面积”中，3.14是“参数”还是“超参数”？参数
2、一个如本次实验所描述的神经网络有两层，第一层有10个神经元，第二层有20个神经元，请问这两层神经元之间有多少条连接？第一层到第二层之间由这些连接所表示的线性变换矩阵尺寸是多少？ 200个
3、“使用深度学习预测股票走势曲线”是分类问题还是回归问题？回归问题
4、“根据人脸图片识别人的性别”是分类问题还是回归问题？分类问题
5、如果说，有监督学习的训练数据data由输入X和正确答案Y组成，那无监督学习的训练数据应该是什么样的？输入数据集长度m，聚类得到X1，X2，Xn 个聚类
6、[选做题]sigmoid函数对x求导结果是什么？
7、[选做题]2.6.1小节中的图片里，为什么“学习速率适中”图中每次更新的“步子”越来越短，而“学习速率过大”图中每次更新的“步子”越来越长？
学习速率是比率，合适的学习速率，越接近极值，下降越慢，基数越小，步子越短。
过大的学习速率，越学越超出范围，自然增长快，步子大。

8、[选做题]你能自己想出一种求损失函数梯度的方法吗
梯度：偏导向量。对损失函数求偏导，得到梯度，梯度最大的地方就是下降最快的地方。

参考：
https://www.shiyanlou.com/courses/814
相关阅读:
keys命令的缺点
 redis与memcache的区别
 sql与nosql如何选择？
MongoDB与MySql的区别
 linux环境搭建系列之memcached安装步骤
 linux环境搭建系列之tomcat安装步骤
 linux环境搭建系列之Apache ant安装步骤
 linux环境搭建系列之jdk安装
 虚拟机安装教程（linux、centOS）
memcached解压报错gzip: stdin: not in gzip format tar: Child returned status 1 tar: Error is not recoverable: exiting now的解决方法
原文地址：https://www.cnblogs.com/Years4Nancy/p/8490061.html