• 《Dive Into Deep Learning》学习笔记


    已搬迁至:https://umcw0q7m4r.larksuite.com/docs/docusbFbDVJeYUfbwtTGkcABagg

    深度模型:一个网络多个层

    (和其他学习有啥区别,再看)

    一、序言

    1.结构

     2.小结:

    • 深度学习已经彻底改变了模式识别,引入了一系列技术,包括计算机视觉、自然语言处理、自动语音识别。

    • 要成功地应用深度学习,你必须知道如何抛出一个问题、建模的数学方法、将模型与数据拟合的算法,以及实现所有这些的工程技术。

    二、预备知识

    1.安装与环境配置

    按照书上的步骤来即可。

    安装Miniconda

    安装Jupyter Notebook

    安装MXNet的GPU版本

    一切顺利

    (只是还没搞懂这些东西有啥用)

    2.数据操作

    (1)定义与基本操作:

    基本变量是NDArray

    x=nd.arange(12)

    x.shape     ->(12,)

    x.size         -> 12

    x.reshape((3,4))

    nd.zeros((2,3,4))

    (2)运算:

    注意,直接写的都是按元素

    特殊的
    X.exp()     //按元素指数运算

    nd.dot(X,Y.T)      //矩阵乘法

    条件判别式得到的也是矩阵。X>Y X<Y X==Y

    *(3)广播机制

    自动增加行或者列,使得运算可以进行

    (4)索引

    0开始编号,左闭右开

    X[1:3]

    X[1,2]

    X[1:2,:]=12

    (5)关于运算内存开销

    用id查指向的内存

    避免临时内存开销:

    Z=Y.zeros_like()

    nd.elemwise_add(X,Y,out=Z)

    (6)NDArray和NumPy相互转换

    3.自动求梯度

    梯度定义同高等数学

    求梯度一般是标量对向量求梯度,得到的也是向量,该向量某个位置的值,为标量对其求偏导后带入原值的结果

    对于带while,if的语句也可以求梯度,本质上就是多了几条语句而已。

    三、线性回归

    是关于预测的模型

    1.引出了深度学习的基本要素:

    模型

    训练数据

    损失函数

    为了保证十个非负数,这里采用平方

     

     要找的是:

     

    优化算法

    首先,这个问题可以找到解析解。类似最小二乘法求偏导然后等于0即可

    小批量随机梯度下降:

     具体地,就是:

     迭代一些次数即可。

    大致思路就是往低处走。

    比模拟退火看起来靠谱一些。

  • 相关阅读:
    (转)MP4文件两种格式AVC1和H264的区别及利用FFMPEG demux为h264码流事项
    (转)【多媒体封装格式详解】--- AAC ADTS格式分析
    (转)使用FFMPEG类库分离出多媒体文件中的H.264码流
    (转)ffmpeg 从mp4上提取H264的nalu
    (原)hisi3531立体声pcm实现播放方式
    (转)关于yuv 格式:planar和semi-planar格式
    (转)LCD:LCD常用接口原理篇
    Instrumentation 两种方法 premain Agent
    解决-Dmaven.multiModuleProjectDirectory system property is not set. Check $M2_HOME environment variabl
    Java反射机制获取Class文件
  • 原文地址:https://www.cnblogs.com/Miracevin/p/15830595.html
Copyright © 2020-2023  润新知