• 【神经网络】 深入浅出BP神经网络


    前面讲过,使用梯度下降的方法,要不断的修改k、b两个参数值,使最终的误差达到最小。神经网络可不只k、b两个参数,事实上,网络的每条连接线上都有一个权重参数,如何有效的修改这些参数,使误差最小化,成为一个很棘手的问题。从人工神经网络诞生的60年代,人们就一直在不断尝试各种方法来解决这个问题。直到80年代,误差反向传播算法(BP算法)的提出,才提供了真正有效的解决方案,使神经网络的研究绝处逢生。



    BP算法是一种计算偏导数的有效方法,它的基本原理是:利用前向传播最后输出的结果来计算误差的偏导数,再用这个偏导数和前面的隐藏层进行加权求和,如此一层一层的向后传下去,直到输入层(不计算输入层),最后利用每个节点求出的偏导数来更新权重。


    为了便于理解,后面我一律用“残差(error term)”这个词来表示误差的偏导数
    输出层→隐藏层:残差 = -(输出值-样本值) * 激活函数的导数
    隐藏层→隐藏层:残差 = (右层每个节点的残差加权求和)* 激活函数的导数
    如果输出层用Purelin作激活函数,Purelin的导数是1,输出层→隐藏层:残差 = -(输出值-样本值)

    如果用Sigmoid(logsig)作激活函数,那么:Sigmoid导数 = Sigmoid*(1-Sigmoid)
    输出层→隐藏层:残差 = -(Sigmoid输出值-样本值) * Sigmoid*(1-Sigmoid) = -(输出值-样本值)*输出值*(1-输出值)
    隐藏层→隐藏层:残差 = (右层每个节点的残差加权求和)* 当前节点的Sigmoid*(1-当前节点的Sigmoid)


    如果用tansig作激活函数,那么:tansig导数 = 1 - tansig^2




    残差全部计算好后,就可以更新权重了:
    输入层:权重增加 = 当前节点的Sigmoid * 右层对应节点的残差 * 学习率
    隐藏层:权重增加 = 输入值 * 右层对应节点的残差 * 学习率
    偏移值的权重增加 = 右层对应节点的残差 * 学习率
    学习率前面介绍过,学习率是一个预先设置好的参数,用于控制每次更新的幅度。

    此后,对全部数据都反复进行这样的计算,直到输出的误差达到一个很小的值为止。

    以上介绍的是目前最常见的神经网络类型,称为前馈神经网络(FeedForward Neural Network),由于它一般是要向后传递误差的,所以也叫BP神经网络(Back Propagation Neural Network)

    BP神经网络的特点和局限:
    - BP神经网络可以用作分类、聚类、预测等。需要有一定量的历史数据,通过历史数据的训练,网络可以学习到数据中隐含的知识。在你的问题中,首先要找到某些问题的一些特征,以及对应的评价数据,用这些数据来训练神经网络。
    - BP神经网络主要是在实践的基础上逐步完善起来的系统,并不完全是建立在仿生学上的。从这个角度讲,实用性 > 生理相似性。
    - BP神经网络中的某些算法,例如如何选择初始值、如何确定隐藏层的节点个数、使用何种激活函数等问题,并没有确凿的理论依据,只有一些根据实践经验总结出的有效方法或经验公式。
    - BP神经网络虽然是一种非常有效的计算方法,但它也以计算超复杂、计算速度超慢、容易陷入局部最优解等多项弱点著称,因此人们提出了大量有效的改进方案,一些新的神经网络形式也层出不穷。

    参考这个:http://www.myreaders.info/03_Back_Propagation_Network.pdf 我做了整理
     

     
     


     

     

     


    在我们修正系数的时候我们认为系数是可变的,是因变量。
    这里介绍的是计算完一条记录,就马上更新权重,以后每计算完一条都即时更新权重。实际上批量更新的效果会更好,方法是在不更新权重的情况下,把记录集的每条记录都算过一遍,把要更新的增值全部累加起来求平均值,然后利用这个平均值来更新一次权重,然后利用更新后的权重进行下一轮的计算,这种方法叫批量梯度下降(Batch Gradient Descent)
     
    修正: 第八个图是-0.09x-0.5 = 0.045 
    关注公众号 海量干货等你
  • 相关阅读:
    Zabbix监控系统详解:系统功能介绍
    Zabbix监控系统详解:ubuntu系统下软件的安装
    计算机数学基础:第二章 极限
    计算机数学基础:第一章 函数
    net 架构师-数据库-sql server-003-T-SQL 基本语句
    net 架构师-数据库-sql server-002-工具
    net 架构师-数据库-sql server-001-SQL Server中的对象
    net 架构师-数据库-sql server-触发器
    c# 设计模式
    CSS盒模型(1)——基本概念
  • 原文地址:https://www.cnblogs.com/sowhat1412/p/12734369.html
Copyright © 2020-2023  润新知