• 第四章 线性判据与回归 笔记


    线性判据基本概念

    线性判据:
    定义:如果判别模型 f(x) 是线性函数,则 f(x) 是线性判据。
    优势:计算量少,适用于训练样本较少的情况下。
    模型:

    判别公式:

    决策边界:

    w 的方向垂直于决策边界。
    样本到决策边界的距离:
    r = f(x)/||w||
    参数空间:由各个参数维度构成的空间。
    解域:在参数空间内,参数的所有可能解所处的范围。

    并行感知机算法

    目的:根据标记过的训练样本{(xn, tn)}, 学习模型参数 w, w0。
    预处理:
    步骤1:将两个参数合为一个参数 a,线性判据改写为:

    步骤2:将C2类的训练样本全部取反:

    目标函数:针对所有被错误分类的训练样本,其输出值取反求和:

    根据梯度下降法,参数 a 的更新公式为:

    算法流程:

    串行感知机算法

    适用情况:训练样本是一个一个串行给出的。
    目标函数与并行感知机相同。
    算法流程:

    Fisher线性判据

    基本原理:找到一个最合适的投影轴,使两类样本在该轴上投影的重叠部分最少,从而使分类效果达到最佳。
    最佳标准之一:投影后,使得不同类别样本分布的类间差异尽可能大,同时使得各自类内样本分布的离散程度尽可能小。
    类间样本的差异程度:用两类样本分布的均值之差度量。
    类内样本的离散程度:用每类样本分布的协方差矩阵表征。
    算子:

    目标函数:

    作如下定义:

    w 最优解:

    w0 的解:

    判别公式:

    决策边界:

    支持向量机

    设计思想:给定一组训练样本,使得两个类中与决策边界最近的训练样本到决策边界之间的间隔最大。
    间隔的数学定义:

    支持向量的概念:

    间隔计算:

    目标函数:
    最大化间隔,等价于最小化||w||,所以目标函数设计为:

    同时满足以下约束条件:

    拉格朗日乘数法

    等式约束:等价优化问题

    不等式约束:等价优化问题

    拉格朗日对偶问题

    原问题:

    原问题的等价问题:

    即:

    对偶问题:

    对偶问题和原问题的关系:
    设对偶问题的最优值为 d,主问题的最优值为 p,对于所有的优化问题都存在 d* <= p* (弱对偶性)
    强对偶性:d* = p*
    强对偶成立条件:

    • f(x) 是凸函数
    • g(x) 是凸函数
    • h(x) 是仿射函数
    • 在可行域至少有一点使得不等式约束严格成立

    支持向量机学习算法

    目标函数 L 对 w 和 w0 求导,并设偏导等于0:

    将上诉偏导等于0的结果带入拉格朗日函数,消去 w, w0:

    目标函数变为:

    得到最优的 Λ ,即可得到最优的参数 w 和 w0 。
    此问题为二次规划问题,可通过相应软件求解。

    求解支持向量:

    参数最优解:

    识别决策:

  • 相关阅读:
    MySQL5.7 多主一从(多源复制)同步配置
    mysql 树形查询 结果
    【教程】Chrome 浏览器安装Vue插件方法 (十分详细)
    MySQL数据库备份
    nginx之ngnix搭建静态服务器,前端css,js,图片,视频等静态资源走nginx代理,实现Nginx缓存,压缩
    尽量不要让儿女从事这3种工作,钱再多也别做,坚持再久也没前途
    【MySQL】mysql5.7多源复制报错问题处理
    MyBatis 多条件查询、动态SQL、多表操作、注解开发,应有尽有,一网打尽!
    MySQL 5.7多源复制配置详解
    mysql 逆向生成Pmd 文件
  • 原文地址:https://www.cnblogs.com/1e9add7/p/12829567.html
Copyright © 2020-2023  润新知