• LDA线性判别分析


    LDA线性判别分析

    给定训练集,设法将样例投影到一条直线上,使得同类样例的投影点尽可能的近,异类样例点尽可能的远,对新样本进行分类的时候,将新样本同样的投影,再根据投影得到的位置进行判断,这个新样本的类别

    LDA二维示意图。用‘+’表示正类“-”表示负类,两个投影,实心三角形和圆表示投影中心

    LDA二维示意图。用‘+’表示正类“-”表示负类,两个投影,实心三角形和圆表示投影中心

    二分类:
    给定数据集

    :第类的样本集合
    :第类的均值向量
    :第类的协方差矩阵

    将数据投影在直线上,则两类样本的中心点在直线上的投影分别为

    将所有的样本点投影到直线上之后,两类样本的协方差为

    由于直线是一维空间,因此 均为实数

    为了把两类分的比较开于是有两个方面考虑
    1、同类抱团更加紧密
    2、不同类分的开

    为了让同类的样本尽可能的接近,就让同类样本的投影点协方差尽可能的小,
    于是有
    让他们尽可能的小

    为了两类分的开:
    于是有了两类的投影中心尽可能的远离

    要尽可能的大,这样就可以得到它的优化目标函数,使她最大就ok

    定义两个符号
    类内散度矩阵:

    类间散度矩阵

    于是得到了要优化的下式,最后需要优化的目标,使之最大化即可,求取

  • 相关阅读:
    伪多项式时间 Pseudo-polynomial time
    Aho-Corasick算法
    写给十八岁以下的你
    网络流算法
    Java static关键字
    带有负权边的最短路径问题
    Miller_Rabin(米勒拉宾)素数测试
    关于同余与模运算的总结
    UVa1585
    UVa修改版02
  • 原文地址:https://www.cnblogs.com/xujianqing/p/7082407.html
Copyright © 2020-2023  润新知