• LDA(线性判别分析,Python实现)


    源代码:

     1 #-*- coding: UTF-8 -*-
     2 from numpy import *
     3 import numpy
     4 def lda(c1,c2):
     5     #c1 第一类样本,每行是一个样本
     6     #c2 第二类样本,每行是一个样本
     7 
     8     #计算各类样本的均值和所有样本均值
     9     m1=mean(c1,axis=0)#第一类样本均值
    10     m2=mean(c2,axis=0)#第二类样本均值
    11     c=vstack((c1,c2))#所有样本
    12     m=mean(c,axis=0)#所有样本的均值
    13 
    14     #计算类内离散度矩阵Sw
    15     n1=c1.shape[0]#第一类样本数
    16     print(n1);
    17     n2=c2.shape[0]#第二类样本数
    18     #求第一类样本的散列矩阵s1
    19     s1=0
    20     for i in range(0,n1):
    21         s1=s1+(c1[i,:]-m1).T*(c1[i,:]-m1)
    22     #求第二类样本的散列矩阵s2
    23     s2=0
    24     for i in range(0,n2):
    25         s2=s2+(c2[i,:]-m2).T*(c2[i,:]-m2)
    26     Sw=(n1*s1+n2*s2)/(n1+n2)
    27     #计算类间离散度矩阵Sb
    28     Sb=(n1*(m-m1).T*(m-m1)+n2*(m-m2).T*(m-m2))/(n1+n2)
    29     #求最大特征值对应的特征向量
    30     eigvalue,eigvector=linalg.eig(mat(Sw).I*Sb)#特征值和特征向量
    31     indexVec=numpy.argsort(-eigvalue)#对eigvalue从大到小排序,返回索引
    32     nLargestIndex=indexVec[:1] #取出最大的特征值的索引
    33     W=eigvector[:,nLargestIndex] #取出最大的特征值对应的特征向量
    34     return W
  • 相关阅读:
    大数据基础文献综述
    牛客网数据库SQL实战
    Leetcode with Python
    tinyMCE
    HTTP LVS
    采坑大全
    Hadoop 解除 NameNode is in safe mode
    R语言采坑系列——Warning message: In validDetails.polygon(x) : 强制改变过程中产生了NA
    .Net中的异步编程
    知识点4
  • 原文地址:https://www.cnblogs.com/simon-c/p/5023726.html
Copyright © 2020-2023  润新知