PCA降维,主成分分析法。
降维就是去除线性相关,使得最后剩余的属性维度全都线性无关。
均值(平均值) |
|
样本方差(总体方差是n,样本方差是n-1) |
|
协方差(如果X等于Y,就是方差) |
①去中心化,减去均值
②计算协方差
③求协方差的特征值,特征向量
④特征向量归一化,原来n维,现在要降到k维,那么就取最大的k个特征值对应的特征向量。与原输入进行相乘。
第一步:均值为0,去中心化不变
第二步:求协方差
第三步:求特征值,特征向量
第四步:特征向量归一化
第五步:取前k大特征值对应的特征向量(原输入是2维,现在要降维到1维,k=1,取最大特征值对应的特征向量)
参考:https://blog.csdn.net/program_developer/article/details/80632779
参考:https://blog.csdn.net/qiusuoxiaozi/article/details/50810521