一、用自己的话描述出其本身的含义:
1、特征选择
特征选取是从包含多个特征的数据集中挑选出几个特征作为实际使用的数据集,将高维空间的样本通过映射或者是变换的方式转换到低维空间,达到降维的目的,然后通过特征选取删选掉冗余和不相关的特征来进一步降维。用于训练模型。没有改变特征的形式。
2、PCA
PCA是指主要成分分析, 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。用于减少数据集的维度,同时保持数据集中使方差贡献最大的特征,改变了原来特征的形式。
二、并用自己的话阐述出两者的主要区别
特征选择不改变原来的特征形式,PCA改变了原来的特征形式。
特征选择不显著降低分类精度且特征子集应具有稳定适应性强。