一、用自己的话描述出其本身的含义:
1、特征选择
特征选择( Feature Selection )也称特征子集选择( Feature Subset Selection , FSS ),或属性选择( Attribute Selection )。是指从已有的M个特征(Feature)中选择N个特征使得系统的特定指标最优化,是从原始特征中选择出一些最有效特征以降低数据集维度的过程,是提高学习算法性能的一个重要手段,也是模式识别中关键的数据预处理步骤。对于一个学习算法来说,好的学习样本是训练模型的关键。
2、PCA
PCA是将输入特征转换为其主成分的系统化方式。这些主成分作为在分类或回归任务中新特征。
主成分的定义是数据中会使方差最大化的方向,它是在对特征数据执行投影或压缩时,最大化的降低信息丢失。
可对主成分划分等级。主成分等级越高,产生的方差越大。产生方差最大的主成分即为第一主成分。产生方差第二大的成分即为第二主成分。依次类推。
二、并用自己的话阐述出两者的主要区别
特征选择是从包含多个特征的数据集中挑选出几个特征作为实际使用的数据集,没有改变特征的形式。
PCA是用于减少数据集的维度,同时保持数据集中使方差贡献最大的特征。改变了原来特征的形式。