一、用自己的话描述出其本身的含义:
1、特征选择
就比如有M个特征,在其中选择N个特征使得系统的特定指标达到最优的结果,这个从M→N的过程就是特征选择。
2、PCA
主成分分析,经常用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征,简单来说就是减少这份数据样本的某些属性,降低冗余,但是同时也从这些现有的特征中重建新的特征,新的特征剔除了原有特征的冗余信息,因此使不同的样本数据更有区分度。
二、并用自己的话阐述出两者的主要区别
特征选择:从包含多个特征的数据集中挑选出几个特征作为实际使用的数据集,用于训练模型。没有改变特征的形式。
PCA:用于减少数据集的维度,同时保持数据集中使方差贡献最大的特征。改变了原来特征的形式。