一、用自己的话描述出其本身的含义:
1、特征选择
特征选择是指从已有的M个特征中选择N个特征使得系统的特定指标最优化,是从原始特征中选择出一些最有效特征以降低数据集维度的过程,是提高学习算法性能的一个重要手段,也是模式识别中关键的数据预处理步骤。对于一个学习算法来说,好的学习样本是训练模型的关键。
2、PCA
PCA即主成分分析技术,又称主分量分析。主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。
二、并用自己的话阐述出两者的主要区别
PCA可用于简化运算,可视化高维数据,发现隐性相关变量,就拿画散点图来说特征选择是通过与实际值相关性强弱选择出最大相关性的特征如朝向和房价、建筑面积和房价,显然建筑面积和房价相关性高些,所以特征选择的横坐标选择建筑面积最为合适;而PCA可以将朝向和建筑面积两个特征合为一个特征,当为散点图的横坐标,这体现出PCA的实用性。