数据维度灾难需要降维
实际数据会有很多的维度,但对数据处理时,不能将所有数据的维度都当做一个参数,那样就会导致我们口中的维度灾难
那么,维度灾难该怎么处理呢
1主要成分分析
基本思想:构造原始特征的一系列线性组合形成的线性无关低纬特征,以去除数据的相关性,并使降维后的数据最大程度的保持原始高维数据的方差信息
2,数据集表示
自编码器:
一种特殊的神经网络,尝试将输入复制到输出
编码器:将输入x转换成隐含表示h
解码器:将隐含表示h转换成输出x1
优化目标:是的x1与x尽量接近
当隐含神经元数量小于输入层时,可以当做是一种降维算法