什么时候需要做数据标准化

哪些模型对标准化处理比较敏感？

机器学习中有部分模型是基于距离度量进行模型预测和分类的。由于距离对特征之间不同取值范围非常敏感，所以基于距离读量的模型是十分有必要做数据标准化处理的。

最典型基于距离度量的模型包括k近邻、kmeans聚类、感知机和SVM。另外，线性回归类的几个模型一般情况下也是需要做数据标准化处理的。决策树、基于决策树的Boosting和Bagging等集成学习模型对于特征取值大小并不敏感。所以这类模型一般不需要做数据标准化处理。另外有较多类别变量的数据也是不需要做标准化处理的。

结论

结论就是当数据特征取值范围或单位差异较大时，最好是做一下标准化处理。k近邻、kmeans聚类、感知机、SVM和线性回归类的模型，一般也是需要做数据标准化处理的。另外最好区分一下数据标准化和数据归一化

原文地址：https://www.cnblogs.com/cgmcoding/p/13632684.html