sklearn中数据缩放用到的fit_transform()、transform()、fit()方法的区别与联系

sklearn中数据缩放用到的fit_transform()、transform()、fit()方法的区别与联系
看了一堆搜索排名靠前的中文博客，感觉没有一个解释能让人醍醐灌顶的，故搜索英文网页并记之。

谢绝转载。

首先对于数据标准化一般是这么做的：

其中 $μ$

$μ$

$μ$

$μ$

$μ$
```
1 # Feature Scaling
2 from sklearn.preprocessing import StandardScaler
3 sc = StandardScaler()
4 X_train = sc.fit_transform(X_train)
5 X_test = sc.transform(X_test)
```
注意这里fit_transform()是用在训练集上的，也就是说，fit_transform()先计算了训练集数据的均值μ和标准差σ，并以此对训练集进行标准化。

参考：

https://datascience.stackexchange.com/questions/12321/whats-the-difference-between-fit-and-fit-transform-in-scikit-learn-models

https://www.kaggle.com/questions-and-answers/58368
相关阅读:
使用 linux kernel +busybox 定制linux系统
 记一次golang的内存泄露
 关于Queries_per_sec 性能计数器
 NUMA导致的MySQL服务器SWAP问题分析
 Drop Table对MySQL的性能影响分析
 当MySQL数据库遇到Syn Flooding
tcp_tw_recycle参数引发的数据库连接异常
 一例数据同步异常问题分析
 MySQL大量线程处于Opening tables的问题分析
 MySQL DeadLock故障排查过程
原文地址：https://www.cnblogs.com/mrlonely2018/p/13855778.html