First Header |
Second Header |
Third Header |
Content Cell |
Content Cell |
Content Cell |
Content Cell |
Content Cell |
Content Cell |
标题一 |
标题二 |
标题三 |
001 |
cpu1 |
master |
002 |
cpu2 |
slave |
标准化方法 |
数学公式 |
优点 |
缺点 |
区间 |
Z-Score |
(x^' = (x-mean)/std) |
默认标准化方法,生成数据以0为均值,方差为1的正态分布。 |
一种中心化方法,会改变原有数据的分布结构,不适合用于对稀疏数据做处理。 |
[0,1] |
Max-Min |
(x^'=(x-min)/(max-min)) |
应用广泛,对数据线性变换,能较好地保持原有数据结构。 |
可能出现分母为0,导致计算溢出。 |
[0,1] |
MaxAbs |
$x^'=x/ |
max |
$ |
不破坏原有数据分布结构,可以用于稀疏数据、稀疏的CSR或CSC |
RobustScaler |
- |
针对离群点做标准化处理,对数据中心华和数据的缩放健壮性有更强的参数控制能力。能最大限度地保留数据集中的异常。 |
- |
- |
First Header | Second Header | Third Header
---------------- | --------------------- | ----------------
Content Cell | Content Cell | Content Cell
Content Cell | Content Cell | Content Cell
标题一 | 标题二 | 标题三
-----------------|-----------------------|-------------------
001 | cpu1 | master
002 | cpu2 | slave
标准化方法|数学公式|优点|缺点|区间
--------|--------|---------|---------|---------
Z-Score|$x^' = (x-mean)/std$|默认标准化方法,生成数据以0为均值,方差为1的正态分布。|一种中心化方法,会改变原有数据的分布结构,不适合用于对稀疏数据做处理。|[0,1]
Max-Min|$x^'=(x-min)/(max-min)$|应用广泛,对数据线性变换,能较好地保持原有数据结构。|可能出现分母为0,导致计算溢出。|[0,1]
MaxAbs|$x^'=x/|max|$|不破坏原有数据分布结构,可以用于稀疏数据、稀疏的CSR或CSC|-|[-1, 1]
RobustScaler|-|针对离群点做标准化处理,对数据中心华和数据的缩放健壮性有更强的参数控制能力。能最大限度地保留数据集中的异常。|-|-