https://zhuanlan.zhihu.com/p/105913440
1gini值和gini系数
基尼值Gini(D):从数据集D中随机抽取两个样本,其类别标记不一致的概率。故,Gini(D)值越小,数据集D的纯度越高。
基尼指数Gini_index(D):一般,选择使划分后基尼系数最小的属性作为最优化分属性。
是决策树中的知识点,有点类似熵,值越小表示纯度越高。
https://zhuanlan.zhihu.com/p/105913440
基尼值Gini(D):从数据集D中随机抽取两个样本,其类别标记不一致的概率。故,Gini(D)值越小,数据集D的纯度越高。
基尼指数Gini_index(D):一般,选择使划分后基尼系数最小的属性作为最优化分属性。
是决策树中的知识点,有点类似熵,值越小表示纯度越高。