机器学习——决策树

整理自：

https://blog.csdn.net/woaidapaopao/article/details/77806273?locationnum=9&fps=1

1.各种熵的计算

熵、联合熵、条件熵、交叉熵、KL散度（相对熵）

熵用于衡量不确定性，所以均分的时候熵最大
KL散度用于度量两个分布的不相似性，KL(p||q)等于交叉熵H(p,q)-熵H(p)。交叉熵可以看成是用q编码P所需的bit数，减去p本身需要的bit数，KL散度相当于用q编码p需要的额外bits。
交互信息Mutual information ：I(x,y) = H(x)-H(x|y) = H(y)-H(y|x) 表示观察到x后，y的熵会减少多少。

2.常用的树搭建方法

ID3、C4.5、CART分别利用信息增益、信息增益率、Gini指数作为数据分割标准。

3.防止过拟合—剪枝

剪枝分为前剪枝和后剪枝，前剪枝本质就是早停止，后剪枝通常是通过衡量剪枝后损失函数变化来决定是否剪枝。后剪枝有：错误率降低剪枝、悲观剪枝、代价复杂度剪枝

4.前剪枝的几种停止条件

年岁有加并非垂老理想丢弃方堕暮年

相关阅读:
迭代加深搜索 codevs 2541 幂运算
二叉树结构 codevs 1029 遍历问题
深搜+DP剪枝 codevs 1047 邮票面值设计
2016.6.10 深度优先搜索练习
二分+动态规划 POJ 1973 Software Company
tarjan算法求桥双连通分量 POJ 3177 Redundant Paths
tarjan算法+缩点：求强连通分量 POJ 2186
tarjan算法求割点cojs 8
关键路径 SDUTOJ 2498
第二章 STM32的结构和组成

原文地址：https://www.cnblogs.com/helloworld0604/p/9015704.html