04-06 梯度提升树

更新、更全的《机器学习》的更新网站，更有python、go、数据结构与算法、爬虫、人工智能教学等着你：https://www.cnblogs.com/nickchen121/p/11686958.html

梯度提升树

梯度提升树(gradien boosting decision tree，GBDT)在工业上用途广泛，属于最流行、最实用的算法之一，梯度提升树可以看成是提升树的优化版。

梯度提升树其实流程和提升树差不多，但是在损失函数拟合方面，提升树损失函数拟合用的是平方损失，而梯度提升树则是使用损失函数的负梯度来拟合本轮损失的近似值，进而拟合一个回归树。

第(t)轮第(i)样本的损失函数的负梯度表示为

[r_{ti}=-{[frac{partial{L(y_i,f(x_i))}}{partial{f(x_i)}}]}_{f(x)=f_{t-1}(x)} ]

利用((x_i,r_{ti}),quad(i=1,2,cdots,m))，我们可以拟合一颗CART回归树，得到了第(t)棵回归树，它对应的叶节点区域为(R_{tj},quad(j=1,2,cdots,J))，其中(J)为叶子节点数。

有(m)个数据(n)个特征的训练数据集(T={(x_,y_1),(x_2,y_2),cdots,(x_m,y_m)})，损失函数为(L(y,f(x)))。

回归树(hat{f(x)})。

[f_0(x) = underbrace{arg\,min}_csum_{i=1}^mL(y_i,c) ]

[hat{f(x)}=f_M(x)=sum_{i=1}^Msum_{j=1}^Jc_{mj}I(xin{R_{mj}}) ]

梯度提升树虽然在某种程度解决了提升树对于分类和回归问题使用不同的损失函数的问题，并且使用损失函数的负梯度作为提升树算法残差值的近似值，提升了模型的准确度，但是他还无法做到并行。下面介绍的XgBoost作为GBDT的升级版，将会解决这个问题。

相关阅读:
bzoj3159: 决战
Codeforces Round #516 (Div. 1, by Moscow Team Olympiad) C
Codeforces Round #516 (Div. 1, by Moscow Team Olympiad) B
Codeforces Round #516 (Div. 1, by Moscow Team Olympiad) A
loj 6401 字符串
BZOJ5194 雪地靴
BZOJ 4709 柠檬
BZOJ 3343 魔法
[8月16日绍兴]试剂
设备塔

原文地址：https://www.cnblogs.com/nickchen121/p/11686763.html