算法初识

决策树

弱分类算法：决策树，神经网络

Bagging是减少variance，而Boosting是减少bias

Bootstrap：自助采样算法，有放回抽样，用小样本数据集估计整体的非参数方法（估计统计量）。

Bagging：套袋法，并行化集成学习方法，自助采样 --> 加权融合 --> 等权重投票

场景：分类任务（简单投票法），回归任务（简单平均法）

Boosting：提升法，串行化集成学习方法，训练子集 --> 基分类器 --> 加权融合 --> 加权投票

缺点：需预先知道弱学习算法的分类正确的下限

AdaBoost：Adaptive Boosting(Boosting进阶版)，子集选择 --> (分错)样本权重计算 --> 分类器权重计算

优点：自适应训练基分类器，侧重训练分错的样本

几种算法关系总结如下：

GBDT以决策树（CART）为基学习器的GB算法，XGBoost扩展和改进GDBT，更快、准确率相对高。

以上几种总结如下：

随机森林RF：并行化集成学习方法，以决策树为基学习器构建Bagging的集成学习方法，在决策树的训练过程中引入随机属性选择。

特点：样本扰动+属性扰动 ==> 基学习器多样性 ==> 泛化性能提升

梯度提升树：采用加法模型(即基函数的线性组合)与前向分布算法，以决策树为基函数的提升方法

特点：利用最速下降法，关键是利用损失函数的负梯度在当前模型的值

XGBoost：并行化集成学习方法

特点：

相关阅读:
洛谷P3959 宝藏（状压dp）
洛谷P3645 [APIO2015]雅加达的摩天楼（最短路+分块）
洛谷P3646 [APIO2015]巴厘岛的雕塑（数位dp）
洛谷P4770 [NOI2018]你的名字（后缀自动机+线段树）
洛谷P4768 [NOI2018]归程（克鲁斯卡尔重构树+最短路）
hive3.1.1 hive-site.xml
mysql 远程连接数据库的二种方法
linux彻底干干净净完全卸载 mysql
jdk环境变量配置
Eclipse常用快捷键

原文地址：https://www.cnblogs.com/wjcx-sqh/p/11233800.html