集成学习AdaBoost算法——学习笔记

集成学习AdaBoost算法——学习笔记

集成学习

个体学习器1

个体学习器2

个体学习器3 ——> 结合模块 ——>输出（更好的）

...

个体学习器n

通常，类似求平均值，比最差的能好一些，但是会比最好的差。

集成可能提升性能、不起作用、甚至起负作用。

集成要提高准确率！

每一个个体学习器之间存在差异

一定要有差异性，有差异性才能提升。这些弱学习器需要，好而不同。

集成学习分类：Bagging Boosting

Bagging：并行生成，然后结合。不存在依赖关系。

Boosting：依赖关系，一个一个学习器产生。

AdaBoost算法

多个弱学习器加权融合：

误差率

每一个样本权重1/M，如果分错一个

分错第几个点

预测错误的权重提高（预测），迭代训练至错误率足够小。

Sign函数：1、-1两类。（>0or<0?）

算法流程：

10个样本，每个样本权重1/10=0.1

阈值根据观察，可以2.5/5.5/8.5？

选择误差率最低的，<阈值，Y=1。

2.5时，6、7、8，Y=-1分错了；

5.5时，3、4、5、6、7、8分错了。

第二次：

计算系数后，再次更新权重：

第三次：

权重变化

对上一个分类器，分类错误的。迭代。

优点：

决策树构建模型：
相关阅读:
LuoguP4463 [集训队互测2012] calc DP+拉格朗日插值
 一些图的计数
 redis补充1之为什么要用 Redis/为什么要用缓存？
redis补充4之Redis 和 Memcached 的区别和共同点
 redis补充3之为什么要有分布式缓存?/为什么不直接用本地缓存?
redis补充2之简单说说有哪些本地缓存解决方案?
1_java语言概述-注释与API文档等
 1_java语言概述-开发环境搭建
 weblogic 2021.4.20 季度补丁
 mysql source输出记录日志
原文地址：https://www.cnblogs.com/wxl845235800/p/10133838.html

集成学习AdaBoost算法——学习笔记

集成学习

AdaBoost算法

算法流程：