关于Adaboost——样本抽样的权值的实际意义

关于Adaboost——样本抽样的权值的实际意义

看这篇文章的前提：已经看了PRML中的Adaboost的算法流程

看懂下面的内容必须牢牢记住：Adaboost使用的误差函数是指数误差

文章主要目的：理解样本抽样的权值是为什么那样变化的。

得出的结论：训练第m个基分类器y_m时，样本n的抽样权重是f_m-1在样本n上的指数误差

当y_m将第n个样本分对了时，则权值保持不变，否则权值增加exp{α_m}(>1)倍

（1）

（2）

（3）

(1)表示分类器f_m的误差函数是指数误差函数

(2)表示分类器f_m是一系列的基函数(y_l,即基分类器)的加权和，α_l是基分类器y_l的权重，l=1...m

(3)表示分类器f_m是二分类

Adaboost是选择恰当的α_l和y_l使得误差E最小，l=1...m

找到全局最优是件很麻烦的事，所以决定找到局部最优，采用了前向分步算法

前向分步算法

假设前m-1个基分类器y₁(x)...y_m-1(x)已经确定，且相应的权重α₁...α_m-1也已经确定，此时只需要寻找恰当的α_m和y_m使得E最小。

因此E可以转换为：

（4）

根据指数误差函数，我们可以知道，其实就是f_m-1在样本n上的误差，即训练y_m时，样本n的抽样权重是f_m-1在样本n上的误差。

（4）中右边的累加项是表示f_m在样本n上的误差，所以就有了下面的递推公式

（5）

（6）

公式6很容易得到，将（6）代入（5）中，可以得到（7）

（7）

而与n无关，即与样本(数据)无关，所以对样本的抽样没影响，可以去掉。

当y_m将第n个样本分对了，则权值保持不变，否则权值增加expα_m(>1)倍

接下来的内容是关于算法的三个主要部分的解释：

1、当考虑y_m的变化时，最小化分类器f_m的指数误差损失等价于最小化第m个基分类器y_m的加权的0-1损失

2、当只考虑α_m的变化时，最小化分类器f_m的指数误差损失，得到基分类器的权值α_m的值（与加权误差率的关系）

3、加权误差率

对（4）进行进一步的转换得到：

（8）

如果只考虑y_m的变化，最小化E等价于最小化（9）

（9）

（9）表示加权误差和

如果只考虑α_m的变化，最小化E得到

（10）

其中：

是加权误差率

补充AdaBoost算法框架
相关阅读:
阶段5 3.微服务项目【学成在线】_day16 Spring Security Oauth2_20-认证接口开发-接口测试
 阶段5 3.微服务项目【学成在线】_day16 Spring Security Oauth2_19-认证接口开发-接口开发-controller
阶段5 3.微服务项目【学成在线】_day16 Spring Security Oauth2_18-认证接口开发-接口开发-service
阶段5 3.微服务项目【学成在线】_day16 Spring Security Oauth2_17-认证接口开发-申请令牌测试
 阶段5 3.微服务项目【学成在线】_day16 Spring Security Oauth2_16-认证接口开发-Api接口定义
 阶段5 3.微服务项目【学成在线】_day16 Spring Security Oauth2_15-认证接口开发-Redis配置
 阶段5 3.微服务项目【学成在线】_day16 Spring Security Oauth2_14-认证接口开发-需求分析
 阶段5 3.微服务项目【学成在线】_day16 Spring Security Oauth2_13-SpringSecurityOauth2研究-JWT研究-生成JWT令牌&验证JWT令牌
 阶段5 3.微服务项目【学成在线】_day16 Spring Security Oauth2_12-SpringSecurityOauth2研究-JWT研究-生成私钥和公钥
 阶段5 3.微服务项目【学成在线】_day16 Spring Security Oauth2_11-SpringSecurityOauth2研究-JWT研究-JWT介绍
原文地址：https://www.cnblogs.com/xiangzhi/p/4623286.html