• 机器学习——霍夫丁(Hoeffding)不等式证明


    马尔可夫不等式

    结论

      对于任意非负随机变量$X$,$forall epsilon>0$,有:

    $displaystyle P(Xgeepsilon)lefrac{E(X)}{epsilon}$

      切比雪夫不等式是它的特例。

    证明

    $ egin{align*} E(X) &= int_{0}^{infty}xf(x)dx\ &ge int_{epsilon}^{infty}xf(x)dx\ &ge int_{epsilon}^{infty}epsilon f(x)dx\ &=epsilon P(Xge epsilon)\ end{align*}$

      把$epsilon$除过去,得证。离散情况一样。

    霍夫丁不等式引理

    结论

      对于随机变量$X$,$P(Xin [a,b]) = 1,E(X)=0$,有:

    $E(e^{sX})le e^{s^2(b-a)^2/8}$

    证明

      因$e^{sX}$是关于$X$的凸函数,由凸函数性质:

    $displaystyle e^{sX}le frac{b-X}{b-a}e^{sa}+frac{X-a}{b-a}e^{sb}$

      于是对$X$取期望,有:

    $ egin{align*} displaystyle E(e^{sX}) &le frac{b-E(X)}{b-a}e^{sa}+frac{E(X)-a}{b-a}e^{sb}\ & = frac{b}{b-a}e^{sa}-frac{a}{b-a}e^{sb}\ & = left(-frac{a}{b-a} ight)e^{sa}left(-frac{b}{a}+e^{sb-sa}{} ight)\ end{align*}$

      因为$E(X)=0$,$Xin [a,b]$,而$a,b$都为0的情况没有讨论的意义,所以有$a<0,b>0$。令$displaystyle heta = -frac{a}{b-a}>0$,则上式变为:

    $ egin{align*} displaystyle E(e^{sX}) &le heta e^{-s heta (b-a)}left(frac{1}{ heta}-1+e^{s(b-a)} ight)\ &=(1- heta + heta e^{s(b-a)})e^{-s heta(b-a)}\  end{align*}$

      因为

    $ egin{gather} displaystyle 1- heta+ heta e^u = heta(frac{1}{ heta}-1+e^u) = heta(-frac{a}{b}+e^u)>0 label{} end{gather} $

      所以不等式可以变为:

    $displaystyle E(e^{sX})le e^{ln(1- heta + heta e^{s(b-a)})}e^{-s heta(b-a)}$

      令$u = s(b-a)$:

    $E(e^{sX})le e^{ln(1- heta+ heta e^u)- heta u}$

      定义$varphi:R o R,varphi(u)= ln(1- heta+ heta e^u)- heta u$。由$(1)$式可得这个函数是良定义的,也就是$varphi(u)$的$ln$并不限制$u$的取值。得:

    $E(e^{sX})le e^{varphi(u)}$

      由泰勒中值定理,$existxiin [0,u]$使

    $displaystylevarphi(u)=varphi(0)+uvarphi'(0)+frac{1}{2}u^2varphi''(xi)$

      其中:

    $ egin{equation} egin{array}{lcl} varphi(0) = 0 \ varphi'(0)= left.left(frac{ heta e^u}{1- heta+ heta e^u}- heta ight) ight|_{u=0}=0  \ egin{split} varphi''(xi) &= frac{ heta e^{xi}(1- heta+ heta e^{xi})- heta^2 e^{2xi}}{(1- heta+ heta e^{xi})^2} \ &=frac{ heta e^{xi}}{1- heta+ heta e^{xi}}(1-frac{ heta e^{xi}}{1- heta+ heta e^{xi}})\ &=t(1-t)lefrac{1}{4} end{split} end{array} end {equation} $

      因此有:

    $displaystylevarphi(u)le 0+0+frac{1}{2}u^2 imesfrac{1}{4} = frac{1}{8}s^2(b-a)^2$

      于是

    $E(e^{sX})le e^{s^2(b-a)^2/8}$

    霍夫丁不等式

    结论

      wiki的定义:

      霍夫丁不等式适用于有界的随机变量。设有两两独立的一系列随机变量$X_{1},dots ,X_{n}$。假设对所有的$X_{i}$都是几乎有界(看成有界就好了)的变量,即满足:

    $displaystyle P(X_{i}in [a_{i},b_{i}])=1$

      那么这n个随机变量的经验期望(均值):

    $displaystyle overline{X} = frac{X_1+cdots+X_n}{n}$

      满足以下不等式:

    $displaystyle  P(overline{X}-E(overline{X})ge t) le expleft(- frac{2t^2n^2}{sum_{i=1}^{n}(b_i-a_i)^2} ight)$

    $displaystyle  P(|overline{X}-E(overline{X})|ge t) le 2 expleft(- frac{2t^2n^2}{sum_{i=1}^{n}(b_i-a_i)^2} ight)$

    证明

      对于$X_1,X_2,...,X_n$,$n$个相互独立的随机变量(wiki里面说是两两独立,我感觉两两独立$X_i$乘积的期望应该不能分离成期望的乘积,这里我不太明确),$P(X_iin [a_i,b_i])=1,1le ile n$,令

    $displaystyle S_n=sumlimits_{i=1}^{n}X_i$

      取$s>0,t>0$,由马尔科夫不等式得:

    $egin{align*} P(S_n-E(S_n)ge t) &= P(e^{s(S_n-E(S_n))}ge e^{st})\ &le e^{-st}E(e^{s(S_n-E(S_n))}) \ &= e^{-st}prodlimits_{i=1}^{n}E(e^{s(X_i-E(X_i))}) end {align*}$

      再由引理得:

    $ egin{align*} P(S_n-E(S_n)ge t) &le e^{-st}prodlimits_{i=1}^{n} e^{frac{s^2(b_i-a_i)^2}{8}}\ &=exp(-st+frac{1}{8}s^2sumlimits_{i=1}^n(b_i-a_i)^2) end {align*}$ 

      到这一步,不等式中还多出了一个$s$,因为$forall s>0$,都有以上不等式成立,因此取右边关于$s$的二次函数的最小值。令

    $displaystyle g(s)=-st+frac{1}{8}s^2sumlimits_{i=1}^n(b_i-a_i)^2$

      求$g'(s)=0$,得:

    $displaystyle  s = frac{4t}{sum_{i=1}^{n}(b_i-a_i)^2}$

      于是:

    $displaystyle P(S_n-E(S_n)ge t) le expleft(- frac{2t^2}{sum_{i=1}^{n}(b_i-a_i)^2} ight)$

      变换成$X_i$的均值$overline{X}$,也就是:

    $displaystyle  P(overline{X}-E(overline{X})ge t) le expleft(- frac{2t^2n^2}{sum_{i=1}^{n}(b_i-a_i)^2} ight)$

      取反后依然成立:

    $displaystyle  P(E(overline{X})-overline{X}ge t) le expleft(- frac{2t^2n^2}{sum_{i=1}^{n}(b_i-a_i)^2} ight)$

      合到一起:

    $displaystyle  P(|overline{X}-E(overline{X})|ge t) le 2 expleft(- frac{2t^2n^2}{sum_{i=1}^{n}(b_i-a_i)^2} ight)$

      得证。

  • 相关阅读:
    Mini440之uboot移植之源码分析board_init_f(二)
    Mini440之uboot移植之源码分析uboot重定位(三)
    Mini440之uboot移植之实践DM9000支持(八)
    Mini2440裸机开发之DM9000
    Mini440之uboot移植之源码分析命令解析(五)
    Mini440之uboot移植之实践NOR启动(六)
    Mini440之uboot移植之实践NOR FLASH支持(七)
    mysql调优和SQL优化
    linux man手册使用相关问题
    关于ca以及证书颁发的一些事
  • 原文地址:https://www.cnblogs.com/qizhou/p/12843557.html
Copyright © 2020-2023  润新知