• 切比雪夫不等式——用于异常检测,基本假设:“几乎所有”值都会“接近”平均,如果偏差大就认为异常


    切比雪夫不等式

    维基百科,自由的百科全书
     
     
    跳到导航跳到搜索

    概率论中,切比雪夫不等式英语:Chebyshev's Inequality)显示了随机变量的“几乎所有”值都会“接近”平均。在20世纪30年代至40年代刊行的书中,其被称为比奈梅不等式(英语:Bienaymé Inequality)或比奈梅-切比雪夫不等式(英语:Bienaymé-Chebyshev Inequality)。切比雪夫不等式,对任何分布形状的数据都适用。可表示为:对于任意{displaystyle b>0}b>0,有:

    {displaystyle P(|X-E(X)|geqslant b)leq {frac {Var(X)}{b^{2}}}}{displaystyle P(|X-E(X)|geqslant b)leq {frac {Var(X)}{b^{2}}}}

    概念[编辑]

    这个不等式以数量化这方式来描述,究竟“几乎所有”是多少,“接近”又有多接近:

    • 与平均相差2个标准差以上的值,数目不多于1/4
    • 与平均相差3个标准差以上的值,数目不多于1/9
    • 与平均相差4个标准差以上的值,数目不多于1/16

    ……

    • 与平均相差k个标准差以上的值,数目不多于1/k2

    举例说,若一班有36个学生,而在一次考试中,平均分是80分,标准差是10分,我们便可得出结论:少于50分(与平均相差3个标准差以上)的人,数目不多于4个(=36*1/9)。
    公式:{displaystyle P(mu -ksigma <X<mu +ksigma )geq 1-{frac {1}{k^{2}}}}P(mu -ksigma <X<mu +ksigma )geq 1-{frac  {1}{k^{2}}}

    推论[编辑]

    测度论说法[编辑]

    设(X,Σ,μ)为一测度空间f为定义在X上的广义实可测函数。对于任意实数t > 0,

    {displaystyle mu ({xin X\,:\,\,|f(x)|geq t})leq {1 over t^{2}}int _{X}f^{2}\,dmu .}mu ({xin X\,:\,\,|f(x)|geq t})leq {1 over t^{2}}int _{X}f^{2}\,dmu .

    一般而言,若g是非负广义实值可测函数,在f的定义域非降,则有

    {displaystyle mu ({xin X\,:\,\,f(x)geq t})leq {1 over g(t)}int _{X}gcirc f\,dmu .}mu ({xin X\,:\,\,f(x)geq t})leq {1 over g(t)}int _{X}gcirc f\,dmu .

    上面的陈述,可透过以|f|取代f,再取如下定义而得:

    {displaystyle g(t)={egin{cases}t^{2}&{mbox{if }}tgeq 0\0&{mbox{otherwise,}}end{cases}}}g(t)={egin{cases}t^{2}&{mbox{if }}tgeq 0\0&{mbox{otherwise,}}end{cases}}

    概率论说法[编辑]

    {displaystyle X}X为随机变量,期望值{displaystyle mu }mu 标准差{displaystyle sigma }sigma 。对于任何实数k>0,

    {displaystyle Pr(left|X-mu ight|geq ksigma )leq {frac {1}{k^{2}}}.}Pr(left|X-mu 
ight|geq ksigma )leq {frac  {1}{k^{2}}}.

    改进[编辑]

    一般而言,切比雪夫不等式给出的上界已无法改进。考虑下面例子:

    {displaystyle Pr(X=1)=Pr(X=-1)=1/(2k^{2})}Pr(X=1)=Pr(X=-1)=1/(2k^{2})
    {displaystyle Pr(X=0)=1-1/k^{2}}Pr(X=0)=1-1/k^{2}

    这个分布的标准差{displaystyle sigma =1/k}sigma =1/k{displaystyle mu =0}mu=0

    对于任意分布形态的数据,根据切比雪夫不等式,至少有 {displaystyle 1-1/k^{2}}1-1/k^{2} 的数据落在k个标准差之内。其中k>1,但不一定是整数。

    当只求其中一边的值的时候,有Cantelli不等式

    {displaystyle Pr(X-mu geq ksigma )leq {frac {1}{1+k^{2}}}.}Pr(X-mu geq ksigma )leq {frac  {1}{1+k^{2}}}.[1]

    证明[编辑]

    定义{displaystyle ~A_{t}:={xin Xmid f(x)geq t}}~A_{t}:={xin Xmid f(x)geq t},设{displaystyle 1_{A_{t}}}1_{{A_{t}}}为集{displaystyle ~A_{t}}~A_{t}指标函数,有

    {displaystyle 0leq g(t)1_{A_{t}}leq gcirc f\,1_{A_{t}}leq gcirc f,}0leq g(t)1_{{A_{t}}}leq gcirc f\,1_{{A_{t}}}leq gcirc f,
    {displaystyle g(t)mu (A_{t})=int _{X}g(t)1_{A_{t}}\,dmu leq int _{A_{t}}gcirc f\,dmu leq int _{X}gcirc f\,dmu .}g(t)mu (A_{t})=int _{X}g(t)1_{{A_{t}}}\,dmu leq int _{{A_{t}}}gcirc f\,dmu leq int _{X}gcirc f\,dmu .

    又可从马尔可夫不等式直接证明:马氏不等式说明对任意随机变量Y和正数a{displaystyle Pr(|Y|>a)leq operatorname {E} (|Y|)/a}Pr(|Y|>a)leq operatorname {E}(|Y|)/a。取{displaystyle Y=(X-mu )^{2}}Y=(X-mu )^{2}{displaystyle a=(ksigma )^{2}}a=(ksigma )^{2}

    亦可从概率论的原理和定义开始证明:

    {displaystyle Pr(|X-mu |geq ksigma )=operatorname {E} (I_{|X-mu |geq ksigma })=operatorname {E} (I_{[(X-mu )/(ksigma )]^{2}geq 1})}Pr(|X-mu |geq ksigma )=operatorname {E}(I_{{|X-mu |geq ksigma }})=operatorname {E}(I_{{[(X-mu )/(ksigma )]^{2}geq 1}})
    {displaystyle leq operatorname {E} left(left({X-mu over ksigma } ight)^{2} ight)={1 over k^{2}}{operatorname {E} ((X-mu )^{2}) over sigma ^{2}}={1 over k^{2}}.}leq operatorname {E}left(left({X-mu  over ksigma }
ight)^{2}
ight)={1 over k^{2}}{operatorname {E}((X-mu )^{2}) over sigma ^{2}}={1 over k^{2}}.

    参见[编辑]

    参考来源[编辑]

    • 《基本统计学 观念与应用二版》,林惠玲 陈正仓 著
    • 《应用统计学 第四版》 修订版,林惠玲 陈正仓 著
  • 相关阅读:
    Java MD5机密算法的使用
    JavaWeb学习总结-12 JSTL标签语言
    HTML5学习总结-09 拖放和手机触屏事件
    HTML5学习总结-08 应用缓存(Application Cache)
    HTML5学习总结-08 WebSocket 服务器推送
    软件架构阅读笔记06
    软件架构阅读笔记05
    软件架构阅读笔记04
    软件架构阅读笔记03
    软件架构阅读笔记02
  • 原文地址:https://www.cnblogs.com/bonelee/p/11054494.html
Copyright © 2020-2023  润新知