• paper 112:hellinger distance


    在概率论和统计理论中,Hellinger距离被用来度量两个概率分布的相似度。它是f散度的一种(f散度——度量两个概率分布相似度的指标)。Hellinger距离被定义成Hellinger积分的形式,这种形式由Ernst Hellinger在1909年引进。

    目录

    ·1 定义

      ·1.1 度量理论

      ·1.2 基于Lebesgue度量的概率理论

      ·1.3 离散概率分布

    ·2 性质

    ·3 例子

    1 定义

      1.1 度量理论

        为了从度量理论的角度定义Hellinger距离,我们假设P和Q是两个概率测度,并且它们对于第三个概率测度λ来说是绝对连续的,则P和Q的Hellinger距离的平方被定义如下:

    H^2(P,Q) = frac{1}{2}displaystyle int left(sqrt{frac{dP}{dlambda}} - sqrt{frac{dQ}{dlambda}}
ight)^2 dlambda.

    这里的dP /  和 dQ / dλ分别是P和Q的Radon–Nikodym微分。这里的定义是与λ无关的,因此当我们用另外一个概率测度替换λ时,只要P和Q关于它绝对连续,那么上式就不变。为了简单起见,我们通常把上式改写为:

    H^2(P,Q) = frac{1}{2}int left(sqrt{dP} - sqrt{dQ}
ight)^2.

      1.2 基于Lebesgue度量的概率理论

        为了在经典的概率论框架下定义Hellinger距离,我们通常将λ定义为Lebesgue度量,此时dP /  和 dQ / dλ就变为了我们通常所说的概率密度函数。如果我们把上述概率密度函数分别表示为 f 和 g ,那么可以用以下的积分形式表示Hellinger距离:

    frac{1}{2}int left(sqrt{f(x)} - sqrt{g(x)}
ight)^2 dx = 1 - int sqrt{f(x) g(x)} \, dx,

    上述等式可以通过展开平方项得到,注意到任何概率密度函数在其定义域上的积分为1。

    根据柯西-施瓦茨不等式(Cauchy-Schwarz inequality),Hellinger距离满足如下性质:

    0le H(P,Q) le 1.

      1.3 离散概率分布

    对于两个离散概率分布 P=(p1,p2,...,pn)和 Q=(q1,q2,...,qn),它们的Hellinger距离可以定义如下:

     H(P, Q) = frac{1}{sqrt{2}} ; sqrt{sum_{i=1}^{k} (sqrt{p_i} - sqrt{q_i})^2},

    上式可以被看作两个离散概率分布平方根向量的欧式距离,如下所示:

     H(P, Q) = frac{1}{sqrt{2}} ; |sqrt{P} - sqrt{Q} |_2 .

     

    2. 性质

    Hellinger距离的最大值1只有在如下情况下才会得到:P在Q为零的时候是非零值,而在Q为非零值的时候是零,反之亦然。

    有时公式之前的系数1/2会被省略,此时Hellinger距离的范围变为从0到2的平方根。

    Hellinger距离可以跟Bhattacharyya系数BC(P,Q)联系起来,此时它可以被定义为:

    H(P,Q) = sqrt{1 - BC(P,Q)}.

    Hellinger距离通常在顺序和渐进统计中使用。

     

    3. 例子

    两个正态分布P 和 Q的Hellinger距离的平方可以被定义为:

     H^2(P, Q) = 1 - sqrt{frac{2sigma_1sigma_2}{sigma_1^2+sigma_2^2}} \, e^{-frac{1}{4}frac{(mu_1-mu_2)^2}{sigma_1^2+sigma_2^2}} .

    两个指数分布P 和 Q的Hellinger距离的平方可被定义为:

     H^2(P, Q) = 1 - frac{2 sqrt{alpha eta}}{alpha + eta}.

    两个威利分布P 和 Q(此处k是一个形状参数,α和β是尺度系数)的Hellinger距离的平方可被定义为:

     H^2(P, Q) = 1 - frac{2 (alpha eta)^{k/2}}{alpha^{k} + eta^{k}}.

       对于两个具有参数α和β的泊松分布 P 和 Q,它们的Hellinger距离可被定义为:

     H^2(P,Q) = 1-e^{-frac{1}{2}(sqrt{alpha} - sqrt{eta})^2}.

     

    上述内容来自wikipedia

    http://en.wikipedia.org/wiki/Hellinger_distance#mw-head

  • 相关阅读:
    李洪强iOS开发之上传照片时英文改中文
    李洪强iOS开发之让您的Xcode键字如飞
    李洪强iOS开发之initWithFrame,initWithCoder和aweakFormNib
    跟我学设计模式视频教程——管擦者模式(下),责任链模式(上)
    leetcode
    POJ 3071 Football(概率DP)
    小贝_mysql数据库备份与恢复
    第2次实验——算法基本功 与 综合思考
    加密壳之ACProtect之OEP的处理
    C语言的各种位运算符的操作简述
  • 原文地址:https://www.cnblogs.com/molakejin/p/5815139.html
Copyright © 2020-2023  润新知