1. Gamma函数
1.1 Gamma函数
Gamma函数如下:
很奇怪,但可以形象理解为用一个伽马刀,对 动了一刀,于是指数为 ,动完刀需要扶着梯子 才能走下来(记忆,摘自QUETAL博客)。
通过分布积分可以得到如下性质:
易证明有如下性质:
其中还有几个重要的等式,这里就不证明了,有兴趣的可以查找相关资料:
1.2 Gamma函数可视化
import numpy as np from scipy.special import gamma import matplotlib.pyplot as plt import pylab fig = plt.figure(figsize=(12,8)) # The Gamma function x = np.linspace(-5, 5, 1000) plt.plot(x, gamma(x), ls='-', c='k', label='$Gamma(x)$') # (x-1)! for x = 1, 2, ..., 6 x2 = np.linspace(1,6,6) y = np.array([1, 1, 2, 6, 24, 120]) pylab.plot(x2, y, marker='*', markersize=12, markeredgecolor='r', markerfacecolor='r', ls='',c='r', label='$(x-1)!$') plt.title('Gamma Function') plt.ylim(-50,50) plt.xlim(-5, 5) plt.xlabel('$x$') plt.legend() plt.show()
fig = plt.figure(figsize=(12,8)) # The Gamma function x = np.linspace(0, 15, 1000) plt.plot(x, np.log(gamma(x)), ls='-', c='k', label='$logGamma(x)$') plt.title('Log$Gamma(x)$ Function') plt.ylim(-1,50) plt.xlim(-1, 15) plt.xlabel('$x$') plt.legend() plt.show()
如下函数被称为Digamma函数:
Digamma函数具有如下性质:
1.3 从二项分布到Gamma函数
对Gamma函数做个变形,可以得到如下式子:
取积分中的函数作为概率密度,就得到一个简单的Gamma分布的密度函数:
如果做一个变换 ,就得到Gamma分布的更一般形式:
其中 称为shape parameter,主要决定了分布曲线的形状,而 称为rate parameter或inverse scale parameter( scale parameter),主要决定曲线有多陡。
import numpy as np from scipy.stats import gamma from matplotlib import pyplot as plt alpha_values = [1, 2, 3, 3, 3] beta_values = [0.5, 0.5, 0.5, 1, 2] color = ['b','r','g','y','m'] x = np.linspace(1E-6, 10, 1000) fig, ax = plt.subplots(figsize=(12, 8)) for k, t, c in zip(alpha_values, beta_values, color): dist = gamma(k, 0, t) plt.plot(x, dist.pdf(x), c=c, label=r'$alpha=%.1f, heta=%.1f$' % (k, t)) plt.xlim(0, 10) plt.ylim(0, 2) plt.xlabel('$x$') plt.ylabel(r'$p(x|alpha,eta)$') plt.title('Gamma Distribution') plt.legend(loc=0) plt.show()
可以发现Gamma分布的概率密度和Poisson分布在数学上的形式具有高度的一致性。参数 的Poisson分布,概率为:
而在Gamma分布的密度函数中取 ,可以得到:
可以看到这两个分布在数学形式上是一致的,只是Poisson分布式离散的,Gamma分布式连续的,可以直观认为,Gamma分布式是Poisson分布在正实数集上连续化版本。
我们在概率论与数理统计的课程中都学过, 分布可以看成是二项分布 在 条件下的极限分布:
二项分布也满足下面一个奇妙的等式:
这个分布式反应二项分布和 分布的关系,证明后面再讲。
我们在右等式做个变换
上式左侧是二项分布 ,而右侧为无穷多个二项分布 的积分求和,所以可以写为
对两边在条件 条件下取极限,则左边有 ,而右边有 ,所以得到:
把Poisson分布展开,于是得到:
此为Poisson-Gamma duality.
我们对上式两边取极限 ,左边是Poisson至多发生 事件的概率, 的时候就不可能有事件再发生了,故 ,于是:
该积分式子说明 在实数集上是一个概率分布函数,而这个函数恰好就是Gamma分布。我们继续把上式右边中的 移到左边,于是得到:
于是我们得到了将 表示为积分的方法。
我们将 进行变换下:
我们可以看到,Poisson分布的概率密度累积函数和Gamma分布的概率密度累积函数有互补的关系。
做个小结:我们从二项分布的等式出发,同时利用二项分布的极限是Poisson分布,推导出了Gamma分布,同时把 表示成积分形式了。