• PGF 概率生成函数 Probability generating function


    note 前半部分是Analytic Combinatorics by Philippe Flajolet, Robert Sedgewick的
    III.2. Bivariate generating functions and probability distributions 这一节的笔记

    note 2020-09-17 19:12 增加了《具体数学》里的PGF部分

    随机结构举例 two classical combinatorial distributions

    image-20200828224657280

    PGF Probability generating functions定义

    [p(u)=sum_{k} mathbb{P}(X=k) u^{k} ]

    当然,能从BGF推到PGF

    image-20200828222912922

    矩 Moments

    The (power) moments are (r阶矩定义)

    [mathbb{E}left(X^{r} ight):=sum_{k} mathbb{P}{X=k} cdot k^{r} ]

    The factorial moment defined for order r as (r order-阶乘矩定义)

    [E[X(X-1) cdots(X-r+1)] ]

    从BGFs 推到 Moments

    image-20200828225651320

    例题

    二项分布的r order-阶乘矩

    [f_{n,k}=inom{n}{k} ]

    先算出OBGF

    [W(z,u)=frac{1}{1-z-zu} ]

    算出对(u)(r)阶偏导,再取(u=1)

    [left.frac{partial^{r}}{partial u^{r}} W(z, u) ight|_{u=1}=frac{r ! z^{r}}{(1-2 z)^{r+1}}=frac{r ! (2z)^{r}}{2^r(1-2 z)^{r+1}} ]

    ([z^n])反演得到【以(n)为变量,(r)为参数的某表达式】 (分子)

    [left.left[z^{n} ight] partial_{u}^{r} W(z, u) ight|_{u=1}=frac{r!}{2^r}inom{n}{r}2^n ]

    (W(z,1))([z^n])反演得到 (分母)

    [left[z^{n} ight] W(z, 1)=[z^n]frac{1}{1-2z}=2^n ]

    分子分母代入这个公式,得到r order-阶乘矩

    [mathbb{E}_{mathcal{A}_{n}}(chi(chi-1) cdots(chi-r+1))=frac{left.left[z^{n} ight] partial_{u}^{r} A(z, u) ight|_{u=1}}{left[z^{n} ight] A(z, 1)}=frac{r!}{2^r}inom{n}{r} ]

    接着没事可以算算期望,方差

    期望(1 order-阶乘矩)

    [mathbb{E}_{mathcal{A}_{n}}(chi)=frac{n}{2} ]

    用公式(mathbb{E}_{mathcal{A}_{n}}left(chi^{2} ight)=frac{left.left[z^{n} ight] partial_{u}^{2} A(z, u) ight|_{u=1}}{left[z^{n} ight] A(z, 1)}+frac{left.left[z^{n} ight] partial_{u} A(z, u) ight|_{u=1}}{left[z^{n} ight] A(z, 1)})得到二次矩

    [mathbb{E}_{mathcal{A}_{n}}(chi^2)=frac{n(n-1)}{4}+frac{n}{2}=frac{n(n+1)}{4} ]

    使用方差公式(mathbb{V}(X)=mathbb{E}left(X^{2} ight)-mathbb{E}(X)^{2})得到方差

    [mathbb{V}(chi)=frac{n(n+1)}{4}-frac{n^2}{4}=frac{n}{4} ]

    附录

    下面的内容来自《具体数学》中概率生成函数小节

    为什么要使用概率生成函数?(G(z)=sum Pr(X=k)z^k)

    一大长处是可以简化均值和方差的计算。(嗯这两个公式挺好证的,把右边展开成和式)

    [Mean(G)=G'(1)\ Var(G)=G''(1)+G'(1)-G'(1)^2\ E[G^2]=G''(1)+G'(1) ]

    第二大长处是:在许多重要的情形,它们都是(z)的比较简单的函数

    第三大长处是:概率生成函数的乘积对应于(相互独立的)随机变量之和

    然后有意思的是引入了累积量,和多阶矩、r-order阶乘矩很是像,都是数字特征里更加“高次”的东西。

    定义(kappa_i)是累积量,由下面的公式给出。由此定义式可见看出,由于【对数变乘为加】以及【概率生成函数的乘积对应于随机变量之和】,所以:独立随机变量之和的所有累积量也可由原来的对应累积量相加得到。

    [ln G(e^t)=frac{kappa_1}{1!}t+frac{kappa_2}{2!}t^2+frac{kappa_3}{3!}t^3+frac{kappa_4}{4!}t^4+dots ]

    定义(alpha_m)是阶乘矩(alpha_m=E[X(X-1) cdots(X-m+1)])

    定义(mu_m)(m)阶矩,(mu_m=E[X^m])

    把PGF (G(e^t))各种改写,比对系数,得到这三个“高次量”的相互转换

    (kappa_i)(G(e^t)) (把累计量的定义式取指数)

    [G(e^t)=1+frac{frac{kappa_1}{1!}t+frac{kappa_2}{2!}t^2+dots}{1!}+frac{(frac{kappa_1}{1!}t+frac{kappa_2}{2!}t^2+dots)^2}{2!}+dots ]

    (mu_m)

    [egin{aligned} G(e^t)=sumlimits_{kgeq 0}Pr(X=k)e^{kt}&=sumlimits_{k,mgeq 0}Pr(X=k)k^mcdotfrac{t^m}{m!}\ &=1+frac{mu_1}{1!}t+frac{mu_2}{2!}t^2+frac{mu_3}{3!}t^3+dots end{aligned} ]

    (alpha_m)

    因为

    [egin{aligned} G(1+t)&=G(1)+frac{G'(1)}{1!}t+frac{G''(1)}{2!}t^2+cdots\ &=1+frac{alpha_1}{1!}t+frac{alpha_2}{2!}t^2+cdots end{aligned} ]

    于是

    [egin{aligned} G(e^t)&=1+frac{alpha_1}{1!}(e^t-1)+frac{alpha_2}{2!}(e^t-1)^2+cdots\ &=1+frac{alpha_1}{1!}(t+frac{t^2}{2}+...)+frac{alpha_2}{2!}(t^2+t^3+...)+cdots end{aligned} ]

  • 相关阅读:
    day7 反射
    day7 面向对象进阶
    day7 面向对象class()学习
    day6 subprocess模块、logging模块
    day6 hashlib模块
    day6 ConfigParser模块 yaml模块
    day6 xml文件格式的处理
    day6 shelve模块
    day6 SYS模块
    Servlet的学习之Response响应对象(1)
  • 原文地址:https://www.cnblogs.com/yhm138/p/13580306.html
Copyright © 2020-2023  润新知