• 关于证明一个概率事件的期望次数


    引入问题

    如果一个事件 (X)(p in [0, 1]) 的概率成功,那么就有 (1-p) 的概率失败,如果失败了就再次执行 (X) 事件。问 (X) 事件期望的操作次数。

    问题求解与证明

    因为 (p = 0) 的时候,不存在成功的情况,所以不进行考虑。

    对于 (p in (0, 1]) 的时候,很容易知道期望的操作次数是 (displaystyle frac{1}{p}) ,那如何证明呢?

    无限和式

    有一种很显然易见的解决办法就是无限和式。

    考虑枚举在第几次成功了,那么贡献如下。

    [egin{align} E_{X} &= sum_{i = 0}^{infty} (1 - p)^i~p ~(i + 1) \ &= p~[sum_{i = 0}^{infty} (1 - p)^i~(i + 1)] end{align} ]

    不难发现 ((1 - p) in [0, 1)) 所以这个序列是一个收敛到 (0) 的无穷序列(因为 (i + 1) 的增长速度远小与 ((1 - p)^i) 的减小速度)

    然后考虑这个式子如何求和,依然是扰动法。

    [egin{align} S=sum_{i = 0}^{infty} (1 - p)^i~(i + 1) end{align} ]

    那么有

    [egin{align} (1 - p)S&=sum_{i = 1}^{infty} (1 - p)^i~i\ &=sum_{i = 1}^{infty} (1 - p)^i~(i + 1) - sum_{i = 1}^{infty} (1 - p)^i end{align} ]

    所以只需要求出

    [egin{align} T&=sum_{i = 1}^{infty} (1 - p)^i\ end{align} ]

    这个也是很容易通过扰动法求出的。(也可以套公式,然后 (a_{infty} ightarrow 0) 所以直接忽略就行)

    [egin{align} (1 - p)T&=sum_{i = 2}^{infty} (1 - p)^i\ end{align} ]

    ((6) - (7)) 就有

    [egin{align} pT&=1 - p\ T&=frac{1 - p}{p} end{align} ]

    然后 ((3)-(5)) 就变为

    [egin{align} pS&=1 + frac{1 - p}{p} \ p^2S &= p + 1 - p\ S &= frac{1}{p^2} end{align} ]

    所以最后的 (E_{X})(displaystyle p imes frac{1}{p^2} = frac{1}{p}) ,证毕。

    根据期望方程求解

    Hometown 告诉了我一个很巧妙且简短的做法。

    可以设出一个期望方程为

    [egin{align} E_X = p + (1 - p)(E_X + 1) end{align} ]

    其意义为有 (p) 的概率直接在这步成功,剩下 (1 - p) 的概率失败,需要花费 (E_X + 1) 的期望成功。

    那么就有

    [egin{align} E_X &= p + E_X + 1 - pE_X - p\ E_X &= frac{1}{p} end{align} ]

    所以结论成立,证毕。

    概率生成函数

    看了 ( ext{YMDrangon}) 论文后,意识到这个问题其实就是个经典的掷骰子问题,可以利用概率生成函数解决。

    (f_i) 为结束时尝试了 (i) 次的概率,其概率生成函数为 (F(i)) 。令辅助数列 (g_i) 为随机序列长度达到 (i) 还未结束的概率,其普通生成函数为 (G(i))

    [egin{align} F(x) + G(x) &= 1 + xG(x)\ G(x) (px) &= F(x) end{align} ]

    然后我们把 ((16)) 两边求导并代入 (x = 1)(F'(1) = G(1)) ,同样把 (x = 1) 代入 ((17))(displaystyle F'(1) = G(1) = frac{1}{p}) ,得证。

    总结

    其实不仅仅是针对这个经典模型来说,对于大部分无限期望的模型这两种方法依然成立。

    第一种方法,需要较为细致的数学推理以及对于无限和式的求值方法的掌握。

    第二种求法,只需要精巧的列出方程求解就行了。

    第三种求法,对于所有的掷骰子模型都有较大作用,并且扩展性较大比较推荐。

    其实我就只是复习了一下无限和式的推导方法而已。。。数学课上无聊随便推了一下。。

    其实不会证明,大概率也是可以猜出结论的。

    无限期望 or 概率如果是收敛的话,常常最后的表达式通常是十分精巧的,能用这三种方法进行推导和证明。

  • 相关阅读:
    正则化方法:L1和L2 regularization、数据集扩增、dropout
    如何估算深度神经网络的最优学习率
    机器学习算法中如何选取超参数:学习速率、正则项系数、minibatch size
    leetcode 389. Find the Difference
    python导入模块
    如何选择正确的激活函数?
    leetcode 690. Employee Importance——本质上就是tree的DFS和BFS
    leetcode 258. Add Digits——我擦,这种要你O(1)时间搞定的必然是观察规律,总结一个公式哇
    leetcode 520. Detect Capital
    滴滴快车奖励政策,高峰奖励,翻倍奖励,按成交率,指派单数分级(12月21日)
  • 原文地址:https://www.cnblogs.com/zjp-shadow/p/10009548.html
Copyright © 2020-2023  润新知