6.4.2020 updated:
现在回看了一下当时自己…哎……
整半天原来可以直接调用已有结论……加在文末了……
提出问题
有 (n) 个互相独立的 (0) 至 (1) 之间等概率生成的随机变量,求从小到大排序后第 (i) 个数的数值期望
一个简化的问题
我们先来求解一个简化的问题:最大值的数值期望是多少?
我们会发现,由于这些变量都是在 (0) 到 (1) 之间等概率生成的,所以一个变量小于等于 (x) 的概率为 (x)(即 (P(x_0leq x)=x)),则这 (n) 个数中最大值为 (x) 的概率为 (x^{n-1})(其他 (n-1) 个变量都小于等于 (x))
再考虑到有 (n) 个数都有可能成为最大值,所以最后答案还要再乘(inom n1)(实际上这个组合数应该放在原式的概率函数 (p(x)) 里的,但为了表达方便,我们将这个组合数提到最外面最后进行计算,后面的运算也是如此)
由于期望的计算公式为
套到这题里就是
乘上组合数,得到这个简化问题的答案为 (frac n{n+1})
扩展
我们现在求得了最大值(第 (n) 个数)的数值期望为 (frac n{n+1}),同理可以计算出最小数(第 (1) 个数)的数值期望为 (frac 1{n+1}),由期望的线性性大胆猜想第 (i) 个数的数值期望为 (frac i{n+1})
下面来证明这个式子
类比上面求最大值的解法,我们可以很容易地列出我们需要的式子
(第 (i) 个数为 (x) 的概率为前 (i-1) 个数都小于等于 (x),后 (n-i) 个数都大于等于 (x),则概率为 (x^{i-1}cdot (1-x)^{n-i}))
这个式子在最后还要乘一个 (ncdot inom {n-1}{i-1})((n) 个数都有可能成为第 (i) 个数,还要再选出小于等于 (x) 的 (i-1) 个数)
我们列出了式子,但这个式子并不像 (x^n) 这样好积分;为此,我们考虑分部积分:
积分
明确目标,我们要求
代 (egin{cases}u=(1-x)^{n-i}\v'=x^iend{cases})
则原式即为
由于 (uv) 在 (x=0) 或 (1) 时都为零,则只需要考虑后面的式子即可:
数列
发现这个式子和原式长得很像,可以对比一下:
设 (a_i=int_0^1 x^i(1-x)^{n-i}cdot mathrm dx),则可以得到一个有趣的递推式 (a_i=frac {n-i}{i+1}cdot a_{i+1}),而边界条件即为一开始证明的式子 (a_n=frac n{n+1})
从而可以得到 (a_i) 的通项公式 (a_i=frac {i!(n-i)!}{(n+1)!})
所以前面那一长溜的积分式,可以化简为 (frac {i!(n-i)!}{(n+1)!})
最后不要忘记之前提取出来的组合系数 (ncdot inom {n-1}{i-1})
解得的答案为 (frac {i!(n-i)!}{(n+1)!}cdot ncdot inom {n-1}{i-1}=frac i{n+1})
猜想得证
结论
有 (n) 个互相独立的 (0) 至 (1) 之间等概率生成的随机变量,求从小到大排序后第 (i) 个数的数值期望为 (frac i{n+1})
可以推广,若变量的生成范围为 ([l,r]),则第 (i) 小数的数值期望为 (l+frac {icdot(r-l)}{n+1})
最近加了友链的一位同学知道一个比较简单的组合解释,果真还是老了啊
updated:(Gamma) 函数与 (B) 函数
上面整这半天实际上可以用已有结论:
引入 (Gamma) 函数与 (Beta) 函数:
有几个结论:
- (Gamma(1)=1) 且 (Gamma(x+1)=xGamma(x)),故 (Gamma(x+1)=x!(xin mathbb Z))
- (B(x,y)=frac {Gamma(x)Gamma(y)}{Gamma(x+y)})
然后考虑到之前关键求的是
然后直接套结论就好了……还是数学没学好的说……(不过问了好几位dalao都没人提这玩意TAT)