联合分布
部分公式是自己推导的,有不对的地方请说出来
QAQ
离散随机变量
假设 (X) 和 (Y) 是定义在同一样本空间上的离散随机变量,它们的联合频率函数是 (p(x_i, y_i) = P(X=x_i, Y = y_i))。
(P_X(x) = sum_i p(x, y_i)) 为 (X) 的边际频率函数,(P_Y) 的定义类似。
连续随机变量
假设 (X) 和 (Y) 是具有累积分布函数 (F(x, y)) 的连续型随机变量,它们的联合密度函数是两变量的分段连续函数。
(F(x, y) = int_{-infty}^x int_{-infty}^y f(u, v)dvdu)。
那么在导数定义存在的情况下,(f(x, y) = frac{partial^2}{partial x partial y} F(x, y))。
((X, Y)) 落入 ((x, y)) 的较小邻域概率与 (f(x, y)) 成比例:(P(xleq X leq x+dx, yleq Y leq y+dy)=f(x, y)dxdy)。
(X) 的边际累积分布函数: (F_X(x) = P(Xleq x) = int_{-infty}^x int_{-infty}^{+infty}f(u, y)dydu)。
(X) 的边际密度函数为:(f_X(x) = F_X'(x) = int_{-infty}^{+infty}f(x, y)dy)。
独立随机变量
定义
随机变量 (X_1,dots,X_n) 称为独立的,如果 (forall x_i),它们联合累积分布函数可分解成各自边际累积分布函数之积 (F(x_1,dots,x_n) = prod F(X_i)),该定义对离散型和连续型随机变量都是成立的。
对于离散型随机变量,等价的叙述为:分解联合频率函数。
对于连续型随机变量,等价的叙述为:分解联合密度函数。
条件分布
离散情形
如果 (X) 和 (Y) 是离散随机变量,给定 (Y=y_j) 的情况下 (X=x_i) 的条件概率是:如果 (p_Y(y_j)>0),那么
也可以重新表述为:
连续情形
如果 (f_Y(y)>0),那么
否则为 (0)。
联合分布随机变量函数
首先考虑一些重要的特殊情形:
和与商
和
对于离散形式,设 (X,Y) 为离散型随机变量,具有联合频率函数 (p(x, y)),令 (Z = X+Y),那么 (Z) 的频率函数为:
这个和称为序列 (p_X,p_Y) 的卷积。
对于连续形式,设 (X,Y) 为连续型随机变量,我们首先计算 (Z=X+Y) 的累积分布函数 (F_Z)。
(int_{-infty}^{+infty} f(x, v-x)dx) 可以看作是 (g(v))(关于 (v) 的函数)。
那么 (f_Z(z) = int_{-infty}^{+infty} f(x, z-x)dx)。
如果 (X,Y) 独立,那么 (f_Z(z) = int_{-infty}^{+infty} f_X(x) f_Y(z-x)dx)
商
下考虑两个随机变量的商。
(Z = Y/X),推导的方式类似于上述和的推导方式可以得到结果,这里采取另一种方法:利用二重积分的变量替换。
令:
那么有:
(F_Z(z) = int_{-infty}^{z} int_{-infty}^{+infty} f(v, uv)|J|dvdu)
其中 (J = frac{partial (x, y)}{partial (u, v)}),这里的 (|J|) 是 (J) 的绝对值。
化简即可得到 (F_Z(z) = int_{-infty}^{z} int_{-infty}^{+infty} |x|f(x, xv)dxdv)
因此 (f_Z(z) = int_{-infty}^{+infty} |x|f(x, xz)dx)
如果 (X,Y) 独立,(f_Z(z) = int_{-infty}^{+infty} |x|f_X(x) f_Y(xz)dx)。
一般情形
利用类似于上面使用雅可比行列式求随机变量的商的方法,我们可以得到多个随机变量函数的一般情形。
假设 (X,Y) 是连续型随机变量,通过 (g_1,g_2) 投影到 (U,V) 上:(u=g_1(x, y),v=g_2(x, y))。
同时存在逆变换 (x=h_1(u, v),y=h_2(u, v)),那么有
不难注意到这个公式和一维公式的形式是非常接近的。
极值与顺序统计量
假设 (X_1,dots,X_n) 是具有密度 (f(x)) 的独立连续型随机变量,对 (X_i) 排序,记 (X_{(1)}<dots<X_{(n)}) 为顺序统计量,现求 (X_{(k)}) 的密度函数 (f_{k}(x))。
用先求分布函数然后微分的方法比较复杂。
因为分布函数为 (F_k(x) = sum_{i=k}^n C_n^i[F(x)]^i[1-F(x)]^{n-i})。
然后接下来我不会化了
注意到事件(已排列好) (xleq X_{(k)} leq x+dx) 发生的概率为:
因此密度函数为:
至于极值(极大值、极小值)的密度函数便分别为上式 (k=n,1) 的结果。