(感叹一下,陈希孺先生这本书真的讲的好。)
CH3 随机变量的数字特征
数学期望也常成为“均值”,即“随机变量取值的平均值”之意,这个平均是指以概率为权的加权平均。
各种分布的数学期望和方差。
如果说条件分布是变量X与Y的相依关系在概率上的完全刻画,那么,条件期望则在一个很重要的方面刻画了二者的关系,它反映了随着X取值x的变化,Y的平均变化的情况如何。统计学上,常把条件期望E(Y|x)作为x的函数成为Y对X的“回归函数”。
变量的期望,等于其条件期望的期望。E(Y)=E[E(Y|X)]。
中位数和期望值相比的一个有点是:它受个别特大或特小值的影响很小。
均值具有很多优良的性质,中位数本身所固有的某些缺点(中位数可以不唯一;离散变量可能不存在理想的“中位数”)。
方差Var(X)=E(X-EX)^2=E(X^2)-(EX)^2。
设X为随机变量,c为常数,k为正整数,则量a_k=E[(X-c)^k]称为X关于c点的k阶矩。C=0时,mu_k=E(X^k)为X的k阶原点矩;c=E(X),E[(X-EX)^k]为X的k阶中心矩。
E(X)=m1,E(Y)=m2,Var(X)=sigma_1^2,Var(Y)=sigma_2^2。E[(X-m1)(Y-m2)]为XY的协方差,并记作Cov(X, Y)。Cov(X, Y)=E(X, Y)-m1m2。
Cov(X, Y)/sigma_1sigma_2为XY的相关系数,记为Corr(X, Y)。形式上可以把相关系数视为“标准尺度下的协方差”。相关系数并不是刻画了XY之间“一般”关系的程度,而只是“线性”关系的程度。
统计学应用中,最重要的二维分布是二维正态分布。对二维正态分布而言,相关系数是XY的相关性的一个完美的刻画。
在很一般的情况下,和的极限分布就是正态分布。这一事实增加了正态分布的重要性。在概率论上,习惯于把和的分布收敛于正态分布的那一类定理都叫做“中心极限定理”。
大数定理和中心极限定理。