• 数字特征:方差


    【引入】

    有一批灯泡,知其平均寿命是 $E(X)=1000$ (小时)。仅由这一指标我们还不能判定这批灯泡的质量好坏。

    事实上,有可能其中绝大部分灯泡的寿命都在950~1050小时;

    也有可能其中约有一半是高质量的,它们的寿命大约有1300小时,另一半却是质量很差的,其寿命大约只有700小时,

    为要评定这批灯泡质量的好坏,还需进一步考察灯泡的寿命 $X$ 与其平均值 $E(X)=1000$ 的偏离程度。

    若偏离程度较小,表示质量比较稳定。从这个意义上来说,我们认为质量较好。  

    前面也曾提到在检验棉花的质量时,既要注意纤维的平均长度,还要注意纤维长度与平均长度的偏离程度。

    由此可见,研究随机变量与其构成的偏离程度是必要的。

    那么,用怎样的量去度量这个偏离程度呢?

    容易看到 $E{ |X-E(X)|}$ 能度量随机变量与其均值 $E(X)$ 的偏离程度,

    但由于上式带有绝对值,运算不方便,为运算方便起见,通常用量 $E{ [X-E(X)]^2}$ 来度量随机变量X与其均值 $E(X)$ 的偏离程度。

    【定义】

    设 $X$ 是一个随机变量,若 $E{ [X-E(X)]^2}$ 存在,则称 $E{ [X-E(X)]^2}$ 为 $X$ 的方差,记为 $D(X)$ 或 $Var(X)$,

    $$D(X)=Var(X)=E{ [X-E(X)]^2} ag{2.1}$$

    在应用上还引入量 $sqrt{D(X)}$ ,记为 $sigma (X)$ ,称为标准差或均方差。

    【含义】

    按定义,随机变量 $X$ 的方差表达了 $X$ 的取值与其数学期望的偏离程度。

    若 $D(X)$ 较小意味着 $X$ 的取值比较集中在 $E(X)$ 的附近,反之,若 $D(X)$ 较大则表示 $X$ 的取值较分散。

    因此, $D(X)$ 是刻画 $X$  取值分散程度的一个量,它是衡量 $X$ 取值分散程度的一个尺度。

    【定义】

    由定义知,方差实际上就是随机变量 $X$ 的函数 $g(X)=(X-E(X))^2$ 的数学期望。

    于是对于离散型随机变量,按(1.3)式有

    $$D(X)=sum_{k=1}^{infty}[x_k-E(X)]^2p_k ag{2.2}$$

    其中,$P{ X=x_k}=p_k,k=1,2,…$ 是 $X$ 的分布律

    对于连续型随机变量,按(1.4)式有

    $$D(X)=int_{-infty}^{infty}[x-E(X)]^2f(x)dx ag{2.3}$$

    其中 $f(x)$ 是 $X$ 的概率密度

    【计算】

    随机变量 $X$ 的方差可按下列公式计算

    $$D(X)=E(X^2)-[E(X)]^2 ag{2.4}$$

    证:(省略,日后再补)

    【例1】标准化变量

     设随机变量 $X$ 具有数学期望 $E(X)=mu$ ,方差 $D(X)=sigma ^2 eq 0$ 。

    $$X^*=frac{X-mu}{sigma}$$

    $$E(X^*)=frac{1}{sigma}E(X-mu)=frac{1}{sigma}[E(X)-mu ]=0;$$

    $$D(X^*)=E(X^*)-[E(X^*)]^2=E[(frac{X-mu}{sigma})^2]$$

    $$=frac{1}{sigma ^2}E[(X-mu )^2]=frac{sigma ^2}{sigma ^2}=1$$

    即 $X^*=frac{X-mu}{sigma}$ 的数学期望为0,方差为1. $X^*$ 称为 $X$ 的标准化变量。

    【例2】(离散)(0-1)分布

    设随机变量 $X$ 具有(0-1)分布,其分布律为 $P{ X=0} =1-p,quad P{ X=1}=p$ ,求 $D(X)$ 。

    解:

    $$E(X)=0·(1-p)+1·p=p$$

    $$E(X^2)=o^2·(1-p)+1^2·p=p$$

    由(2.4)式,

    $$D(X)=E(X^2)-[E(x)]^2=p-p^2=p(1-p)$$

    【例3】(离散)泊松分布

    设随机变量 $Xsim pi (lambda)$,求 $D(X)$

    解:随机变量 $X$ 的分布律为

    $$P { X=k} =frac{lambda ^ke^{-lambda}}{k!},k=0,1,2,…,lambda >0$$

    上节【例6】已算得 $E(X)=lambda$ ,而

    $$E(X^2)=E[X(X-1)+X]=E[X(X-1)]+E(X)qquad qquad qquad quad $$

    $$=sumlimits_{k=0}^{infty}k(k-1)frac{lambda ^ke^{}-lambda}{k!}+lambda=lambda^2e^{-lambda}sumlimits_{k=2}^{infty}frac{lambda^{k-2}}{(k-2)!}+lambda$$

    $$=lambda^2e^{-lambda}e^{lambda}+lambda=lambda^2+lambdaqquad qquad qquad qquad qquad qquad $$

    所以方差

    $$D(X)=E(X^2)-[E(X)]^2=lambda^2+lambda-lambda^2=lambda$$

    由此可知,泊松分布的数学期望与方差相等,都等于参数 $lambda$

    因为泊松分布只包含一个参数 $lambda$ 只要知道它的数学期望和方差就能完全确定它的分布了。

    【例4】(连续)均匀分布

    设随机变量 $Xsim U(a,b)$,求 $D(X)$

    解:$X$ 的概率密度为

    $$f(x)=egin{cases}frac{1}{b-a},& extrm{a<x<b}\ 0,& extrm{其他}end{cases}$$

    上节【例7】已算得 $E(X)=frac{a+b}{2}$,方差为

    $$D(X)=E(X^2)-[E(X)]^2$$

    $$=int_{a}^{b}x^2frac{1}{b-a}dx-(frac{a+b}{2})^2=frac{(b-a)^2}{12}$$

    【例5】(连续)指数分布

    设随机变量 $X$ 服从指数分布,其概率密度为

    $$f(x)=egin{cases}frac{1}{ heta}e^{1frac{-x}{ heta}},& extrm{x>0}\ 0,& textrm{xleq 0}end{cases}$$

    其中 $ heta >0$,求 $E(X),D(X)$ 。

    解:

    $$E(X)=int_{-infty}^{infty}xf(x)dx=int_{0}^{infty}e^{frac{-x}{ heta}}dx$$

    $$=left .-xe^{frac{-x}{ heta}} ight |_{0}^{infty}+int_{0}^{infty}e^{frac{-x}{ heta}}dx= heta$$

    $$$$


    方差的性质

    1.设 $C$ 是常数,则 $D(C)=0$ 

    证:

    2.设 $X$ 是随机变量,$C$ 是常数,则有 $D(CX)=C^2D(X),qquad D(X+C)=D(X)$

    证:

    3.设 $X,Y$ 是两个随机变量,则有 $D(X+Y)=D(X)+D(Y)+2E{ (X-E(X)(Y-E(Y)))} ag{2.5}$

    特别,若 $X,Y$ 相互独立,则有 $D(X+Y)=D(X)+D(Y) ag{2.6}$

    这一性质可以推广到任意有限多个相互独立的随机变量之和的情况。

    证:

    4. $D(X)=0$ 的充要条件是 $X$ 以概率1取常数 $E(X)$ ,即 $P{ X=E(X)} =1$

    证:

    【例6】(离散)二项分布

    【例7】(连续)正态分布

    【例8】

    【定理】切比雪夫不等式

    证:(省略,日后再补)

  • 相关阅读:
    NPOI导出Excel时出现错误“Maximum column number is 255”
    如何快速访问MSDN某一个类或方法的帮助文档
    beyond compare 比较Xls文件时只显示有差异的列
    Java并发编程:Callable、Future和FutureTask
    JAVA多线程实现的三种方式
    ReentrantReadWriteLock类和ReentrantLock类的区别
    Java多线程之Lock的使用
    MySQL中select * for update锁表的问题
    锁表 for update
    spring事物配置,声明式事务管理和基于@Transactional注解的使用
  • 原文地址:https://www.cnblogs.com/ForTech/p/8605247.html
Copyright © 2020-2023  润新知