• 概率笔记6——多维随机变量


      和其它问题一样,概率也可能同时受到多个条件的影响,例如考察某地区中学生的身体素质,随机地选取一名学生,观察学生的身高 X,体重 Y 和肺活量 Z 等指标。随机变量 X,Y,Z 来自同一样本空间,它们的取值可能相互影响。像这样同时考虑的多个随机变量,称为多维随机变量。本章以二维随机变量为例,介绍多维随机变量的相关概念。

    联合分布

      和一维变量的概率分布类似,联合分布把舞台扩展到了多维,这里的“联合”就是多个随机变量的意思。

      假设一个事件受到两个变量x和y的影响,它的联合分布定义为:

      其中X表示具体的取值,x表示变量。

      上一章提到过,分布是指概率的累加,是把事件映射为数字,一个二维联合分布的变量取值范围是整个二维平面,但F(x,y)的取值范围是0~1。

    离散型

    联合概率

      联合概率指的是包含多个条件且所有条件同时成立的概率,也叫联合分布率。

      用xi和yj的两个随机变量所有可能的取值,P(X=xi, Y=yj)表示在X=xi和Y=yj下事件发生的概率。设P(X=xi, Y=yj)=pij,则下表是二维离散型随机变量(X, Y)的联合概率:

      联合分布率实际上是一个矩阵。既然是概率,联合概率也满足下面两个条件:

    联合分布

      一维随机变量的分布函数:

      二维随机变量的分布函数:

      其中:

      分布函数和分布略有区别,“分布”是指累加概率,“分布函数”是将累加概率函数化。F(x,y)=P{X≤x,Y≤y}是分布函数,它的值是所有在X≤x,Y≤y下的概率分布。

    边缘分布

      先看表1的第一行,它固定了x=x1,此时在表格右侧加入一列:

      p1·表示x的取值固定,y取任意值时的概率分布,即:

      由于p1·是写在表格的边缘,所以称为x=x1的边缘分布。对于任意行来说:

      这实际上是在表示X= xi时事件发生的概率。类似的,y=yj的边缘分布是:

    条件概率

      条件概率是指在A事件发生的条件下,事件B发生的概率,表示为P(B|A),它有一个重要公式:

      多维随机变量的条件概率公式与此类似,在Y=yj 条件下X=xi的概率:

    独立性

      对于二维离散型随机变量(X, Y)来说,如果满足:

      那么这两个随机变量之间是没有相互影响的,称X和Y之间互相独立。反过来也一样,如果满足了独立性,那么必然有上式的关系。

    连续型

      由于是连续型变量,所以无法像离散型变量那样简单地计算在某一点的概率(概率可以表示为几何度量,点的度量是0,因此算某一点的概率也是0,或者说计算点的概率没有意义),只能计算某一取值范围内的概率,也就是概率分布(概率的累加)。

    联合概率密度函数和联合分布

      某个地区的人口密度越大,这个地区的人口越多。同样的,概率密度越大,说明这个区域的发生某件事的概率越大。

      设F(x,y)是二维连续型随机变量(X,Y)的联合分布函数,如果存在一个非负函数f(x,y),对于任意实数x,y,有:

      则称f(x,y)是二维连续型随机变量(X,Y)的联合概率密度函数。

      u和v在计算后定积分后会被x和y代替。可以对比上一章中一维随机变量的分布函数来理解F(x,y)。概率分布是概率的累加,而累加正好是积分的定义。在几何上,F(x,y)表示了曲面柱体的体积:

      假设在R区域上,x1<x<x2, y1<y<y2,那么该区域上的概率分布是:

      dydx是R上的面积积元,它是面积无限接近0的小矩形,但不是0。至此,概率和多重积分联系到一起。上式中没有u和v,这是由于已经确定了x和y的取值范围,且f本来就是关于x和y的函数,因此没必要再引入u和v。如果非要使用u和v,那么上式等价于:

      由于F是分布函数,因此在整个定义域上满足:

    边缘分布和边缘密度函数

      联合分布表达的是二维随机变量(X, Y)的整体分布,同时X和Y也有各自的边缘分布。与离散型类似,连续型随机变量的边缘分布是只认为有一个变量,其它变量都看作常量。

      X的边缘分布,表示将x看作常量,不管Y的取值:

      Y的边缘分布,表示将y看作常量,不管x的取值:

      设(X, Y)的联合密度函数是f(x,y),那么(X, Y)的联合分布可以表示为:

      X的边缘分布限定了X的取值是X≤x,y可以取任意值,此时X的边缘分布可以写成:

      分布代表了累加,连续型分布是用积分表示的,FX(x)表示P{X≤x, Y<∞}的累加,是对dx的积分,因此X的边缘分布的密度函数是上式的内积分:

      把u,v换成x,y,X的边缘分布的密度函数是:

      类似的,Y的边缘分布的密度函数是:

    条件分布和条件密度函数

      条件概率公式:

      对于连续型变量来说,单点的概率没有意义,因此将上式推广到连续型随机变量后就变成了“分布”,比如给定Y值的条件下X的概率分布。

      设(X, Y)的联合密度函数是f(x,y),边缘密度函数是fX(x)和fY(y),如果固定x,则称下式为X=x条件下Y的概率密度:

      同样,Y=y条件下X的概率密度:

      有了概率密度,自然可以求得相应的分布,给定Y值的条件下X的概率分布:

    独立性

      对于二维连续型随机变量(X, Y)来说,如果满足:

      那么这两个随机变量之间是没有相互影响的,称X和Y之间互相独立。反过来也一样,如果满足了独立性,那么必然有上式的关系。

    二维均匀分布

      设R是平面上的有界区域,面积为A,若二维随机变量(X,Y)具有概率密度:

      则称(X, Y)在R上服从均匀分布。

      如果在R区域上x在x1<x<x2上服从均匀分布,那么X在x1<x<x2的边缘分布的密度函数是:

      若(X, Y) 服从R区域上的均匀分布,则对于R上的任一子区域D,都有:

      上式实际上是在说,如果(X,Y)在某个区域内服从均匀分布,则意味着(X,Y)在该区域内具有“等可能”性。

    二维正态分布

      若二维随机变量(X,Y)具有概率密度:

      则称(X,Y)服从参数为 的二维正态分布,记作:

      f(x,y)的是一个倒钟型曲面:

    示例

    示例1

      X服从(0,1)上的均匀分布,在X=x(0<x<1)的条件下,Y在(0,x)内服从均匀分布,f(x,y)=?, 2. fY(y)=?

      先看1,X服从某一个区域的边缘分布意味着:

      X服从(0,1)上的均匀分布,则x1 = 0, x2 = 1:

      “Y在(0,x)内服从均匀分布”:

      

      2. Y的边缘分布的密度函数是:

      现在只需要确定的积分域即可,由0<y<x<1可知,积分上限是1,下限是y:

    示例2

      设二维随机变量(X, Y)的联合概率密度是:

      1. A=? 2.求分布函数F(x,y) 3.求概率P{Y≤X}

      

      1. 整个定义域上分布函数满足:


      作者:我是8位的

      出处:http://www.cnblogs.com/bigmonkey

      本文以学习、研究和分享为主,如需转载,请联系本人,标明作者和出处,非商业用途! 

      扫描二维码关注公众号“我是8位的”

  • 相关阅读:
    TableDriven method code complete reading notes
    Fundamental data type Code complete reading notes(12)
    利用消息机制实现.NET AOP(面向方面编程)--利用RealProxy和消息接收器实现多截获
    Organizing straightline code Code complete reading notes(14)
    Statements Code complete reading notes
    The softwarequanlity landscape Code complete reading notes
    支持ViewState和ControlState压缩的页面基类(ASP.NET2.0)
    XPath遇上命名空间
    怎样让WinForms下DataGrid可以像ASP.NET下的DataGrid一样使用自定义的模板列
    检验密码强度的JS类
  • 原文地址:https://www.cnblogs.com/bigmonkey/p/11083754.html
Copyright © 2020-2023  润新知