概率笔记6——多维随机变量

概率笔记6——多维随机变量

　　和其它问题一样，概率也可能同时受到多个条件的影响，例如考察某地区中学生的身体素质，随机地选取一名学生，观察学生的身高 X，体重 Y 和肺活量 Z 等指标。随机变量 X，Y，Z 来自同一样本空间，它们的取值可能相互影响。像这样同时考虑的多个随机变量，称为多维随机变量。本章以二维随机变量为例，介绍多维随机变量的相关概念。

联合分布

　　和一维变量的概率分布类似，联合分布把舞台扩展到了多维，这里的“联合”就是多个随机变量的意思。

　　假设一个事件受到两个变量x和y的影响，它的联合分布定义为：

　　其中X表示具体的取值，x表示变量。

　　上一章提到过，分布是指概率的累加，是把事件映射为数字，一个二维联合分布的变量取值范围是整个二维平面，但F(x,y)的取值范围是0~1。

离散型

联合概率

　　联合概率指的是包含多个条件且所有条件同时成立的概率，也叫联合分布率。

　　用x_i和y_j的两个随机变量所有可能的取值，P(X=x_i, Y=y_j)表示在X=x_i和Y=y_j下事件发生的概率。设P(X=x_i, Y=y_j)=p_ij，则下表是二维离散型随机变量(X, Y)的联合概率：

　　联合分布率实际上是一个矩阵。既然是概率，联合概率也满足下面两个条件：

联合分布

　　一维随机变量的分布函数：

　　二维随机变量的分布函数：

　　其中：

　　分布函数和分布略有区别，“分布”是指累加概率，“分布函数”是将累加概率函数化。F(x,y)=P{X≤x,Y≤y}是分布函数，它的值是所有在X≤x,Y≤y下的概率分布。

边缘分布

　　先看表1的第一行，它固定了x=x₁，此时在表格右侧加入一列：

　　p₁_·表示x的取值固定，y取任意值时的概率分布，即：

　　由于p₁_·是写在表格的边缘，所以称为x=x₁的边缘分布。对于任意行来说：

　　这实际上是在表示X= x_i时事件发生的概率。类似的，y=y_j的边缘分布是：

条件概率

　　条件概率是指在A事件发生的条件下，事件B发生的概率，表示为P(B|A)，它有一个重要公式：

　　多维随机变量的条件概率公式与此类似，在Y=y_j 条件下X=x_i的概率：

独立性

　　对于二维离散型随机变量(X, Y)来说，如果满足：

　　那么这两个随机变量之间是没有相互影响的，称X和Y之间互相独立。反过来也一样，如果满足了独立性，那么必然有上式的关系。

连续型

　　由于是连续型变量，所以无法像离散型变量那样简单地计算在某一点的概率（概率可以表示为几何度量，点的度量是0，因此算某一点的概率也是0，或者说计算点的概率没有意义），只能计算某一取值范围内的概率，也就是概率分布（概率的累加）。

联合概率密度函数和联合分布

　　某个地区的人口密度越大，这个地区的人口越多。同样的，概率密度越大，说明这个区域的发生某件事的概率越大。

　　设F(x,y)是二维连续型随机变量(X,Y)的联合分布函数，如果存在一个非负函数f(x,y)，对于任意实数x,y，有：

　　则称f(x,y)是二维连续型随机变量(X,Y)的联合概率密度函数。

　　u和v在计算后定积分后会被x和y代替。可以对比上一章中一维随机变量的分布函数来理解F(x,y)。概率分布是概率的累加，而累加正好是积分的定义。在几何上，F(x,y)表示了曲面柱体的体积：

　　假设在R区域上，x₁<x<x₂, y₁<y<y₂，那么该区域上的概率分布是：

　　dydx是R上的面积积元，它是面积无限接近0的小矩形，但不是0。至此，概率和多重积分联系到一起。上式中没有u和v，这是由于已经确定了x和y的取值范围，且f本来就是关于x和y的函数，因此没必要再引入u和v。如果非要使用u和v，那么上式等价于：

　　由于F是分布函数，因此在整个定义域上满足：

边缘分布和边缘密度函数

　　联合分布表达的是二维随机变量(X, Y)的整体分布，同时X和Y也有各自的边缘分布。与离散型类似，连续型随机变量的边缘分布是只认为有一个变量，其它变量都看作常量。

　　X的边缘分布，表示将x看作常量，不管Y的取值：

　　Y的边缘分布，表示将y看作常量，不管x的取值：

　　设(X, Y)的联合密度函数是f(x,y)，那么(X, Y)的联合分布可以表示为：

　　X的边缘分布限定了X的取值是X≤x，y可以取任意值，此时X的边缘分布可以写成：

　　分布代表了累加，连续型分布是用积分表示的，F_X(x)表示P{X≤x, Y<∞}的累加，是对dx的积分，因此X的边缘分布的密度函数是上式的内积分：

　　把u,v换成x,y，X的边缘分布的密度函数是：

　　类似的，Y的边缘分布的密度函数是：

条件分布和条件密度函数

　　条件概率公式：

　　对于连续型变量来说，单点的概率没有意义，因此将上式推广到连续型随机变量后就变成了“分布”，比如给定Y值的条件下X的概率分布。

　　设(X, Y)的联合密度函数是f(x,y)，边缘密度函数是f_X(x)和f_Y(y)，如果固定x，则称下式为X=x条件下Y的概率密度：

　　同样，Y=y条件下X的概率密度：

　　有了概率密度，自然可以求得相应的分布，给定Y值的条件下X的概率分布：

独立性

　　对于二维连续型随机变量(X, Y)来说，如果满足：

　　那么这两个随机变量之间是没有相互影响的，称X和Y之间互相独立。反过来也一样，如果满足了独立性，那么必然有上式的关系。

二维均匀分布

　　设R是平面上的有界区域，面积为A，若二维随机变量(X,Y)具有概率密度：

　　则称(X, Y)在R上服从均匀分布。

　　如果在R区域上x在x₁<x<x₂上服从均匀分布，那么X在x₁<x<x₂的边缘分布的密度函数是：

　　若(X, Y) 服从R区域上的均匀分布，则对于R上的任一子区域D，都有：

　　上式实际上是在说，如果(X,Y)在某个区域内服从均匀分布，则意味着(X,Y)在该区域内具有“等可能”性。

二维正态分布

　　若二维随机变量(X,Y)具有概率密度：

　　则称(X,Y)服从参数为的二维正态分布，记作：

　　f(x,y)的是一个倒钟型曲面：

示例

示例1

　　X服从(0,1)上的均匀分布，在X=x(0<x<1)的条件下，Y在(0,x)内服从均匀分布，f(x,y)=?, 2. f_Y(y)=?

　　先看1，X服从某一个区域的边缘分布意味着：

　　X服从(0,1)上的均匀分布，则x₁ = 0, x₂ = 1：

　　“Y在(0,x)内服从均匀分布”:

　　

　　2. Y的边缘分布的密度函数是：

　　现在只需要确定的积分域即可，由0<y<x<1可知，积分上限是1，下限是y：

示例2

　　设二维随机变量(X, Y)的联合概率密度是：

　　1. A=? 2.求分布函数F(x,y) 3.求概率P{Y≤X}

　　

　　1. 整个定义域上分布函数满足：

　　作者：我是8位的

　　出处：http://www.cnblogs.com/bigmonkey

　　本文以学习、研究和分享为主，如需转载，请联系本人，标明作者和出处，非商业用途！

　　扫描二维码关注公众号“我是8位的”
相关阅读:
TableDriven method code complete reading notes
Fundamental data type Code complete reading notes(12)
利用消息机制实现.NET AOP(面向方面编程)－－利用RealProxy和消息接收器实现多截获
 Organizing straightline code Code complete reading notes(14)
Statements Code complete reading notes
The softwarequanlity landscape Code complete reading notes
支持ViewState和ControlState压缩的页面基类（ASP.NET2.0）
XPath遇上命名空间
 怎样让WinForms下DataGrid可以像ASP.NET下的DataGrid一样使用自定义的模板列
 检验密码强度的JS类
原文地址：https://www.cnblogs.com/bigmonkey/p/11083754.html

概率笔记6——多维随机变量

联合分布

离散型

联合概率

联合分布

边缘分布

条件概率

独立性

连续型

联合概率密度函数和联合分布

边缘分布和边缘密度函数

条件分布和条件密度函数

独立性

二维均匀分布

二维正态分布

示例

示例1

示例2