• 关于概率问题中的协方差和统计中的协方差的疑问


    一,概率中协方差的定义:

    概率中协方差是随机变量的数字特征,即在二维随机变量分布中,对二维随机变量(X,Y),若E(X),E(Y),E{ [ X-E(X) ] [ Y-E(Y) ] } 都存在,

    则称 E{ [ X-E(X) ] [ Y-E(Y) ] } 为X与Y的协方差(或相关矩),记为Cov(X,Y)。Cov(X,Y)=E{ [ X-E(X) ] [ Y-E(Y) ] }=E(XY)-E(X)E(Y)。

    说明两点:

    1.这里的协方差是基于二维随机变量分布的计算,即和(X,Y)的样本值和(X,Y)的联合概率有关。

    2.当X和Y是离散型随机变量时,他们分别对应的样本空间的大小不必相同,即X的样本数和Y的样本数可以不同。而且计算X和Y的全部组合。

    二,在统计过程中,是用二阶混合中心矩来估计协方差,二阶混合中心矩统计量为:

    cov(X,Y)=\frac{\sum_{i=1}^n (X_{i}-\bar{X})(Y_{i}-\bar{Y})}{n-1}

    说明两点:

    1.这里协方差完全是基于样本值,就像其他统计量一样。

    2.X和Y的样本空间大小相同,各个样本组成样本对,这就和原协方差在形式上有了较大出入。当然,统计的思想就是面向大量样本,用数量来表现变量的分布,同时实现概率的具体效果。

    补充说明:

    1.在统计中,X和Y就是维度相同的向量,每一维是一个样本,二阶混合中心矩(协方差)实际就是向量中心化后的向量的内积再除以n-1。二阶混合中心矩为0,说明两个向量正交,不相关。

    2.而方差的统计量,即二阶中心矩(实际就是X和他的均值向量的欧氏距离平方再除以n-1)。或者说是X中心化后的向量的二阶原点矩(实际即向量与原点的欧式距离再除以n-1)

  • 相关阅读:
    实现预定房间的功能
    实现投票,显示人数百分比的功能
    数据库包装成类
    实现微信好友列表的php代码
    几种常见的函数
    数据库查询
    用代码编辑数据库T-SQL语句
    多线程
    集合类
    一、高级查询。。。实例
  • 原文地址:https://www.cnblogs.com/kevinGaoblog/p/2483526.html
Copyright © 2020-2023  润新知