• 协方差,皮尔逊相关性,卡方检验


    1、协方差

    协方差(Covariance)在概率论统计学中用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。

    期望值分别为E(X)=muE(Y)=
u的两个具有有限二阶实数随机变量X 与Y 之间的协方差定义为:

    {displaystyle operatorname {cov} (X,Y)=operatorname {E} ((X-mu )(Y-
u ))=operatorname {E} (Xcdot Y)-mu 
u .}

    协方差表示的是两个变量的总体的误差,这与只表示一个变量误差的方差不同。 如果两个变量的变化趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身的期望值,那么两个变量之间的协方差就是正值。 如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。

    2、

    两个变量之间的皮尔逊相关系数定义为两个变量之间的协方差标准差的商:

    {displaystyle 
ho _{X,Y}={mathrm {cov} (X,Y) over sigma _{X}sigma _{Y}}={E[(X-mu _{X})(Y-mu _{Y})] over sigma _{X}sigma _{Y}}}

    上式定义了总体相关系数,常用希腊小写字母 ρ (rho) 作为代表符号。估算样本的协方差和标准差,可得到样本相关系数(样本皮尔逊系数),常用英文小写字母 r 代表:

    {displaystyle r={frac {sum limits _{i=1}^{n}(X_{i}-{overline {X}})(Y_{i}-{overline {Y}})}{{sqrt {sum limits _{i=1}^{n}(X_{i}-{overline {X}})^{2}}}{sqrt {sum limits _{i=1}^{n}(Y_{i}-{overline {Y}})^{2}}}}}}
    数据标准化之后,(服从标准正太分布的话)夹角余弦,皮尔逊相关度是一样的
    3、卡方检验
    这个还不是太明白数学意义,这是怎么来的,为啥这么算???,而且没实际使用过。
    具体介绍参考这篇博客

    https://blog.csdn.net/bitcarmanlee/article/details/52279907 

    参考资料:

    https://www.zhihu.com/question/19734616

    https://zh.wikipedia.org/wiki/%E7%9A%AE%E5%B0%94%E9%80%8A%E7%A7%AF%E7%9F%A9%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0

  • 相关阅读:
    多线程与多进程
    Socket网络编程
    Python之路【第五篇】:面向对象及相关
    python 面向对象(进阶篇)
    面向对象
    day1
    day3
    day2
    黑马程序员--C语言中的指针(6)
    黑马程序员--C语言中的指针(5)
  • 原文地址:https://www.cnblogs.com/earendil/p/9169181.html
Copyright © 2020-2023  润新知