以下大部分内容来自《多元统计分析及R语言建模》一书。
1.一元数据:随机变量
(1)数学公式
1)期望:
2)方差:
(2)统计计算
1)样本均值:
2)样本方差:
其中,lxx为样本离均差平方和。
2.多元数据
(1)数学公式
设 X = (x1, x2, ... , xp) 是 nxp 随机向量
1)期望:
若存在且有限,则称为 X 的期望。
2)协方差:
向量 X 的方差——协方差矩阵为
矩阵中每个元素为协方差,其计算公式如下:
(2)统计计算
对于来自 p 维正态总体 的一个独立随机样本: x1,x2,...,xn,其样本均值向量为。样本均值向量也可用样本观测矩阵
表示,于是,
注意,上面 是 px1 矩阵,xi (i = 1,2,...,n)均为 pX1 矩阵, S 为 pxp 矩阵,S满足
3.相关度
假设X和Y均为含有n项的向量,
X = Vector(n)
Y = Vector(n)
则相关度计算如下
推断可以参考概率论和数理统计相关的书。