• 关于数理统计基础知识的一点补漏


    一、 数学期望

    数学期望也称为均值、期望,在物理学中称为期待值。在概率论和统计学中,一个离散型随机变量的期望值是实验中每次可能结果的概率乘以其结果的总和。

    定义:

    离散型随机变量的一切可能取值与其对应的概率p的乘积之和称为数学期望。

    需要注意的是,期望值并不一定等于常识中“期望”——期望值或许与每一个结果都不相等。换句话说,期望值是该变量输出值的平均数,因此期望值并不一定包含于变量的输出值集合里。

     

    二、 方差(Variance

    方差是各个数据与平均数值差的平方的平均数。在概率论和数理统计中,方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。

    样本中各个数据与样本均值的差的平方和的平均数叫做样本方差;样本方差的算术平方根叫做样本标准差。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大,越不稳定。

     

    三、 标准差(Standard Deviation

    标准差也称为均方差(Mean Square Error),是各数偏离平均数的距离的平均数,它是离均值平方和平均后的方根。标准差是方差的算术平方根。标准差能反映一个数据集的偏离程度。

    标准差也被称为标准偏差,或者实验标准差,公式:

    clip_image002

    如果是总体,标准差公式根号内除以n;如果是样本,标准差公式根号内除以(n-1),因为我们大量接触的是样本,所以普遍使用根号内除以(n-1)。

    简单来说,标准差是一组数据平均值分散程度的一种度量。一个较大的标准差,代表大部分数值和平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。

    虽然标准差有计量单位,而方差无计量单位,但两者的作用一样。标准差用平方的方法消除了正负号,因而它是最常用、最重要的离散趋势统计量。标准差越大,表示变量值之间的差异越大,各数据距离均值越远,则平均数的代表性就越低。反之,标准差越小,表示变量之间的差异越小,各数据距离均值较近,则平均数的代表性越高。

    标准差应用与投资上,可作为衡量回报稳定性的指标。标准差数值越大,代表回报远离过去平均数值,回报较不稳定。相反,标准差数值越小,代表回报较为稳定,风险亦小。

    样本标准差:

    在真实世界中,除非在某些特殊情况下,找到一个总体的真实的标准差是不现实的。大多数情况下,总体标准差是通过随机抽取一定量的样本并计算样本标准差来估计的。

    从一大组数值X1, X2, … , Xn中抽取一样本数值组合x1, x2, … , xn,n<N,常定义其样本标准差:

    clip_image004

    样本方差clip_image006是对总体方差clip_image008的无偏估计。s中分母为n-1(相较于总体clip_image010中的分母为n),是因为clip_image012的自由度为n-1,这是由于存在约束条件clip_image014

  • 相关阅读:
    云区域(region),可用区(AZ),跨区域数据复制(Cross-region replication)与灾备(Disaster Recovery)(部分1)
    云区域(region),可用区(AZ),跨区域数据复制(Cross-region replication)与灾备(Disaster Recovery)(部分2)
    VLAN 模式下的 OpenStack 管理 vSphere 集群方案
    理解Kubernetes(2): 应用的各种访问方式
    理解Kubernetes(1):手工搭建Kubernetes测试环境
    2017这一年(内空)
    eKing Cloud基础云平台演进之路
    《重新定义公司
    使用 Kafka 和 ELK 搭建测试日志系统(1)
    [译] OpenStack Pike 版本中的 53 个新功能盘点
  • 原文地址:https://www.cnblogs.com/chaosimple/p/3179608.html
Copyright © 2020-2023  润新知