• 统计推断2:随机变量和概率密度


    概率统计的是样本空间中具有特定性质的样本出现的频率。比如抛3个硬币,样本空间是:正正正,正正反,…………,反反反。如果我们只关心正面出现的次数,那么我们可以定义一个函数:

    f(样本)—》 实数

    这样的函数就称为随机变量。简单的理解,它是样本的一个属性值。随机变量的意义在于把样本变成了数据,“样本”是个矢量,而随机变量是个标量。

    -------------

    有了随机变量,我们就能定义累积分布函数,该函数表示:随机变量小于等于目标值的概率。

    它满足3个特点:

    (1)x取值全体实数,y取值0~1,(2)递增;(3)右连续。

    第三点略不好理解。它的意思是说,如果对于某个x,累积分布函数出现了跳跃,比如:

    F(x0)=1,当x0<x

    F(x1)=2,   当x1>x

    那么F(x)=2.

    这是有累积分布函数的定义决定,如果存在跳跃,那么必然是因为样本空间是离散的。如果F(x)不是右连续的,那么导致F(x)跳跃的值就是一个不确定的值。而不连续的样本空间,必然对应一个确定的值。

    ---------------

    定义好了累积分布函数,接下来就能定义 概率密度函数。它表示:随机变量等于目标值的概率。它需要满足的特性是:

    1. 非负数
    2. 积分为1,表示所有可能性加起来为1

    密度函数等于累积分布函数的微分。

    -----------

    概率,随机变量,累积分布,概率密度,就是统计推断第一章的内容。还是挺简单的哈。

  • 相关阅读:
    python之模块与包
    python之异常处理
    python之os与json&pickle模块
    python之random、time与sys模块
    python之re模块
    python之匿名函数、递归与二分法
    python之内置函数
    python之迭代器、生成器及列表推导式
    python之第一对象,函数名的应用,闭包
    python之命名空间与作用域
  • 原文地址:https://www.cnblogs.com/alphablox/p/5317660.html
Copyright © 2020-2023  润新知