• 第二章-随机变量分布


    随机变量的概念: 对于Ω, X=X(ω), 实值函数

    • 离散型: 有限个事件, 无限可排列个
    • 非离散型:连续型 
    • X的所有取值xk(k=1,2,3...)如果实无限个, 那就是可列个, P(X=xk)=pk, 概率函数(分布)
    • 当事件和概率以表格的形式呈现出来, 就叫做概率分布表
    • 事件和事件对应的概率以图的形式呈现出来, 叫做概率分布图

    连续型随机变量及其概率密度函数

    • 频数: 出现的次数
    • 定义: X的取值实某个区间的实数, 若存在非负可积函数f(x), f使得(x)≥0, 都有a≤b,  P{a<x≤b}=∫abf(x)dx  x:连续, f(x)叫做概率分布密度函数
      • f(x)≥0)
      • -∞+∞f(x)=1
      • 连续性随机变量取个别值的概率为0
    • 连续性, 端点无所谓
      • P{a≤x≤b}=P{a≤x<b}=P{a<x≤b}=P{a<x<b}
      • P{x<a}=P{x≤a}
      • P{x>a}=P{x≥a}
      • 概率为0的事件未必实不可能事件
      • 概率为1的事件也未必是必然事件

    分布函数:对离散型,连续性都成立

    • 分布函数F(x)=P(X≤x), 分布函数就是随机变量的取值不超过x的概率, 事一个普通的实函数
    • 性质1: 0≤F(x)≤1, x€(-∞, +∞)
    • 分布函数F(x),是不减函数, x1<x2, F(x1)<F(x2)
      • limx→+∞F(x)=F(+∞)=1
      • limx→-∞F(x)=F(-∞)=0
    • F(x)右连续
      • 离散性: 右连续
      • 连续性: 左右都连续
    • 公式: F(x)=P(X≤x)   (对离散性, 连续性, 都成立)
      • P{X≤a}=F(a)
      • P{X>a}=1-P{X≤a}=1-F(a)
      • P{a<X<b}=P{X≤b}-P{X≤a}=F(b)-F(a)
      • P{X=a}=F(a)-F(a-0)
      • P{a≤X≤b}=F(b)-F(a-0)
      • P{X<a}=F(a-0)
      • P{X≥a}=1-F(a-0)

    分布函数→概率

    • 间断点局势x的取值
    • P{X=xp}=F(Xk)-F(xk-0)
    • F(x) = P{X=x}=∫-∞xf(t)dt

    常见随机变量的分布:

    • 0-1分布
      • X 1 0
        P p 1-p
      • P{X=k}=Pk(1-p)1-k  k=0,1...
      • 特点: 有两种结果: 试验只做一次
      • 最可能值:
        • (n+1)p不为整数, [(n+1)p]达到最大值
        • (n+1)p是整数, (n+1)p, (n+1)p-1是最值
    • 几何分布:
      • P(A)=p, 第k次首次发生, 前k-1次未发生, P{X=k}=(1-p)k-1p    X~G(p)
    • 二项分布:
      • P(A)=p, n次试验, 发生了k次, 所以公式:
        • P{X=k}=Cnkpk(1-p)n-k
        • 知道k求概率
    • 泊松分布:
      • P{X=k}=(λk)/(k!)e-λ  k = 0,1,2,3,...   λ>0, X~P(λ)
      • 知道概率, 求k
    • 超几何分布:
      • N个元素: N1个属于第一类, N2个属于第二类, 取n个, X:n个属于第一类的个数
        • P{X=k}=CN1kCN2n-k/CN  k=0,1,2,3,...
        • 超几何分布可以描述不放回的抽样实验, 当N很大时, n相对与N影响很小,
          • P = {X=k}=CMkCN-Mn-k/CN≈ Cnkpk(1-p)n-k 
    • 二项分布: n≥100, np≤10, 用泊松分布近似计算λ=np
    • 超级几何分布: (N大, n/N小)→二项分布→泊松分布(近似)

    连续型分布:

    • 均匀分布: 在区间内均匀分布
      • f(x) = 1/(b-a)  a≤x≤b
    • 指数分布: 
      • f(x) = λe-λx   x>0  or   0  x≤0,   (λ>0, X~Exp(λ))

    正态分布:

    • Φ(x)=1/[(2π)1/2σ]e-(x-μ)2/(2σ2)     -∞<x<+∞   X~N(μ, σ2)
    • -∞+∞e-x2dx=π1/2  
    • 性质1: y=φ(x)是以x=μ未对称轴, 钟形图形
      • x=μ时, φ(x)最大值为1/[(2π)1/2σ]
    • 性质2: y = φ(x)以x轴未渐近线, x=μ+σ是拐点
    • 性质3: σ固定: μ变化, 左右移动
      • μ固定: σ变化, 
        • σ变小, 最高点上移, 图形边陡
        • σ变大, 最高点下移, 图像变缓

    标准正态分布:

    • 当μ=0, σ=1, Φ0(x)=1/[(2π)1/2]e-(x2/2)   -∞<x<+∞
    • 性质1: y轴是对称轴, 偶函数  Φ0(x) = Φ0(-x)   Φ0(-x)=1-Φ0(x)
    • 一般正态分布→标准正态分布
      • Φ(x)=Φ0[(x-μ)/σ]
      • eg: X~N(1,4)服从一般正态分布, 求P{0<X<1.6}的概率
        • 因为X~N(1,4)服从一般正太分布, 所以 μ=1, σ=2
        • P{0<X<1.6}=Φ(1.6)-Φ(0)=Φ0[(1.6-1)/2] - Φ0[(0-1)/2] = Φ0(0.3)-Φ0(-0.5)=Φ0(0.3)-(1-Φ0(0.5))
    • 上分位数:
      • X~N(0,1)服从一般正态分布, 给定α(0<α<1), 找出μα, P{X>μα}, 此时μα叫做上分位数

    随机变量函数的分布:

    • 离散型: 已知X是某分布, 则新构造的函数的概率和原概率不变, 如果新构造的函数重复,就需要把重复的变量合起来.
    • 连续型: 连续函数, 分布公式: F(x)=P{X≤x}
      • Fx(x) = P{X≤x}
      • FY(x) = P{Y≤x}
        • 用FY(x)→FX(x):用x来表示y的分布函数
        • 两边同时求导: 来能改变同事求导的密度函数 
          • FY(x)→求导→fY(x)
          • FX(x)→求导→fx(x)
    • 定理2.1: X的密度函数fx(x), 引入 Y=Kx+b, fY(x)=1/|k|fx[(x-b)/k]
  • 相关阅读:
    jvm 垃圾回收
    shell编写一键启动
    jvm内存结构
    java 线程监控
    linux 操作系统级别监控 nmon命令
    linux 操作系统级别监控 vmstat/dstat 命令
    linux 操作系统级别监控 df 命令
    linux 操作系统级别监控 iostat 命令
    linux 操作系统级别监控 free命令
    linux 操作系统级别监控 TOP命令
  • 原文地址:https://www.cnblogs.com/ljc-0923/p/15098789.html
Copyright © 2020-2023  润新知