随机变量的概念: 对于Ω, X=X(ω), 实值函数
- 离散型: 有限个事件, 无限可排列个
- 非离散型:连续型
- X的所有取值xk(k=1,2,3...)如果实无限个, 那就是可列个, P(X=xk)=pk, 概率函数(分布)
- 当事件和概率以表格的形式呈现出来, 就叫做概率分布表
- 事件和事件对应的概率以图的形式呈现出来, 叫做概率分布图
连续型随机变量及其概率密度函数
- 频数: 出现的次数
- 定义: X的取值实某个区间的实数, 若存在非负可积函数f(x), f使得(x)≥0, 都有a≤b, P{a<x≤b}=∫abf(x)dx x:连续, f(x)叫做概率分布密度函数
- f(x)≥0)
- ∫-∞+∞f(x)=1
- 连续性随机变量取个别值的概率为0
- 连续性, 端点无所谓
- P{a≤x≤b}=P{a≤x<b}=P{a<x≤b}=P{a<x<b}
- P{x<a}=P{x≤a}
- P{x>a}=P{x≥a}
- 概率为0的事件未必实不可能事件
- 概率为1的事件也未必是必然事件
分布函数:对离散型,连续性都成立
- 分布函数F(x)=P(X≤x), 分布函数就是随机变量的取值不超过x的概率, 事一个普通的实函数
- 性质1: 0≤F(x)≤1, x€(-∞, +∞)
- 分布函数F(x),是不减函数, x1<x2, F(x1)<F(x2)
- limx→+∞F(x)=F(+∞)=1
- limx→-∞F(x)=F(-∞)=0
- F(x)右连续
- 离散性: 右连续
- 连续性: 左右都连续
- 公式: F(x)=P(X≤x) (对离散性, 连续性, 都成立)
- P{X≤a}=F(a)
- P{X>a}=1-P{X≤a}=1-F(a)
- P{a<X<b}=P{X≤b}-P{X≤a}=F(b)-F(a)
- P{X=a}=F(a)-F(a-0)
- P{a≤X≤b}=F(b)-F(a-0)
- P{X<a}=F(a-0)
- P{X≥a}=1-F(a-0)
分布函数→概率
- 间断点局势x的取值
- P{X=xp}=F(Xk)-F(xk-0)
- F(x) = P{X=x}=∫-∞xf(t)dt
常见随机变量的分布:
- 0-1分布
-
X 1 0 P p 1-p - P{X=k}=Pk(1-p)1-k k=0,1...
- 特点: 有两种结果: 试验只做一次
- 最可能值:
- (n+1)p不为整数, [(n+1)p]达到最大值
- (n+1)p是整数, (n+1)p, (n+1)p-1是最值
- 几何分布:
- P(A)=p, 第k次首次发生, 前k-1次未发生, P{X=k}=(1-p)k-1p X~G(p)
- 二项分布:
- P(A)=p, n次试验, 发生了k次, 所以公式:
- P{X=k}=Cnkpk(1-p)n-k
- 知道k求概率
- P(A)=p, n次试验, 发生了k次, 所以公式:
- 泊松分布:
- P{X=k}=(λk)/(k!)e-λ k = 0,1,2,3,... λ>0, X~P(λ)
- 知道概率, 求k
- 超几何分布:
- N个元素: N1个属于第一类, N2个属于第二类, 取n个, X:n个属于第一类的个数
- P{X=k}=CN1kCN2n-k/CNn k=0,1,2,3,...
- 超几何分布可以描述不放回的抽样实验, 当N很大时, n相对与N影响很小,
- P = {X=k}=CMkCN-Mn-k/CNn ≈ Cnkpk(1-p)n-k
- N个元素: N1个属于第一类, N2个属于第二类, 取n个, X:n个属于第一类的个数
- 二项分布: n≥100, np≤10, 用泊松分布近似计算λ=np
- 超级几何分布: (N大, n/N小)→二项分布→泊松分布(近似)
连续型分布:
- 均匀分布: 在区间内均匀分布
- f(x) = 1/(b-a) a≤x≤b
- 指数分布:
- f(x) = λe-λx x>0 or 0 x≤0, (λ>0, X~Exp(λ))
正态分布:
- Φ(x)=1/[(2π)1/2σ]e-(x-μ)2/(2σ2) -∞<x<+∞ X~N(μ, σ2)
- ∫-∞+∞e-x2dx=π1/2
- 性质1: y=φ(x)是以x=μ未对称轴, 钟形图形
- x=μ时, φ(x)最大值为1/[(2π)1/2σ]
- 性质2: y = φ(x)以x轴未渐近线, x=μ+σ是拐点
- 性质3: σ固定: μ变化, 左右移动
- μ固定: σ变化,
- σ变小, 最高点上移, 图形边陡
- σ变大, 最高点下移, 图像变缓
- μ固定: σ变化,
标准正态分布:
- 当μ=0, σ=1, Φ0(x)=1/[(2π)1/2]e-(x2/2) -∞<x<+∞
- 性质1: y轴是对称轴, 偶函数 Φ0(x) = Φ0(-x) Φ0(-x)=1-Φ0(x)
- 一般正态分布→标准正态分布
- Φ(x)=Φ0[(x-μ)/σ]
- eg: X~N(1,4)服从一般正态分布, 求P{0<X<1.6}的概率
- 因为X~N(1,4)服从一般正太分布, 所以 μ=1, σ=2
- P{0<X<1.6}=Φ(1.6)-Φ(0)=Φ0[(1.6-1)/2] - Φ0[(0-1)/2] = Φ0(0.3)-Φ0(-0.5)=Φ0(0.3)-(1-Φ0(0.5))
- 上分位数:
- X~N(0,1)服从一般正态分布, 给定α(0<α<1), 找出μα, P{X>μα}, 此时μα叫做上分位数
随机变量函数的分布:
- 离散型: 已知X是某分布, 则新构造的函数的概率和原概率不变, 如果新构造的函数重复,就需要把重复的变量合起来.
- 连续型: 连续函数, 分布公式: F(x)=P{X≤x}
- Fx(x) = P{X≤x}
- FY(x) = P{Y≤x}
- 用FY(x)→FX(x):用x来表示y的分布函数
- 两边同时求导: 来能改变同事求导的密度函数
- FY(x)→求导→fY(x)
- FX(x)→求导→fx(x)
- 定理2.1: X的密度函数fx(x), 引入 Y=Kx+b, fY(x)=1/|k|fx[(x-b)/k]