1.条件概率
事件A已经发生的条件下,事件B发生
P(B|A)=P(AB)P(A)
2.乘法定理
P(AB)=P(B|A)P(A)
推广多个事件的积事件
P(ABC)=P(C|AB)P(B|A)P(A)
更一般地有
P(A1A2...An)=P(An|A1A2...An−1)P(An−1|A1A2...An−2)…P(A2|A1)P(A1)
3.全概率公式
概念:
试验E的样本空间S,事件Bi,i=1,2...,n是样本空间的一个划分,每次试验有且仅有一个发生。
- BiBj=∅,i≠j
- B1∪B2∪...∪Bn=S
如果A是E的事件,事件A发生,
P(A)=P(A|B1)P(B1)+P(A|B2)P(B2)+...+P(A|Bn)P(Bn)
全概率公式的理解
例子:
人患肺癌的概率为0.1%,人群中有20%吸烟者,他们患肺癌的概率为0.4%, 那个不吸烟的人患肺癌的概率是多少?
换个人能看懂的说法,P(患肺癌)=0.001, P(吸烟)=0.2, P(患肺癌|吸烟)=0.004, 求 P(患肺癌|不吸烟)=?
P(患肺癌)=0.001 既包括了吸烟患肺癌的概率又包括不吸烟患肺癌的概率。
P(患肺癌)=P(吸烟患肺癌)+P(不吸烟患肺癌)
=P(患肺癌|吸烟)P(吸烟)+P(患肺癌|不吸烟)P(不吸烟)
=0.004×0.2+P(患肺癌|不吸烟)×(1−0.2)=0.001
所以不吸烟的人患肺癌的概率为0.00025.
4.贝叶斯公式
P(Bi|A)=P(A|Bi)P(Bi)∑nj=1P(A|Bj)P(Bj)
n=2时,
P(B|A)=P(A|B)P(B)P(A|B)P(B)+P(A|B¯¯¯¯)P(B¯¯¯¯)
用条件概率、全概率公式理解贝叶斯公式:
P(A|B)=P(A∩B)P(A)
或者
P(B|A)=P(B∩A)P(A)
因为
P(A∩B)=P(B∩A)
所以
P(B|A)=P(A|B)P(B)P(A)
P(A)发生的概率就用到了全概率公式,包括B在各种情况下A发生的概率:
∑j=1nP(A|Bj)P(Bj)
实际应用中的定义
经典例子:
癌症诊断事件,人患癌症的统计概率为0.005,一个不患癌症的受诊者试验呈阳性的概率为0.05,一个患癌症的病人做诊断时呈阳性的概率为0.95,那么受诊者试验呈阳性,他患癌症的概率?
分析:
P(患癌症)=0.005
P(呈阳性|不患癌症)=0.05
P(呈阳性|患癌症)=0.95
P(患癌症|呈阳性)=?
使用条件概率计算:
P(患癌症|呈阳性)=P(呈阳性|患癌症)P(患癌症)P(呈阳性)
P(呈阳性|患癌症)P(患癌症)=0.005×0.95=0.00475
P(呈阳性)=P(呈阳性|不患癌症)P(不患癌症)+P(呈阳性|患癌症)P(患癌症)
=0.05×(1−0.005)+0.95×0.005=0.0545
P(患癌症|呈阳性)=0.004750.0545=0.08715