六,专著研读(第九章朴素贝叶斯)
- 概述:贝叶斯分类是统计学的一种概率分类方法,,朴素贝叶斯分类是贝叶斯分类中最简单的。用贝叶斯公式根据某特征的先验概率计算出其后验概率,选择具有最大后验概率的类作为该特征所属的类。
- 朴素:假设所有特征之间是独立统计的。
- 公式推导(略)
$ P(A|B)P(B)=P(B|A)P(A)=>P(A|B)=frac{P(B|A)P(A)}{P(B)}( <br> ) P(类别|特征)=P(类别)frac{P(特征|类别)}{P(特征)}$
- 全概率公式
事件A_{1},A_{2},...A_{n},构成一个完备事件且都有正概率,对于任意一个事件B则有。
(P(B)=P(BA_{1})+P(BA_{1})+P(BA_{2})+...+P(BA_{n})=P(B|A_{1})P(A_{1})+P(B|A_{2})P(A_{2})+...+P(B|A_{n})P(A_{n}))
$ P(B)=sum_{i=1}^{n}P(A_{i})P(B|A_{i})$
- 贝叶斯推断
根据条件概率和全概率公式,得到贝叶斯公式如下:
$ P(A|B)=P(A)frac{P(B|A)}{P(B)}( <br> )P(A_{i}|B)=P(A_{i})frac{P(B|A_{i})}{sum_{i=1}^{n}P(A_{i})P(B|A_{i})}$
P(A)“先验概率”,在B事件发生之前,我们对A事件概率的一个判断。
P(A|B)“后验概率”,在事件B发生之后,我们对A事件概率的重新评估。
P(B|A)/P(B)“可能性函数”。这是一个调整因子,使得预估概率更接近真是概率。(可能性函数>1,“先验概率”被增强,事件A的发生可能性变大;=1无助于判断A的可能性;<1“先验概率被削弱”,A的可能性变小。)
条件概率可以理解为:后验概率=先验概率*调整因子