贝叶斯定理到贝叶斯滤波器

贝叶斯定理到贝叶斯滤波器
贝叶斯定理是一种在已知其他概率的情况下求概率的方法：

首先，对于贝叶斯定理，还是要先了解各个概率所对应的事件。

　　P(A|B) 是在 B 发生的情况下 A 发生的概率；

　　P(A) 是 A 发生的概率；

　　P(B|A) 是在 A 发生的情况下 B 发生的概率；

　　P(B) 是 B 发生的概率。

贝叶斯法则的原理　　　　

根据文氏图，可以很清楚地看到在事件B发生的情况下，事件A发生的概率就是P(A∩B)除以P(B)。

$P(A|B)=\frac{P(A\cap B)}{P(B)}$

因此，

$P(A\cap B)=P(A|B){P(B)}$

同理可得，

$P(A\cap B)=P(B|A){P(A)}$

所以，

$P(A|B){P(B)}=P(B|A){P(A)}$

即，

$P(A|B)=\frac{P(B|A){P(A)}}{{P(B)}}$

这就是条件概率的计算公式。

全概率公式　　　　

由于后面要用到，所以除了条件概率以外，这里还要推导全概率公式。

假定样本空间S，是两个事件A与A'的和。

上图中，红色部分是事件A，绿色部分是事件A'，它们共同构成了样本空间S。

在这种情况下，事件B可以划分成两个部分。

即

$P(B)=P(B\cap A)+P(B\cap A')$

在上一节的推导当中，我们已知

$P(B\cap A)=P(B|A)P(A)$

所以，

$P(B)=P(B|A)P(A)+P(B|A')P(A')$

这就是全概率公式。它的含义是，如果A和A'构成样本空间的一个划分，那么事件B的概率，就等于A和A'的概率分别乘以B对这两个事件的条件概率之和。

将这个公式代入上一节的条件概率公式，就得到了条件概率的另一种写法：

$P(A|B)=\frac{P(B|A)P(A)}{P(B|A)P(A)+P(B|A')P(A')}$

病人分类的例子　　　　

让我从一个例子开始讲起，你会看到贝叶斯分类器很好懂，一点都不难。某个医院早上收了六个门诊病人，如下表。

症状职业疾病

打喷嚏护士感冒

打喷嚏农夫过敏

头疼建筑工人脑震荡

头疼建筑工人感冒

打喷嚏教师感冒

头疼教师脑震荡

现在又来了第七个病人，是一个打喷嚏的建筑工人。请问他患上感冒的概率有多大？根据贝叶斯定理：
```
P(A|B) = P(B|A) P(A) / P(B)
可得：
P(感冒|打喷嚏x建筑工人) 
　　　　= P(打喷嚏x建筑工人|感冒) x P(感冒) 
　　　　/ P(打喷嚏x建筑工人)
```
假定"打喷嚏"和"建筑工人"这两个特征是独立的，因此，上面的等式就变成了
```
P(感冒|打喷嚏x建筑工人) 
　　　　= P(打喷嚏|感冒) x P(建筑工人|感冒) x P(感冒)
　　　　/ P(打喷嚏) x P(建筑工人)
```
这是可以计算的。
```
P(感冒|打喷嚏x建筑工人) 
　　　　= 0.66 x 0.33 x 0.5 / 0.5 x 0.33 
　　　　= 0.66
```
因此，这个打喷嚏的建筑工人，有66%的概率是得了感冒。同理，可以计算这个病人患上过敏或脑震荡的概率。比较这几个概率，就可以知道他最可能得什么病。
这就是贝叶斯分类器的基本方法：在统计资料的基础上，依据某些特征，计算各个类别的概率，从而实现分类。

贝叶斯滤波器　　　　

首先，BF是什么？

BF是依据机器人传感器获取的观测数据，利用Bayes公式（概率论）去估计机器人的状态的一种手段。

这里的关键点在于，BF假设了机器人当前的状态服从某一个概率分布，将机器人状态估计问题建模为一个概率分布的估计问题，从而利用概率论的数学工具来解决机器人的状态估计。

那么为什么要用BF呢？

这是因为，机器人的运动模型以及传感器的观测模型常常受到噪声干扰，而这种噪声都是随机性的。这样建模就可以有利于我们把噪声的分布、统计特性给估计出来，从而去除噪声，得到真实观测以及真实状态。

那么，BF具体是怎么对机器人状态估计问题建模的呢？

举一个例子，我做了一只小狗机器人，它身上装了GPS，可以时刻返回小狗机器人的位置。为了遥控它，我还给它装了一个遥控接收装置（根据小狗之前在的位置加上遥控量，也能算出小狗的位置）。但是，我遇到两个问题。一是，我花的钱太少了，买到GPS不太准，本来小狗应该在(5,3)的位置，但是测量的结果却是(5.1,2.8)。二是，小狗机器人接收到指令是前进1米，但是实际走的却可能是0.98米。小狗机器人的观测过程和运动过程中都存在噪声的干扰，这使得我想要知道我的小狗跑到哪里变得很困难，需要借助滤波手段来估计小狗位置。

基于这个例子，由于受到噪声污染，小狗机器人位置和GPS的观测可以被建模为概率分布，以表征其不确定性，即：

其中，x代表小狗机器人的位置，以及y代表GPS测量到的小狗机器人的位置。下标代表的是时间。

这两个式子分别可以称为小狗机器人系统的动态模型（通常用状态方程描述，即从一个状态如何变化到另一个状态）和观测模型（通常用观测方程描述，即当前状态下能够获取到怎么样的观测）。

表达的意思是：k时刻小狗的位置服从以1到k-1时刻的小狗位置以及1到k-1时刻的GPS测量值为条件的一个概率分布；另外，k时刻GPS的测量值服从以1到k时刻的小狗位置以及1到k-1时刻的GPS测量值为条件的一个概率分布。 $x, y$

当然，上面这种建模方式是比较一般化的情况，而有些情况下（例如本例），k时刻的状态和观测未必和很久以前的状态与观测有关系，这时可以对这种建模方式进行一定简化。

简化一：状态量的马尔科夫性

假设k时刻小狗的位置只与k-1时刻的小狗的位置有关，由此：

简化二：观测量的条件独立性
假设k时刻GPS的位置的值只与k时刻小狗的位置有关，由此： $上述两个简化的含义非常直观，通常的机器人状态估计问题基本能进行这样的简化。$
当然，机器人状态估计不一定只能用求解概率分布的方法。最小二乘（观测与状态误差最小）也是常用的方法，卡尔曼滤波最早实际上是从最小二乘法的基础上推导出来的。

BF基本方程　　　　

首先，我们需要明确BF的目标是什么？
估计机器人状态的概率分布。在小狗的例子中，就是通过手头信息估计出k时刻小狗位置的概率分布。而我们手头的信息就包括，1到k-1时刻小狗的位置以及1到k时刻 GPS的测量值。

　　

批处理方法

因此，我们首先想到的方法大概是：

这种方法也就是所谓的批处理贝叶斯方法。但是这种方法每次都要拿所有的测量值来重新计算概率分布，对于计算机是个沉重的负担。因此，有了改进的基于递归的贝叶斯滤波方法。

递归方法

事实上，在k时刻，我们除了GPS的测量值以外，

还有k-1时刻对小狗位置的估计 $p (x_{k - 1} | y_{1 : k - 1})$

因此，我们根据k-1时刻的小狗位置分布和k时刻的GPS观测可以利用递归的方法得到k时刻的位置分布，这也就是BF的核心。估计k时刻小狗位置的计算过程包括两步，如下：

1-Step：预测
这一步是用去得到，注意这里并没有用到k时刻的观测值。

其中，代表了状态由k-1时刻到k时刻的转移概率，也就是上文中介绍了简化了的小狗动态模型，这里的不确定性是由小狗运动过程中的噪声引入的。

这一步之所以称为预测步，可以理解为，在已知k-1时刻机器人位置的情况下，根据机器人本身运动学模型（通常是状态方程），去预测k时刻机器人的位置。在这里被作为先验分布， $p (x_{k} | y_{1 : k - 1})$

2-Step：更新
这一步是用观测值 $y_{k}$

$p (x_{k} | x_{k - 1})$

这一步之所以称为更新是因为这步中用到了k时刻的观测量，从而将原本的预测分布更新为了后验分布 $p (x_{k} | y_{1 : k})$

总结
BF的整个过程可以描述为，首先选定一个最初状态的先验分布，进行预测步，得到k=1的预测分布，再用k=1的观测去更新预测分布得到k=1的后验分布，然后将这个后验分布作为先验分布，去预测k=2的预测分布，然后以此类推。。。

参考资料：　　　　

机器学习(10)之趣味案例理解朴素贝叶斯

https://mp.weixin.qq.com/s/s0v_afLVqtJhZyn3qHlseQ

可怕的贝叶斯：

http://dy.163.com/v2/article/detail/CU0MJOCV05118CTM.html

算法——贝叶斯：

https://www.cnblogs.com/skyme/p/3564391.html

贝叶斯滤波器：

http://blog.csdn.net/qq_30159351/article/details/53395515

机器人运动估计系列（番外篇）——从贝叶斯滤波到卡尔曼

http://blog.csdn.net/handsome_for_kill/article/details/78997533

贝叶斯相关文稿：

http://blog.csdn.net/bingecuilab/article/details/52061164
相关阅读:
开灯问题
 独木舟上的旅行
 剑指offer--从尾到头打印链表
 映芬视觉网页练习
 游标的使用
 数据库操作
 关系型数据库
 数据库基础知识
 TCPSocket系列二
 HTML5新标签与css3选择器
原文地址：https://www.cnblogs.com/TIANHUAHUA/p/8528904.html

症状	职业	疾病
打喷嚏	护士	感冒
打喷嚏	农夫	过敏
头疼	建筑工人	脑震荡
头疼	建筑工人	感冒
打喷嚏	教师	感冒
头疼	教师	脑震荡

贝叶斯定理到贝叶斯滤波器

贝叶斯法则的原理

全概率公式

病人分类的例子

贝叶斯滤波器

BF基本方程

批处理方法

递归方法

参考资料：

贝叶斯法则的原理　　　　

全概率公式　　　　

病人分类的例子　　　　

贝叶斯滤波器　　　　

BF基本方程　　　　

参考资料：