概率分布(Distributions)
如图1所看到的,这是最简单的联合分布案例,姑且称之为学生模型。
图1
当中包括3个变量。各自是:I(学生智力,有0和1两个状态)、D(试卷难度,有0和1两个状态)、G(成绩等级,有1、2、3三个状态)。
表中就是概率的联合分布了,表中随便去掉全部包括某个值的行。就能对分布表进行缩减。
比如能够去掉全部G不为1的行。这样就仅仅剩下了1、4、7、10行,这样他们的概率之和就不为1了,所以能够又一次标准化(Renormalization)。如图2所看到的。
图2
反之也能够把全部含有某个值得行相加。就是边缘化(Marginalization),如图3所看到的。
图3
条件概率分布(Conditional ProbabilityDistribution, CPD)
已知学生的智力和试卷难度。学生得分的分布就是条件概率。
如图4所看到的。
图4
因子(Factors)
因子是随机变量的函数。
因子是处理概率分布的的基本手段。
因子是高维空间中用以定义概率分布的基本单元。
因子能够相乘(图5)、边缘化(图6)以及缩减(图7)。
图5
图6
图7
前面提到的学生模型,其条件概率分布能够画在一张图里面。如图8.
每一个节点代表一个因子,当中有些CPD已经蜕化成非条件概率了。
图8
贝叶斯网络的链式法则(Chain Rule)
如图9所看到的。概率分布由因子的积来定义。
图9
比如
因此,通过链式法则。贝叶斯网络可以表示联合概率分布:
贝叶斯网络的重要性质是概率和为1
一个简单的概率图是血型模型
当中G指基因型,B指血型。
能够看到血型仅仅由自己的基因型决定,而基因型则由父母两人的基因型决定。如图10.
图10
欢迎參与讨论并关注本博客和微博以及知乎个人主页,兴许内容继续更新哦~
转载请您尊重作者的劳动,完整保留上述文字以及本文链接。谢谢您的支持!