隐马尔可夫模型的学习问题:给定一个输出序列O=O1O2...OT,如何调节模型μ=(A,B,π)的参数,使得P(O|M)最大。
最大似然估计是一种解决方法,如果产生的状态序列为Q=q1q2...qT,根据最大似然估计,可以通过以下公式推算:
πi‘ = δ(q1,si)
aij' = Q中从状态qi转移到qj的次数/Q中从状态qi转移到另一状态(包括qj)的次数
bj(k)' = Q中从状态qj发出符号Vk的次数/ Q中到达状态qj的次数
δ(x,y)为克罗奈克函数,当x=y时,δ(x,y)=1;否则,δ(x,y)=0
但是注意,在实际中,状态Q=q1q2...qT是观察不到的(隐变量),因此上述的这种求法是有问题的。幸好希望最大化,可以用于含有隐变量的统计模型的参数最大似然估计。基本思想是初始时,随机的给模型参数赋值,但是要遵循模型对参数的限制,例如,从一个状态发出的所有状态转移概率之和为1,得到模型μ0。然后根据μ0中的具体值,带入下式,可以得到u1.依次往下迭代,直到收敛于最大似然估计值。这种迭代爬山算法可以局部使P(O|μ)最大。称为Baum-Welch算法或前向后向算法。
给定HMM的参数μ和观察序列O=O1O2...OT,在时间t位于状态si,在时间t+1位于状态sj的概率为ξt(i,j)=P(qt=si,qt+1=sj|O,μ),公式推导如下:
................(1)
给定HMM μ 和序列O=O1O2...OT,在时间t位于状态si的概率为:.........(2)
这样求μ的参数估计重新改写:
πi‘ = r1(i) ...........(3)
aij' = Q中从状态qi转移到qj的次数/Q中从状态qi转移到另一状态(包括qj)的次数
= ..........(4)
bj(k)' = Q中从状态qj发出符号Vk的次数/ Q中到达状态qj的次数
= ..............(5)
前向后项算法:
step1 初始化: 随机地给定参数 πi, aij, bj(k),使其满足条件:
由此得到μ0,令i=0
step2 EM计算:
E步骤:根据(1)(2)式计算期望ξt(i,j) 和 rt(i)
M步骤:根据期望ξt(i,j) 和 rt(i),带入(3)(4)(5)重新得到πi, aij, bj(k),得到μi+1
step3 循环计算: i = i+1, 直到πi, aij, bj(k)收敛