作者:孙相国
转载请注明出处
参考文献
- 《机器学习郑捷》第11章
- 机器学习周志华 14章
- 《统计学系方法》第10章
- 《概率图模型》第3章贝叶斯网表示和马尔科夫
- 《驾驭文本》
隐马尔科夫模型
两个基本假设:
-
齐次马尔科夫性假设:隐藏的马尔科夫链在任意时刻(t)的状态只依赖于前一时刻的状态,与其他时刻的状态及观测无关,也与时刻(t)无关。
-
观测独立性假设:任意时刻的观测只依赖于该时刻的马尔科夫链的状态,与其他观测及状态无关。
说人话,就下面这个图,其中箭头和连边表示概率依赖。
从这个图中,我们可以很轻松的对后面的一些公式做推导。比如:
上面的公式为了书写简便,我们省略掉了概率符号(P)(下同),并且用(o_{1:t})表示(left(o_1,cdots,o_t ight))(下同)。
基本定义:
转移概率(a_{ij}=left( I_{t+1}=q_j|I_t=q_i ight))
观测概率(b_jleft(o_t ight)=left(o_t|I_t=q_j ight))
初始状态概率(pi_i=Pleft(I_1=q_i ight))
隐马尔科夫模型的3个基本问题
- 概率计算
- 学习问题
- 预测问题/解码问题
概率计算问题
前向算法
前向概率(alpha_tleft(i ight)=left(o_{1:t},I_t=q_i ight))
转移概率(a_{ij}=left( I_{t+1}=q_j|I_t=q_i ight))
观测概率(b_jleft(o_t ight)=left(o_t|I_t=q_j ight))
初始状态概率(pi_i=Pleft(I_1=q_i ight))
初始前向概率:
前向概率的迭代推导:
终止状态推导:
算法1.1(观测序列概率的前向算法)
输入:隐马尔科夫模型(lambda),观测序列(O);
输出:观测序列概率(Pleft( O|lambda ight))。
-
根据公式((1.8)),设定初值。
-
根据公式((1.9))递推。其中(t=1,2,cdots,T-1)。
-
终止。根据公式((1.10))得到输出。
python实现(李航《统计学习方法》177页例题10.2):
#!/usr/bin/env python
# -*- coding: UTF-8 -*-
"""
@author: XiangguoSun
@contact: sunxiangguodut@qq.com
@file: forward_prob.py
@time: 2017/3/13 8:53
@software: PyCharm
"""
import numpy as np
def forward_prob(model, Observe, States):
'''
马尔科夫前向算法
'''
A, B, pi = model
N = States.size
T = Observe.size
alpha = pi*B[:, Observe[0]]
print "(1)计算初值alpha_1(i): ",alpha
print "(2) 递推..."
for t in xrange(0, T-1):
print "t=", t+1," alpha_",t+1,"(i):",alpha
alpha = alpha.dot(A)*B[:, Observe[t+1]]
print "(3)终止。alpha_",T,"(i): ", alpha
print "输出Prob: ",alpha.sum()
return alpha.sum()
if __name__ == '__main__':
A = np.array([[0.5, 0.2, 0.3],
[0.3, 0.5, 0.2],
[0.2, 0.3, 0.5]])
B = np.array([[0.5, 0.5],
[0.4, 0.6],
[0.7, 0.3]])
pi = np.array([0.2, 0.4, 0.4])
model = (A, B, pi)
Observe = np.array([0, 1, 0])
States = np.array([1, 2, 3])
forward_prob(model,Observe,States)
后向算法
后向概率:(eta_tleft( i ight)=left( o_{t+1:T}|I_t=q_i ight))
初始后向概率:(eta_Tleft(i ight)=1,i=1,2,cdots,N)
后向概率迭代推导:
终止状态推导:
算法1.2(观测序列概率的后向算法)
输入:隐马尔科夫模型(lambda),观测序列(O);
输出:观测序列概率(Pleft( O|lambda ight))。
- 设定后向概率初值为1。
- 根据公式((1.11))递推。其中(t=T-1,T-2,cdots,1)。
- 终止。根据公式((1.12))得到输出。
python实现(李航《统计学习方法》177页例题10.2):
#!/usr/bin/env python
# -*- coding: UTF-8 -*-
"""
@author: XiangguoSun
@contact: sunxiangguodut@qq.com
@file: markov.py
@time: 2017/3/13 8:53
@software: PyCharm
"""
import numpy as np
def forward_prob(model, Observe, States):
'''
马尔科夫前向算法
'''
A, B, pi = model
N = States.size
T = Observe.size
alpha = pi*B[:, Observe[0]]
print "(1)计算初值alpha_1(i): ",alpha
print "(2) 递推..."
for t in xrange(0, T-1):
alpha = alpha.dot(A)*B[:, Observe[t+1]]
print "t=", t + 1, " alpha_", t + 1, "(i):", alpha
print "(3)终止。alpha_",T,"(i): ", alpha
print "输出Prob: ",alpha.sum()
return alpha.sum()
def backward_prob(model,Observe,States):
'''
马尔科夫后向算法
'''
A, B, pi = model
N = States.size
T = Observe.size
beta = np.ones((N,)) # beta_T
print "(1)计算初值beta_",T,"(i): ", beta
print "(2) 递推..."
for t in xrange(T - 2, -1, -1): # t=T-2,...,0
beta = A.dot(B[:, Observe[t + 1]] * beta)
print "t=", t + 1, " beta_", t + 1, "(i):", beta
print "(3)终止。alpha_", 1, "(i): ", beta
prob = pi.dot(beta * B[:, Observe[0]])
print "输出Prob: ", prob
return prob
if __name__ == '__main__':
A = np.array([[0.5, 0.2, 0.3],
[0.3, 0.5, 0.2],
[0.2, 0.3, 0.5]])
B = np.array([[0.5, 0.5],
[0.4, 0.6],
[0.7, 0.3]])
pi = np.array([0.2, 0.4, 0.4])
model = (A, B, pi)
Observe = np.array([0, 1, 0])
States = np.array([1, 2, 3])
forward_prob(model,Observe,States)
backward_prob(model, Observe, States)
实验结果: