http://www.cnblogs.com/yin52133/archive/2012/06/21/2557219.html - (一)基本运行测试 http://www.cnblogs.com/yin52133/archive/2012/07/12/2587282.html - (二)自然语言处理原理研究 http://www.cnblogs.com/yin52133/archive/2012/07/12/2587419.html - (三)小范围语音英文识别 http://www.cnblogs.com/yin52133/archive/2012/07/12/2588201.html - (四)小范围语音中文识别 http://www.cnblogs.com/yin52133/archive/2012/06/22/2558806.html - (五)错误调试 http://www.cnblogs.com/yin52133/archive/2012/07/12/2588418.html - (六)我的目标和几个想像的方案(闲置中)
这一阵子因为个人的某个需求开始研究语音识别
找了一阵子之后决定选择研究下cmusphinx
下面是官方的介绍
http://cmusphinx.sourceforge.net/wiki/
现在网上相关资料基本只有官方的帮助文档和下面的Sphinx武林秘籍了
http://www.cnblogs.com/huanghuang/archive/2011/07/14/2106579.html
运行版本为
pocketsphinx 0.7
sphinxbase 0.7
先可以尝试跟上面的 武林秘籍里的一样,跑起样例项目pocketsphinx_continuous
这个有助于抓住基本使用方式和脉路
pocketsphinx_continuous 跟武林秘籍一样输入两套参数的话 我这里会报错、会表示我没指定声学模型
我是添加了这个参数、使用自带的模型算法
-hmm
hub4wsj_sc_8k
然后就是几个参数的意义
hmm Hidden Markov Model隐马尔可夫模型 模型训练算法
lm language model
dict 字典、 这几种东西以前没搞过语音识别、完全不懂、从头开始查资料学习的
command.txt
stop
music
computer
dump
close
用这个文本使用lmtool创建了语言模型和字典
7721.lm 7721.dic
pocketsphinx_continuous -hmm hub4wsj_sc_8k -lm 7721.lm -dict 7721.dic
中间运行到这
Allocating 32 buffers of 2500 samples each
READY....
Listening...
这里你就用麦克风说话、他就帮你识别是什么。。。空白时间间隔在1s时会停止录音
下面这种是识别出来的结果
000000000: STOP (-6531224)
我使用的自带的 hub4wsj_sc_8k 这个模型、不知道是口音问题还是基础的模型问题、句子稍长点就 老多识别出来好几个dump
(该问题后面已找到问题并解决)