Sphinx语音识别学习记录（一）基本运行测试

Sphinx语音识别学习记录（一）基本运行测试
CMUSphinx系列目录
http://www.cnblogs.com/yin52133/archive/2012/06/21/2557219.html - （一）基本运行测试 http://www.cnblogs.com/yin52133/archive/2012/07/12/2587282.html - （二）自然语言处理原理研究 http://www.cnblogs.com/yin52133/archive/2012/07/12/2587419.html - （三）小范围语音英文识别 http://www.cnblogs.com/yin52133/archive/2012/07/12/2588201.html - （四）小范围语音中文识别 http://www.cnblogs.com/yin52133/archive/2012/06/22/2558806.html - （五）错误调试 http://www.cnblogs.com/yin52133/archive/2012/07/12/2588418.html - （六）我的目标和几个想像的方案（闲置中）
这一阵子因为个人的某个需求开始研究语音识别

找了一阵子之后决定选择研究下cmusphinx

下面是官方的介绍

http://cmusphinx.sourceforge.net/wiki/

现在网上相关资料基本只有官方的帮助文档和下面的Sphinx武林秘籍了

http://www.cnblogs.com/huanghuang/archive/2011/07/14/2106579.html

运行版本为

pocketsphinx 0.7

sphinxbase 0.7

先可以尝试跟上面的武林秘籍里的一样，跑起样例项目pocketsphinx_continuous

这个有助于抓住基本使用方式和脉路

pocketsphinx_continuous 跟武林秘籍一样输入两套参数的话我这里会报错、会表示我没指定声学模型

我是添加了这个参数、使用自带的模型算法

-hmm

hub4wsj_sc_8k

然后就是几个参数的意义

hmm Hidden Markov Model隐马尔可夫模型模型训练算法
lm language model
dict 字典、这几种东西以前没搞过语音识别、完全不懂、从头开始查资料学习的

command.txt

stop
music
computer
dump
close

用这个文本使用lmtool创建了语言模型和字典

7721.lm 7721.dic

pocketsphinx_continuous -hmm hub4wsj_sc_8k -lm 7721.lm -dict 7721.dic

中间运行到这

Allocating 32 buffers of 2500 samples each
READY....

Listening...

这里你就用麦克风说话、他就帮你识别是什么。。。空白时间间隔在1s时会停止录音

下面这种是识别出来的结果

000000000: STOP (-6531224)

我使用的自带的 hub4wsj_sc_8k 这个模型、不知道是口音问题还是基础的模型问题、句子稍长点就老多识别出来好几个dump

（该问题后面已找到问题并解决）
文章出处：http://www.cnblogs.com/yin52133/ 本文可自行转载，但转载时记得给出原文链接
相关阅读:
Unique Encryption Keys 暴力学习map，vector 函数
 hdu 1250 Hat's Fibonacci
匈牙利算法模板图的二分匹配 hdu 2063 过山车
 hdu 4260 汉诺塔问题 The End of The World
各种常见文件的hex文件头
 Ubuntu & node.js
Linux周期性任务的执行指令配置
 MySQL各版本的性能特性(从4.0版本开始)
Tsung 1.5.0 增加对 WebSocket 和 BOSH 的支持
 ShowSlow+Yslow环境搭建
原文地址：https://www.cnblogs.com/yin52133/p/2557219.html

Sphinx语音识别学习记录 （一）基本运行测试

Sphinx语音识别学习记录（一）基本运行测试