• (三)训练HMM模块


    “(二)杂项准备"之后,我们就已经训练了一个hmm模型了——“hmm0”。

    接下来,我们将以“hmm0”作为基础,一路训练到“hmm7"。

    1、从“hmm0"训练到"hmm3":

    执行以下3条命令:

    以hmm0为基础,生成hmm1
    HERest -C ./config/config_color -I ./labels/phones_color.mlf -t 250.0 150.0 1000.0 -S ./config/train.scp -H ./hmm0/macros -H ./hmm0/hmmdefs -M ./hmm1/ ./lists/monoOffSP
    以hmm1为基础,生成hmm2
    HERest
    -C ./config/config_color -I ./labels/phones_color.mlf -t 250.0 150.0 1000.0 -S ./config/train.scp -H ./hmm1/macros -H ./hmm1/hmmdefs -M ./hmm2/ ./lists/monoOffSP
    以hmm2为基础,生成hmm3
    HERest
    -C ./config/config_color -I ./labels/phones_color.mlf -t 250.0 150.0 1000.0 -S ./config/train.scp -H ./hmm2/macros -H ./hmm2/hmmdefs -M ./hmm3/ ./lists/monoOffSP

    以上命令完成之后,在hmm1、hmm2、hmm3目录下都会生成macros和hmmdefs

    2、“特殊处理”hmm4,并生成hmm5:

    (1)获得hmm4目录下hmmdefs文件:

    perl ./scripts/fixSil hmm3/hmmdefs hmm4/hmmdefs

    (2)复制hmm3目录下macros至hmm4目录下:

    cp hmm3/macros ./hmm4/macros

    (3)手动编辑sil.hed文件,并置于config目录下,sil.hed内容如下

    AT 2 4 0.2 {sil.transP}  
    AT 4 2 0.2 {sil.transP}  
    AT 1 3 0.3 {sp.transP}  
    TI silst  {sil.state[3],sp.state[2]} 

    (4)生成hmm5:

    HHEd -H ./hmm4/macros -H ./hmm4/hmmdefs -M hmm5/ config/sil.hed ./lists/monophones

    此时,hmm5目录下会生成hmmdefs和macros

    (5)去除mkphones_color.led最后一行,保存文件mkphones_color_HLEd.led至config目录下

    HLEd -l '*' -d ./dict/dict_color -i ./labels/phones_color.mlf ./config/mkphones_color_HLEd.led ./labels/trainwords.mlf

    3、从“hmm5“训练到"hmm7“:

    以hmm5为基础,生成hmm6
    HERest -C ./config/config_color -I ./labels/phones_color.mlf -t 250.0 150.0 1000.0 -S ./config/train.scp -H ./hmm5/macros -H ./hmm5/hmmdefs -M ./hmm6/ ./lists/monophones
    以hmm6为基础,生成hmm7
    HERest
    -C ./config/config_color -I ./labels/phones_color.mlf -t 250.0 150.0 1000.0 -S ./config/train.scp -H ./hmm6/macros -H ./hmm6/hmmdefs -M ./hmm7/ ./lists/monophones

     注:以上命令执行过后可能会有类似:“WARNING [-2331]  UpdateModels: sp[8] copied: only 0 egs”这样的WANGING,可以暂且忽略。

    训练到“hmm7”,hmm模型就已经能达到不错的识别效果了,理论上来说,训练得越多,识别就会越精确。

    若要训练hmm8、hmm9等等,只要参照以上的“HERest“命令即可。

    不过,我打算就到此为止了。

    让我们看看成果吧!

    HTK Book涉及内容:

    Chapter 3: 3.2.2 Step 7 - Fixing the Silence Models

  • 相关阅读:
    架构 框架 设计模式 --备用
    机器视觉项目开发之---织物疵点检测机器视觉系统 软件测试平台
    多媒体开发之--- live555 vs2010/vs2013下编译,使用,测试
    多媒体开发之--- h264 图像、帧、片、NALU
    多媒体开发之---H264—MP4格式及在MP4文件中提取H264的SPS、PPS及码流
    多媒体开发之---h264格式slice_header
    图像处理之基础---傅立叶c实现
    图像处理之基础---小波提取特征
    图像处理之基础---图像的特征简介
    嵌入式开发之工具---log file
  • 原文地址:https://www.cnblogs.com/ansersion/p/4162605.html
Copyright © 2020-2023  润新知