• 5.16-在线词识别程序学习(ASR+IAT)


    一些信息

    6.bin文件夹是调试路径,里面文件的作用如下:

      msc.dllWIN32平台程序必需的动态库;

      msc_x64.dllx64平台程序必需的动态库;

      msc.cfg包含了配置信息,调试、测试时不需改动,发布产品后可以将倒数第五行的“output=1”改为“output=0”,“output=1”时会输出运行日志到msc.log,在调试时出现问题可以发给我们帮助你分析,“output=0”时会关闭日志输出,为用户节省磁盘空间;

      asr_keywords_utf8.txtasrdemo中用到的命令词列表,编码为UTF8,对其内容进行修改时,请不要用系统自带的记事本程序,建议使用Notepad++UltraEdit等文本编辑软件;

      gm_continuous_digit.abnfasrdemo_with_abnf中用到的语法文件,编码为GB2312,对其内容进行修改时,请参照doc文件夹下的《语法开发指南》;

      wav文件夹里面都是事先准备好的录音文件,分别用于asrdemoasrdemo_with_abnfiatdemoiatdemo_with_multi-result

      当运行过样例程序之后,还会生成一个以md5值为名的文件夹,其中保存的文件内容是程序运行中记录的性能信息和错误信息,将会上传到服务器,有利于我们改善服务质量,请不要删除。

    7.新增iatdemo_with_user_vocabulary(上传用户词表demo),关键词上传后,当次会话没有效果,云端需要一段时间对关键词表进行激活,稍后才能正常使用。

    iat(语音听写)和asr(语音识别)均可以上传用户词列表,但目前不知道其区别。

    ASR上传命令词程序学习

    TXT文件中添加关键词,重新上传获得GID,只需上传一次即可,记住ID,以便以后使用,若添加了新关键词,则需重新上传获得ID

    若列表中没有这个词语,则显示结果与此类似:

    The result is: confidence=91 grammar=0 id=nomatch name=nomatch:out-of-vocainput=nomatch:out-of-voca

    对“喂你好我是一名大学生”添加不同种类关键词的影响

    添加整句话,识别率高,效率低

    长传新的词表后"科大讯飞"被识别为"歌华有线",此表中两个词语同时存在,"歌华有线"删除,重新上传,"科大讯飞"识别为"葛洲坝",4,5均无法识别,不知道激活时间有多长

    经过一天等待,情况没有改善,应该仔细审读程序,消除Grammar的问题。

    调整压缩比等上传参数,使得识别效果和消耗时间指标比较均衡

     

    科大讯飞语音功能小结

    科大讯飞的示例demo比较炕爹,它必须在你申请的appid基础上运行,否则会出错哦!也就是你必须申请appid,然后才能下载示例demo,很炕爹吧!

     

    这里我就不多余重复开发文档中的了,说一些自己的理解:

    1.我之前有一个想法,就是科大讯飞在语音识别的时候,需要你上传命令词,词表或者联系人,我们可以在注册开发者的时候在自己的信息中上传自己的词库,然后我们在程序中只需要通过登录来获取一个标示token什么的,这样的话,如果你的词库发生变化了,就不需要更改代码了,只需要在自己的开发者信息下重新上传一下,不用更改程序了,科大讯飞的技术支持的回复是web端没有提供这个接口,他们的回复是:我们可以申请一个web端的appid,然后在自己的服务器上做这样的处理

    2. 词表和联系人在上传的时候没有返回grammerID,在语音识别的时候需要登录,上传一次;命令词和abnf语法上传也是上传一次,但是这里会回复一个grammerID这样就需要在语音识别的时候传参。

    3.命令词和词表的区别在于:

         命令词:语音识别的时候会只在命令词的范围内搜索

         词表:语音识别优先从词表中搜索

    4.在添加的框架中如果是在ios5系统下ADSupport.framework要设为optional

    5.如果想要自定义UI则须参考无UIdemo,然后在- (void) onVolumeChanged: (int) volume;这个回调里面随着语音的音量大小来切换图片

    6.grammerID可以跨平台使用 

     

    Inserted from <http://blog.csdn.net/mdk132/article/details/17004905>


  • 相关阅读:
    【业务自动化】iTop,全面支持ITIL流程的一款ITSM工具
    【Hadoop】HDFS源码解读
    【Hadoop】Hadoop RPC框架线程模型
    电商网站项目(一)用户模块---门户
    jdk1.5后枚举类的定义规则
    回顾static与final的作用
    @Springboot搭建项目controller层接收json格式的对象失败
    把一个文件中所有文件名或者文件路径读取到一个txt文件,然后在matlab中读取
    springboot用mybatis-generator自动生成mapper和model
    hibernate、mybatis、spring data 的对比
  • 原文地址:https://www.cnblogs.com/lizhensheng/p/11241940.html
Copyright © 2020-2023  润新知