• 科大讯飞Mobile Speech Client


    readme

    1.快速了解语音SDK最简单的调用方法,可以根据需要直接看样例代码(Examples),语音合成(文字转换成语音)请参见ttsdemo,语音转写(语音转换成文字)请参见iatdemo

    2.系统性地了解语音SDK请参见doc文件夹下的《开发手册》和《可设置的参数列表》,如果还想了解识别语法的开发,请参照《语法开发指南》;

    3.如果您的开发环境是vs2005或者vs2008,运行时提示“找不到msc.dll”,请在工程属性->调试->工作目录 添加msc.dll文件路径。

    如果您使用的是vs2010或者vs2012,可以跳过此步骤;

    4.打开对应您环境的sln解决方案,可以在解决方案资源管理器中看到列出的几个样例工程,需要调试某个工程时,请右键单击工程名,选择“设为启动项目”;如果您不喜欢一个解决方案中包含多个工程,可以请进入Examples文件夹,进入需要调试的工程文件夹,打开您的开发环境对应的工程文件(vs2005vs2008对应vcproj文件,vs2010vs2012对应vcxproj文件),如果您对各种文件的作用不了解,建议不要进行任何改动;

    5.工程中本身都包含WIN32x64两种平台的配置,在配置管理器中直接选择即可,代码中也会根据选择的平台引用对应的动态库,当然前提是你的vs中安装了对应平台的编译器;

    6.bin文件夹是调试路径,里面文件的作用如下:

      msc.dllWIN32平台程序必需的动态库;

      msc_x64.dllx64平台程序必需的动态库;

      msc.cfg包含了配置信息,调试、测试时不需改动,发布产品后可以将倒数第五行的“output=1改为“output=0,“output=1时会输出运行日志到msc.log,在调试时出现问题可以发给我们帮助你分析,“output=0”时会关闭日志输出,为用户节省磁盘空间;

      asr_keywords_utf8.txtasrdemo中用到的命令词列表,编码为UTF8,对其内容进行修改时,请不要用系统自带的记事本程序,建议使用Notepad++UltraEdit等文本编辑软件;

      gm_continuous_digit.abnfasrdemo_with_abnf中用到的语法文件,编码为GB2312,对其内容进行修改时,请参照doc文件夹下的《语法开发指南》;

      wav文件夹里面都是事先准备好的录音文件,分别用于asrdemoasrdemo_with_abnfiatdemoiatdemo_with_multi-result

      当运行过样例程序之后,还会生成一个以md5值为名的文件夹,其中保存的文件内容是程序运行中记录的性能信息和错误信息,将会上传到服务器,有利于我们改善服务质量,请不要删除。

    7.新增iatdemo_with_user_vocabulary(上传用户词表demo),关键词上传后,当次会话没有效果,云端需要一段时间对关键词表进行激活,稍后才能正常使用。

    识别错误率大的原因分析

    查看语法文件abnf,发现其英文名为“连续数值型”,故推测其语法仅仅适合于特定的环境。由于SDK中只有一个语法文件,所以我在接下来的过程中使用“语音听写”不使用“语音识别”,经过一系列的程序修改后成功识别出文字。


  • 相关阅读:
    c++ 左值、右值;左值引用、右值引用
    leetcode 837 新21点
    c++ 继承和组合
    ubuntu 16.04 常用命令小结
    vim 常用命令小结(转)
    leetcode 1371. 每个元音包含偶数次的最长子字符串 (状压 + 前缀和 +hash)
    leetcode 974 和可被K整除的子数组
    leetcode 910 最小差值II
    关于 mysqladmin
    PHP闭包(Closure)初探
  • 原文地址:https://www.cnblogs.com/lizhensheng/p/11241934.html
Copyright © 2020-2023  润新知