重要术语说明_语音识别(ASR)_智能语音交互-阿里云 https://help.aliyun.com/document_detail/72238.html
返回模式(response mode)
在调用语音识别服务时进行设置,返回模式有流式(streaming)和整体(total)两个选项。
- “整体”模式只在语音全部识别完后返回一次完整的结果
- “流式”模式下用户一边说话一边返回识别结果,其中除了最后一次是完整的结果,其余的都是中间结果
比如语音是“你好阿里巴巴”,“整体”模式只在用户说完后返回一次最终结果“你好阿里巴巴”;而“流式”可能如下面所列在用户说话的同时返回5次。
你
你好
你好啊
你好阿里
你好阿里巴巴
注意:
- 中间结果可能在后续返回结果中被修正,如“你好啊” -> “你好阿里”
- 每次中间结果增量返回的字数并不固定,并不是每次都比上一次多识别一个字,如“你好阿里”->“你好阿里巴巴”
热词词表(vocabulary)
智能语音识别服务支持用户自定义热词功能,用户可以上传热词词表(vocabulary),得到词表id。在调用语音识别服务时设置vocabulary_id字段,即使用该词表,将会提高该词表中的热词的识别率。