• java调用科大讯飞流式(websocket)语音识别接口


      要使用讯飞的能力,需先注册讯飞开发平台账号(讯飞官网参见https://www.xfyun.cn/)。

      再创建应用,点击右上角的控制台 -> 创建新应用:

      每个应用都有一个appId,由这个appId关联对应接口鉴权信息,包括apiKey和apiSecret。比如我创建了一个应用“我的转写机” -> 点击该应用 -> 点击左边语音识别里的语音听写(流式版):

      往下拉,点击“文档”,接口说明和demo代码都在:

       

      进入文档后拉到底部,点击链接下载demo和音频:

      修改demo里的appId、apiKey和apiSecret、音频文件所在路径,就可以直接跑了:

      这个接口是websocket协议的,它是把音频文件一段一段的发送到讯飞做语音识别的,最后识别出来后再返回完整内容,如果你想直接获取最后的接口,可以用闭锁阻塞主线程,在websocket关闭时释放闭锁,让主线程继续:

      调用类:

            CountDownLatch iatCountDown = new CountDownLatch(1);
            WebSocket webSocket = client.newWebSocket(request, new WebIATWS(fullFileName, appId, result, iatCountDown, from));
    
            // 阻断主线程,等待websocket识别完所有语音流
            iatCountDown.await();

      WebIATWS:

        @Override
        public void onMessage(WebSocket webSocket, String text) {
            super.onMessage(webSocket, text);
            System.out.println(text);
            Gson json = new Gson();
            IatResult resp = json.fromJson(text, IatResult.class);
            if (resp != null) {
                if (resp.getCode() != 0) {
                    log.error("code=> :{}, error=> :{}, sid= :{}", resp.getCode(), resp.getMessage(), resp.getSid());
                    return;
                }
                if (resp.getData() != null) {
                    if (resp.getData().getResult() != null) {
                        Text te = resp.getData().getResult().getText();
                        System.out.println(te.toString());
                        try {
                            decoder.decode(te);
                            log.info("send continue, result: {}", decoder.toString());
                        } catch (Exception e) {
                            log.error("call onMessage failed, error :{}", e.getMessage());
                            return;
                        }
                    }
                    if (resp.getData().getStatus() == 2) {
                        //说明数据全部返回完毕,可以关闭连接,释放资源
                        log.info("session finish.");
                        dateEnd = new Date();
                        log.info("cost time: {} ms", dateEnd.getTime() - dateBegin.getTime());
                        log.info("final result: {}", decoder.toString());
                        ResultData data = new ResultData();
                        data.setResult(decoder.toString());
                        listenResult.setData(data);
                        countDownLatch.countDown();
                        decoder.discard();
                        webSocket.close(1000, "");
                    }
                }
            }
        }
  • 相关阅读:
    神经网络学习笔记
    SQL 快速生成千万数据
    云图说用图片的形式展示APM的功能的重要性
    skywalking实现参数的动态调整功能
    skywalking告警篇详细分析
    skywalking UI大盘制作ppt必看
    skywalking性能分析在线代码级性能剖析,补全分布式追踪的最后一块“短板”
    技术中台报警指标说明
    skywalking告警篇详细分析(二)
    skywalkingUI功能详细说明
  • 原文地址:https://www.cnblogs.com/wuxun1997/p/11353221.html
Copyright © 2020-2023  润新知