• speex的基本编码和解码流程


    最近在研究speex的编码和解码流程

    之前在IM上用到的都是发语音片段,这个很简单,只需要找到googlecode上gauss的代码,然后套一下就可以用了。

    不过googlecode要关闭,有人将他导入到了github,地址在这里 https://github.com/cczufish/OggSpeex-android

    我也导入了,但是没成功,不知道什么问题,可能级别不够吧,哈哈 https://github.com/dongweiq/android-recorder

    现在我们的需求是要求将语音片段拼接合成,而且要在UI中显示出正在播放的时间,看了gauss的代码后发现,他的代码是边解码边播放的,按照的是short[160]的片段一个个播放的

     1 /* decode each segment, writing output to wav */
     2                 for (curseg = 0; curseg < segments; curseg++) {
     3 
     4                     if (Thread.interrupted()) {
     5                         dis.close();
     6                         track.stop();
     7                         track.release();
     8                         return;
     9                     }
    10 
    11                     while (this.isPaused()) {
    12                         track.stop();
    13                         track.release();
    14                         // Thread.sleep(100);
    15                     }
    16 
    17                     /* get the number of bytes in the segment */
    18                     bodybytes = header[OGG_HEADERSIZE + curseg] & 0xFF;
    19                     if (bodybytes == 255) {
    20                         System.err.println("sorry, don't handle 255 sizes!");
    21                         return;
    22                     }
    23                     dis.readFully(payload, 0, bodybytes);
    24                     chksum = OggCrc.checksum(chksum, payload, 0, bodybytes);
    25 
    26                     /* decode the segment */
    27                     /* if first packet, read the Speex header */
    28                     if (packetNo == 0) {
    29                         if (readSpeexHeader(payload, 0, bodybytes, true)) {
    30                             packetNo++;
    31                         } else {
    32                             packetNo = 0;
    33                         }
    34                     } else if (packetNo == 1) { // Ogg Comment packet
    35                         packetNo++;
    36                     } else {
    37 
    38                         /* get the amount of decoded data */
    39                         short[] decoded = new short[160];
    40                         if ((decsize = speexDecoder.decode(payload, decoded, 160)) > 0) {
    41                             track.write(decoded, 0, decsize);
    42                             float maxVol = AudioTrack.getMaxVolume();
    43                             track.setStereoVolume(maxVol, maxVol);// 设置当前音量大小
    44                             track.play();
    45                         }
    46                         packetNo++;
    47                     }
    48                 }

    而且他还有一个包序号,pacetNo为0则是speex的文件头,占80字节,packetNo为1则查找包序号2,2中就按照160short解码音频,然后播放解码后的wav。

    后来从网上找到以下内容http://blog.163.com/yuan_zhch/blog/static/193790046201172611527217/

    相当于是对整个speex编码和解码的过程的总结吧

    一:编码流程
    使用Speex的API函数对音频数据进行压缩编码要经过如下步骤:
    1、定义一个SpeexBits类型变量bits和一个Speex编码器状态变量enc_state。
    2、调用speex_bits_init(&bits)初始化bits。
    3、调用speex_encoder_init(&speex_nb_mode)来初始 化enc_state。其中speex_nb_mode是SpeexMode类型的变量,表示的是窄带模式。还有speex_wb_mode表示宽带模 式、speex_uwb_mode表示超宽带模式。
    4、调用函数int speex_encoder_ ctl(void *state, int request, void *ptr)来设定编码器的参数,其中参数state表示编码器的状态;参数request表示要定义的参数类型,如SPEEX_ GET_ FRAME_SIZE表示设置帧大小,SPEEX_ SET_QUALITY表示量化大小,这决定了编码的质量;参数ptr表示要设定的值。
    可通过speex_encoder_ctl(enc_state, SPEEX_GET_FRAME_SIZE, &frame_size) 和speex_encoder_ctl(enc_state, SPEEX_SET_QUALITY, &quality)来设定编码器的参数。
    5、初始化完毕后,对每一帧声音作如下处理:调用函数 speex_bits_reset(&bits)再次设定SpeexBits,然后调用函数speex_encode(enc_state, input_frame, &bits),参数bits中保存编码后的数据流。
    6、编码结束后,调用函数speex_bits_destroy (&bits),    speex_encoder_destroy (enc_state)来
    二:解码流程
    同样,对已经编码过的音频数据进行解码要经过以下步骤:
    1、     定义一个SpeexBits类型变量bits和一个Speex编码状态变量enc_state。
    2、   调用speex_bits_init(&bits)初始化bits。
    3、   调用speex_decoder_init (&speex_nb_mode)来初始化enc_state。
    4、    调用函数speex_decoder_ctl (void *state, int request, void *ptr)来设定编码器的参数。
    5、   调用函数 speex_decode(void *state, SpeexBits *bits, float *out)对参数bits中的音频数据进行解编码,参数out中保存解码后的数据流。
    6、   调用函数speex_bits_destroy(&bits), speex_ decoder_ destroy (void *state)来关闭和销毁SpeexBits和解码器。
     
    下面是一段实例代码:
    1. #include <speex.h> 
    2. #include <stdio.h> 
    3. /*帧的大小在这个例程中是一个固定的值,但它并不是必须这样*/ 
    4. #define FRAME_SIZE 160 
    5.   
    6. int main(int argc, char **argv) 
      1. char *inFile; 
      2. FILE *fin; 
      3. short in[FRAME_SIZE]; 
      4. float input[FRAME_SIZE]; 
      5. char cbits[200]; 
      6. int nbBytes; 
      7. /*保存编码的状态*/ 
      8. void *state; 
      9. /*保存字节因此他们可以被speex常规读写*/ 
      10. SpeexBits bits; 
      11. int i, tmp; 
      12. //新建一个新的编码状态在窄宽(narrowband)模式下 
      13. state = speex_encoder_init(&speex_nb_mode); 
      14. //设置质量为8(15kbps) 
      15. tmp=8; 
      16. speex_encoder_ctl(state, SPEEX_SET_QUALITY, &tmp); 
      17. inFile = argv[1]; 
      18.   
      19. fin = fopen(inFile, "r"); 
      20. //初始化结构使他们保存数据 
      21. speex_bits_init(&bits); 
      22. while (1) 
        1. //读入一帧16bits的声音 
        2. fread(in, sizeof(short), FRAME_SIZE, fin); 
        3. if (feof(fin)) 
          1. break; 
        4. //把16bits的值转化为float,以便speex库可以在上面工作 
        5. for (i=0;i<FRAME_SIZE;i++) 
          1. input[i]=in[i]; 
        6.  
        7. //清空这个结构体里所有的字节,以便我们可以编码一个新的帧 
        8. speex_bits_reset(&bits); 
        9. //对帧进行编码 
        10. speex_encode(state, input, &bits); 
        11. //把bits拷贝到一个利用写出的char型数组 
        12. nbBytes = speex_bits_write(&bits, cbits, 200); 
        13. //首先写出帧的大小,这是sampledec文件需要的一个值,但是你的应用程序中可能不一样 
        14. fwrite(&nbBytes, sizeof(int), 1, stdout); 
        15. //写出压缩后的数组 
        16. fwrite(cbits, 1, nbBytes, stdout); 
      23.   
      24. //释放编码器状态量 
      25. speex_encoder_destroy(state); 
      26. //释放bit_packing结构 
      27. speex_bits_destroy(&bits); 
      28. fclose(fin); 
      29. return 0; 
    7. }
  • 相关阅读:
    PhpStorm函数注释的设置
    thinkphp5 返回数组提示variable type error: array
    js获取json对象中的key和value,并组成新数组
    PHP生成随机字符串与唯一字符串
    yii2-admin扩展自定义目录
    PHP7.3发布啦
    服务器环境从PHP5升级到PHP7
    亲测能用的mysqli类,挺好用的
    PHP必用代码片段
    git flow的使用
  • 原文地址:https://www.cnblogs.com/dongweiq/p/4466239.html
Copyright © 2020-2023  润新知