Speex是近年来开发出的一套功能强大的语音引擎,能够实现高质量和低比特率的编码。它不仅提供了基于码激励线性预测(CELP)算法的编/解码模块,而且在其最新发布的版本中还提供了声音预处理和声学回声消除模块,为保障IP网络中的语音通信质量提供了技术手段。此外,Speex还具有压缩后的比特率低(2~44 kbps)的特点,并支持多种比特率。这些特点使得Speex特别适合VoIP的系统。
虽然是开源的,但是使用的人还不是很多,网上的资料也很少,下面简单给大家介绍一下如何使用speex的API。
一:编码流程
使用Speex的API函数对音频数据进行压缩编码要经过如下步骤:
1、 定义一个SpeexBits类型变量bits和一个Speex编码器状态变量enc_state。
2、 调用speex_bits_init(&bits)初始化bits。
3、 调用speex_encoder_init(&speex_nb_mode)来初始化enc_state。其中speex_nb_mode是SpeexMode类型的变量,表示的是窄带模式。还有speex_wb_mode表示宽带模式、speex_uwb_mode表示超宽带模式。
4、 调用函数int speex_encoder_ ctl(void *state, int request, void *ptr)来设定编码器的参数,其中参数state表示编码器的状态;参数request表示要定义的参数类型,如SPEEX_ GET_ FRAME_SIZE表示设置帧大小,SPEEX_ SET_QUALITY表示量化大小,这决定了编码的质量;参数ptr表示要设定的值。
可通过speex_encoder_ctl(enc_state, SPEEX_GET_FRAME_SIZE, &frame_size) 和speex_encoder_ctl(enc_state, SPEEX_SET_QUALITY, &quality)来设定编码器的参数。
5、 初始化完毕后,对每一帧声音作如下处理:调用函数speex_bits_reset(&bits)再次设定SpeexBits,然后调用函数speex_encode(enc_state, input_frame, &bits),参数bits中保存编码后的数据流。
6、 编码结束后,调用函数speex_bits_destroy (&bits), speex_encoder_destroy (enc_state)来
二:解码流程
同样,对已经编码过的音频数据进行解码要经过以下步骤:
1、 定义一个SpeexBits类型变量bits和一个Speex编码状态变量enc_state。
2、 调用speex_bits_init(&bits)初始化bits。
3、 调用speex_decoder_init (&speex_nb_mode)来初始化enc_state。
4、 调用函数speex_decoder_ctl (void *state, int request, void *ptr)来设定编码器的参数。
5、 调用函数 speex_decode(void *state, SpeexBits *bits, float *out)对参数bits中的音频数据进行解编码,参数out中保存解码后的数据流。
6、 调用函数speex_bits_destroy(&bits), speex_ decoder_ destroy (void *state)来关闭和销毁SpeexBits和解码器。
下面是一段实例代码:
转载请注明:http://hi.baidu.com/a%CC%C7%B3%B4%C0%F5%D7%D3a/
#include <speex.h>
#include <stdio.h>
/*帧的大小在这个例程中是一个固定的值,但它并不是必须这样*/
#define FRAME_SIZE 160
int main(int argc, char **argv)
{
char *inFile;
FILE *fin;
short in[FRAME_SIZE];
float input[FRAME_SIZE];
char cbits[200];
int nbBytes;
/*保存编码的状态*/
void *state;
/*保存字节因此他们可以被speex常规读写*/
SpeexBits bits;
int i, tmp;
//新建一个新的编码状态在窄宽(narrowband)模式下
state = speex_encoder_init(&speex_nb_mode);
//设置质量为8(15kbps)
tmp=8;
speex_encoder_ctl(state, SPEEX_SET_QUALITY, &tmp);
inFile = argv[1];
fin = fopen(inFile, "r");
//初始化结构使他们保存数据
speex_bits_init(&bits);
while (1)
{
//读入一帧16bits的声音
fread(in, sizeof(short), FRAME_SIZE, fin);
if (feof(fin))
break;
//把16bits的值转化为float,以便speex库可以在上面工作
for (i=0;i<FRAME_SIZE;i++)
input[i]=in[i];
//清空这个结构体里所有的字节,以便我们可以编码一个新的帧
speex_bits_reset(&bits);
//对帧进行编码
speex_encode(state, input, &bits);
//把bits拷贝到一个利用写出的char型数组
nbBytes = speex_bits_write(&bits, cbits, 200);
//首先写出帧的大小,这是sampledec文件需要的一个值,但是你的应用程序中可能不一样
fwrite(&nbBytes, sizeof(int), 1, stdout);
//写出压缩后的数组
fwrite(cbits, 1, nbBytes, stdout);
}
//释放编码器状态量
speex_encoder_destroy(state);
//释放bit_packing结构
speex_bits_destroy(&bits);
fclose(fin);
return 0;
}