移动多媒体广播(CMMB) ——信源压缩技术
发布时间: 2008-9-3
作者:国家广播电影电视总局广播科学研究院 郭晓强 解伟 王东飞 付光涛 李小雨
摘要:本文论述了CMMB的信源压缩技术,首先介绍信源压缩编码技术的发展;然后重点对CMMB采用的视频压缩编码、音频压缩编码进行论述,给出 了CMMB所采用的信源编码技术标准,视频参数与音频参数的规定,简要叙述了低码率音视频压缩编码的算法特点;最后说明音频压缩码流与视频压缩码流的 RTP封装规定。
关键词:CMMB 视频 音频 压缩编码
1 引言
CMMB全称为中国移动多媒体广播,是指通过卫星和地面无线广播方式,供七寸以下小屏幕、小尺寸、移动便携的手持终端如手机、PDA、MP4、数码相机、笔记本电脑等接收设备,随时随地接收广播电视节目和信息服务等业务的系统。
移动多媒体广播系统涵盖了信源、复用、信道、卫星、扩展业务、终端等各方面的技术。信源压缩是移动多媒体广播必不可少的组成部分,主要包括视 频压缩编码与音频压缩编码。电视广播节目的视频信号,需要经过视频压缩编码,生成适合信道容量的压缩码流;电视广播节目与声音广播节目的音频信号,需要经 过音频的压缩编码,生成适合信道容量的压缩码流。
传统的数字电视系统中,具有足够的带宽,提供的是广播级的高质量视频与音频信号,采用MPEG-2标准进行信源压缩,对于一路标清电视节目,传 输速率基本在4Mbps以上,而一路高清电视节目要到20Mbps以上,即使采用新一代的信源压缩标准(H.264、AVS等),传输速率可以降低一半左 右,仍需要占用很高的传输带宽。移动多媒体广播系统的特点决定了其带宽资源非常有限,一路电视节目通常只能在500kbps内传输,而音频广播则需要更小 的传输速率,这就要求音视频压缩编码选用低码率、高效的压缩方式,配置合适的音视频参数,采用先进的压缩技术,满足移动多媒体广播对信源压缩编码的要求。
CMMB信源编码系统采用低码率、高效率的音视频压缩编码,输出码流遵循RTP协议,实现与复用系统的连接。本文首先介绍信源压缩编码技术的发展,然后重点对CMMB采用的视频压缩编码、音频压缩编码进行论述,最后说明音频压缩码流与视频压缩码流的RTP封装规定。
2 信源压缩编码技术的发展
视频压缩编码技术与音频压缩编码技术经历了若干年的发展,压缩效率与性能不断提高,涌现出许多国际标准,我国也研发并产生了视频与音频方面的压缩标准。
从国际上看,视频压缩编码标准主要包括MPEG系列与H系列标准。MPEG系列标准是由国际标准化组织ISO/IEC制定的,主要应用于广播 电视、媒体存储、流媒体等应用,包括MPEG-1、MPEG-2、MPEG-4等标准。H系列标准是由国际标准化组织ITU-T制定的,主要应用于会议电 视、可视电话等实时视频通信领域,包括H.261、H.262、H.263、H.264等标准。H.262等同于MPEG-2视频,H.264则被纳入 MPEG-4的第10部分,是由ITU-T与ISO/IEC两个标准组织共同制定的。
一些视频压缩编码标准制定之后,不断补充,产生了不同的版本,H.263制定后又出现了H.263+、H.263++,MPEG-4视频、 H.264也在制定后不断的补充新的技术与算法。H.264作为最新一代的国际标准,采用了先进的变换、预测、熵编码等技术,具有比以往的标准更高的压缩 效率。
另外,视频压缩编码还有其他一些标准,如VC-1,是由微软公司发起,由标准化组织SMPTE定为标准。VC-1也具有较高的压缩效率,同 H.264一样,被视为新一代的信源压缩技术标准。JPEG与JPEG2000标准主要用于静止图像压缩,JPEG2000也用于数字电影的高码率、大尺 寸图像压缩。
音频压缩编码标准主要包括了MPEG-1的layer1(MP1)、layer2(MP2)、layer3(MP3),AC3,AAC等, 这些音频编码技术,都纳入到MPEG系列标准中。AAC音频压缩编码标准是目前应用非常广泛的低码率音频编码标准,相对于MP2、MP3、AC3等音频编 码标准来说,在相同质量下码率更低,有效的节约了传输带宽。AAC最初定为MPEG-2音频压缩编码的标准,之后又纳入到MPEG-4的音频标准中,到现 在已经经历了10年之久,技术体系、关键算法不断的改进,规定了不同的Profile(类)、Object(对象),定义的规格非常多,我们通常所使用的 主要是LC-AAC、HE-AAC、HE-AAC v2。LC为低复杂度的意思,HE则表示高效率。HE-AAC引入了SBR(频段复制)技术,从而提高了压缩效率,通常也称为AAC+;HE-AAC v2引入PS(参量立体声)技术,进一步提高立体声的压缩效率,通常也称为AAC++。
在我国,于2006年相继颁布了视频压缩编码标准AVS、音频压缩编码标准DRA。AVS标准是《信息技术 先进音视频编码》系列标准的简称,AVS标准包括系统、视频、音频、数字版权管理等四个主要技术标准和一致性测试等支撑标准,目前AVS视频为国家标准, 标准号为GB/T 20090.2。
DRA标准是《多声道数字音频编解码技术规范》的简称,被国家信息产业部正式批准为电子行业标准,标准号为SJ/T 11368-2006。
代表先进视频、音频压缩技术的AVS、DRA、H.264、AAC标准,均为适合于CMMB系统的信源压缩编码标准。采用低码率、高压缩效率的信源压缩技术,有效的节约了带宽资源,满足系统需要。
3 CMMB信源压缩系统
如图1所示,信源压缩部分接收音视频源的数据,经过压缩编码处理输出到复用部分。信源压缩系统具备音视频预处理、视频压缩、音频压缩、RTP封装等功能。
移动多媒体广播系统音视频业务分为电视广播业务和声音广播业务,移动多媒体广播系统信源视频、音频压缩编码标准选用为:
(1)电视广播业务中,视频压缩编码采用AVS标准、H.264标准,音频压缩编码采用DRA标准、AAC标准。
(2)声音广播业务中,音频压缩编码采用DRA标准。
4 CMMB视频
4.1 视频压缩编码
视频压缩编码应至少支持以下视频压缩编码规范之一:
—AVS标准,限定为级2.0;
—H.264标准,限定为基本类(Baseline Profile),支持的级如表1所示。
4.2 低码率视频压缩编码算法特点
AVS与H.264在变换、量化、预测、熵编码等方面采用了先进的压缩技术,以下简要介绍CMMB采用AVS与H.264的关键算法。
变换与量化
整数的变换,有效的减少了变换的复杂度,避免了变换与反变换的失配,编码效率与DCT相当。量化与变换相配合,以乘法运算代替除法运算。
帧内预测
根据空域内与当前块相邻的象素,对当前块的所有像素进行预测,而不是在变换域中根据相邻块对当前块的某些系数做预测。有效的去除空间冗余,提高压缩效率。
帧间预测
采用1/4像素精度、多预测块、多参考帧的预测方式,提高的帧间预测准确性,有效的去除时间冗余,提高压缩效率。
熵编码
采用了基于内容的自适应算法,根据相邻块的情况来进行当前块的码表选择,并进行编码,可以达到更好的编码效率。
4.3 视频参数
帧率
视频的帧率至少支持25帧/秒,其它帧率可选。
图像分辨率
图像分辨率支持QVGA(320x240)、QCIF(176x144),其他分辨率可选。
码率
视频压缩码率支持64kbps~768kbps。针对不同的图像分辨率和帧率,对应不同的码率。
帧内预测
支持全部帧内预测。
帧间预测
— 支持16×16、16×8、8×16、8×8块的帧间预测;
— 支持1/4象素精度;
— 支持多参考帧预测。
其他视频压缩参数
— 支持去块效应滤波;
— 支持一帧图像可分多个Slice;
— 要求编码输出的H.264/AVC码流中,每个I帧前必须带有SPS与PPS字段。
5 CMMB音频
5.1 音频压缩编码
音频压缩编码应支持以下两种音频压缩编码规范之一:
— DRA标准
— AAC标准,支持的类包括AAC、HE-AAC,HE-AAC v2为可选。
5.2 低码率音频压缩编码算法特点
5.3 音频参数
6 RTP封装
CMMB系统要求视频编码与音频编码之后,音视频流封装为RTP格式,发送给复用器。RTP及RTCP包的封装及发送应符合 RFC3550,H.264的RTP负载符合RFC3984,AAC的RTP负载符合RFC3016。AVS与DRA的RTP负载的规定简要介绍如下。
6.1 DRA的RTP封装
DRA编码数据采用RFC3550规定的RTP封装格式。RTP包由RTP头和RTP净荷组成,在进行DRA封装时,RTP净荷由16位长度的净荷头和DRA音频帧数据共同组成。
DRA编码器产生的压缩帧帧长根据不同的采样率及码率设定而不同,在高码率编码模式下,帧长可能超出网络MTU(最大传输字节)的限制,这时 在使用RTP传输时,需要对单个音频帧进行分块。DRA同时支持可变码率(VBR)编码,根据音频信息丰富的程度为每帧分配比特资源;传输时为提高网络传 输效率,在MTU允许的情况下,可使用一个RTP包承载多个占用很少帧长的连续音频帧。
6.2 AVS的RTP封装
AVS编码数据采用RFC3550规定的RTP封装格式。RTP包由RTP头和RTP净荷组成,在进行AVS封装时,RTP净荷由4字节长度的净荷头和AVS视频帧数据共同组成,净荷头包含了视频帧数据的长度信息。
AVS编码器产生的每一个图像帧长度可能超出网络MTU的限制,这时在使用RTP传输时,需要对图像帧进行分块,在多个RTP包中传输。如果图像帧长度小于MTU长度,则使用一个RTP包传输图像帧。
7 小结
移动多媒体广播要求低码率、高效率的视频、音频压缩编码,我国的标准AVS、DRA,国际标准H.264、AAC标准都是适合移动多媒体广播的信源压缩标准,实际使用中需要配置合适的编码参数,达到合适的压缩效率与算法复杂度,以适应系统要求。