• 关于HEAAC中 QMF的设计以及对时频分析的思考


    众所周知,HE-AAC是由AAC和SBR组合而成,MP3Pro是MP3和SBR组合而成。SBR的目的是实现从低频到高频的预测与复制。而SBR模块中,QMF是核心内容。

    那么QMF是如何设计出来的,作为一个时频分析模块,MDCT才是比较好的应用在音频编解码器里的时频分析系统【1】【2】,那为什么使用QMF呢?他和MP3里的PQF有什么区别?QMF又如何设计?

    一. 为什么使用QMF

    由【1】,戴善荣的《数据压缩》第三章有提到DCT是接近KLT的时频变换(其他书也有提到)。而由【2】微软首席科学家Henrique S. Malvar(也是WMA的发明人之一)的关于MLT和LOT论文,可以得到MDCT是最适合音频分析的时频变换。另外从时频变换在音频编解码的应用中看,从早期的早期的DTS,MP2,ATRAC的PQF/QMF时频分析到新一代的AAC,AC3,ATRAC3中使用MDCT作为时频分析内核,为什么还在更先进的HE-AAC中使用QMF作为时频分析的模块呢?

    原因是,在音频编码初期,音频编码是从波形编码(时域)发展而来,又为了结合掩蔽效应,巴克谱,就使用了结合时域和频域的PQF分析,而新一代(相对早期)音频编码器为了提高频率分辨率。解决PQF的混叠问题,使用了MDCT分析。而不同于为了结合掩蔽效应,巴克谱,和高频率分辨率。SBR的原理是使用低频到高频的预测。并且挖掘频域和时域二维的相关性,不追求高频率分辨率。所以使用了QMF,而不同于PQF,QMF的虚部实现去混叠。这是使用QMF的原因。当然在LP-SBR(Low Power SBR)里面,没有了虚部,他就是一种PQF/QMF。

    详细内容还有关于SBR的论文。

    二。如何设计QMF

    这部分内容请见,《多抽样率数字信号处理理论及其应用》相关章节,就知道如何设计类似的QMF滤波器。

  • 相关阅读:
    [非技术]简单预测中美关系未来的走向
    权限系统模型和常用权限框架
    [Tomcat]了解Tomcat,从它的结构开始
    [Mybatis]用AOP和mybatis来实现一下mysql读写分离
    [MQ]说一说MQ消息积压
    [MQ]再谈延时队列
    [Web] 浅谈Cookie,Session,Token
    k8s搭建
    微信公众平台开发(2)扫描二维码添加公众账号
    微信公众平台开发模式
  • 原文地址:https://www.cnblogs.com/gaozehua/p/2717267.html
Copyright © 2020-2023  润新知