今天再读Henrique S.Marlvar的"Biorthgonal and Nonuniform Lapped Transforms for Transform Coding with Reduced Blocking and Ringing Artifacts",决定一定要做点记录不能学点忘点。
关于Henrique S. Malver的简介再开博写吧。。。。。
1.变换编码的主要重建噪声有两种,主要是在LBR时出现,一种是Blocking(Tiling)artifacts,一种是Ringing artifacts。
块效应是由于变换编码重建块的级联(concatenation)而导致的在块边界产生的artifacts。
Ringing artifacts是因为量化变换系数然后重建信号而导致的误差分散在整个块时间上的问题,这也是Pre echo产生的主要原因。
(从这里可以看到2个问题,第一,减少ringing效应可以减少preecho效应,第二,AAC的TNS问题去除的Pre echo是为了解决MDCT没有解决好的Pre echo/Ringing Artifacts问题)。
2.解决Blocking artifacts问题的方法是可以使用Lapped Transform。
3.Lapped Transform有两种属性:一个是,LT的长度要长于Block size,另一个是,在边界系数要平滑的衰减到0.
4.那么就有有一种Lapped Orthogonal Transform符合LT的要求,并且具有另一个属性是线性相位。(偶数或奇数对称)
(注:G.722中的QMF就是一种LOT)
5.而另一种Lapped transform,也就是Modulated Lapped Transform也是一种流行的余弦调制滤波器组,因为MLT的窗是在边界强制渐进的衰减(decay)到0,所以他甚至有比LOT更低的Blocking效应。
但是,MLT不是线性相位,所以不是很用于音频编码。
(注,G.722.1也就是Real CooK,Siren 7也是使用的是MLT,难道是错的,或是做的相位处理?我知道G.722.1是面向单声道的,所以可以不考虑相位问题,但Real Cook在使用G.722.1授权的时候想了什么?)
总结一下,MLT两个特点:
<1> 窗衰减
<2> 不是线性相位。
6.Ringing Artifacts 主要发生在瞬态信号上(transient signals)。
7.LT的属性之一,长度超过块长会导致更多的Ringing 效应产生(理解一下??为什么)并且形成pre-echo