对于数字音频放大时,很容易造成溢出,波形出现失真,造成许多新的频率分量,直接听感就是噪声、破音等。
常规处理方法就是对波形直接归一化对称,然后根据最大值拉伸到极限的比例放大所有音频采样点。
这种方法能保证声音绝对不失真,缺点在于放大范围比较大。
对于放大后超出音频最大值的样本点,都用最大值代替,相当部分波形被削平,少量还行,出现大量溢出时,严重影响听感。
为了尽最大可能放大音频,且失真度较小,而文献上基本上也很少涉及到该问题。本人先后设计了4种算法处理该问题。最终成功达到了目的。基本上对于
大多数视频中的音频放大500%~800%,也能保证能够接受。
dynamic range compressor
limiter
auto gain control