语音信号预处理——数字滤波器

语音信号预处理——数字滤波器
滤波器的技术指标

$w_p$：通带截止频率

$w_s$：阻带截止频率

$delta_p$：通带波动

$delta_s$：阻带波动

衰减单位是db

滤波器系数、脉冲响应、频率响应的关系：滤波器变换，时域卷积等于频域乘积，滤波操作在时域表现为输入信号与滤波器脉冲响应的卷积；从频域上看滤波器操作表现为，输入信号的傅立叶变换和脉冲响应的傅立叶变换做乘积。

低通滤波器：只允许某一频率以下的信号无衰减地通过滤波器，其分界处的频率称为截止频率。<p id="lowpass" style="#lowpass:hover{}">图片</p>

高通滤波器：规定高于设定临界值频率（fc）的信号能正常通过，而低于设定临界值频率(fc)的信号则被阻隔和衰减。

带通滤波器：允许特定频率信号通过的滤波器，阻隔和衰减该频带上下频率的信号。带通滤波器可以看做是由高通和低通滤波器协同作用的结果，高通和低通滤波器的截止频率可作为通带的下限频率和上限频率（图3中的L和U点）。其主要参数是中心频率和带宽，上限频率和下限频率之差就是滤波器的带宽。

带阻滤波器：能通过大多数频率分量，但将某些范围的频率分量衰减到极低水平的滤波器，与带通滤波器的概念相对。其中陷波滤波器（notch filter）是一种特殊的带阻滤波器，它的阻带范围极小。

陷波滤波器：可以在某一个频率点迅速衰减输入信号，以达到阻碍此频率信号通过的滤波效果，主要用在电路上滤除不需要的频率的信号。

　　对于FIR滤波器，滤波器系数即为脉冲响应，因此，对于FIR滤波器，系数的FFT变换即为滤波器的频率响应曲线

巴特沃斯滤波器

butterworth低通滤波器的频域特性

$$|H(jw)|^2=frac{1}{1+(frac{omega }{omega _c})^{2N}}$$

N：滤波器的阶数

$omega _c$：3dB截频

典型BW低通滤波器的幅度响应

特点：在通带的频率响应曲线最平滑

Python实现

scipy.signal.butter(N, Wn, btype='low', analog=False, output='ba')

输入
- N：滤波器的阶数
- Wn：截止频率，对于巴特沃斯滤波器，这是增益下降到通带$frac{1}{sqrt 2}$的点（即“-3db点”）。
  - 对于数字滤波器：Wn与fs的单位相同Hz(fs是采样率)，在MATLAB中Wn是归一化截止频率(0,1)，Wn=截止频率/信号频率，（信号频率=采样率的一半，奈奎斯特采样定理）。归一化频率=1，截止频率$w_c$代表采样频率，0.5代表奈奎斯特频率
  - 对于模拟滤波器：Wn是角频率（弧度/秒，radians/second）
- btype：滤波器的类型{'lowpass'，'highpass'，'bandpass'，'bandstop'}
- analog：如果为True，则返回模拟滤波器，否则返回数字滤波器。
输出
- b,a：滤波器系数， a为分母，b为分子。
scipy.signal.freqs(b, a, worN=200, plot=None)　　

计算模拟滤波器的频率响应H(w)。

$$H(w)=frac{b[0]*(jw)**M+b[1]*(jw)**(M-1)+...+b[M]}{ a[0]*(jw)**N + a[1]*(jw)**(N-1) + ... + a[N]}$$

参数
- b,a：线性滤波器的分子和分母，
- worN：可选，如果为None，则计算响应曲线的有趣部分周围的200个频率。如果是一个整数，则计算那么多频率。
返回
- w：计算h的角频率
- h：频率响应(在该频率值得振幅)
scipy.signal.freqz(b, a=1, worN=512, whole=False, plot=None)

计算数字滤波器的频率响应。

$$H(e^{jw})=frac{B(e^{jw})}{A(e^{jw})}=frac{b(1)+b(2)e^{-jw}+...+b(n+1)e^{-jwn}}{a(1)+a(2)e^{-jw}+...+a(m+1)e^{-jwm}}$$

参数
- b,a：线性滤波器的分子和分母
- worN：如果为None（默认值），则计算在单位圆周围等间隔的512个频率。如果是一个整数，则计算那么多频率。如果是array_like，则计算给定频率的响应（以弧度/样本为单位）。
返回
- w：计算h的频率，单位与fs相同。默认情况下，w被归一化为$[0，1)*pi$范围(radians/sample)，例如对于一个采样频率为1000Hz的系统，300Hz则对应300/500=0.6。若要将归一化频率转换为单位圆上的弧度，则将归一化值乘以π即可。图中的0.5表示的是0.5π(rad)，即为w = 0.5π，由 w = 2 * pi * f / fs 得到 f = w * fs / 2pi，即 f = 0.5 * fs / 2 ,因为 fs = 122.88MHz，所以截止频率 f = 30.72MHz。
- h：频率响应，以复数表示
scipy.signal.lfilter(b, a, x, axis=-1, zi=None)

使用IIR或FIR滤波器沿一维过滤数据。使用数字滤波器过滤数据序列x。

输入
- b,a：分子和分母，即滤波器系数
- x：输入数据
返回：数字滤波器的输出
```
from scipy.signal import butter, lfilter
from scipy import signal
import numpy as np 
import matplotlib.pyplot as plt

b, a = signal.butter(4, 100, 'low', analog=True)    # 设计N阶数字或模拟Butterworth滤波器并返回滤波器系数
w, h = signal.freqs(b, a)            # 根据系数计算滤波器的频率响应，w是角频率，h是频率响应
plt.semilogx(w, 20 * np.log10(abs(h)))
plt.title('Butterworth filter frequency response')
plt.xlabel('Frequency [radians / second]')
plt.ylabel('Amplitude [dB]')
plt.margins(0, 0.1)
plt.grid(which='both', axis='both')
plt.axvline(100, color='green') # cutoff frequency
plt.show()
```
提取窄带语音信号

对采样率为16000Hz，奈奎斯特频率为8000Hz的语音，通过巴特沃斯低通滤波器，滤除高于4000Hz频率的语音，提取低频语音。过滤出的信号，在采样率相同的情况下，频率只有原来的一半。
```
import librosa 
import numpy as np
from scipy.signal import butter, lfilter, freqz
import matplotlib.pyplot as plt


def butter_lowpass(cutoff, fs, order=5):
    # cutoff：截止频率
    # fs 采样率
    nyq = 0.5 * fs                     # 信号频率
    normal_cutoff = cutoff / nyq    # 正常截止频率=截止频率/信号频率
    b, a = butter(order, normal_cutoff, btype='lowpass', analog=False)
    return b, a


def butter_lowpass_filter(data, cutoff, fs, order=5):
    b, a = butter_lowpass(cutoff, fs, order=order)
    y = lfilter(b, a, data)
    return y  # Filter requirements.


order = 10
fs = 16000                                        # 采样率, Hz
cutoff = 4000                          # 滤波器的期望截止频率，Hz # 得到滤波器系数，这样我们就可以检查它的频率响应。
b, a = butter_lowpass(cutoff, fs, order)         # 绘制频率响应
w, h = freqz(b, a)
plt.subplot(3, 1, 1)
plt.plot(0.5*fs*w/np.pi, np.abs(h), 'b')
plt.axvline(cutoff, color='k')
plt.xlim(0, 0.5*fs)
plt.title("Lowpass Filter Frequency Response")
plt.xlabel('Frequency [Hz]')

data, wav_fs = librosa.load("./48k/p225_001.wav", sr=16000, mono=True)        # 48000--->16000
y = butter_lowpass_filter(data, cutoff, fs, order)

plt.subplot(3, 1, 2)
plt.specgram(data, Fs=16000, scale_by_freq=True, sides='default')
plt.xlabel('Time [sec]')

plt.subplot(3, 1, 3)
plt.specgram(y, Fs=16000, scale_by_freq=True, sides='default')
plt.xlabel('Time [sec]')

plt.show()
```
切比雪夫I形状滤波器

CB I型低通滤波器的频域特性

$$|H(jw)|^2=frac{1}{1+varepsilon ^2C_N^2(frac{w}{w_c})}$$

N：滤波器的阶数

$varepsilon$：通带波纹

$omega _c$：通带截频

图 CB I型低通滤波器的幅度响应

特点：通带是等波动的，阻带是单调的

scipy.signal.cheby1(N, rp, Wn, btype='low', analog=False, output='ba')

Chebyshev I型数字和模拟滤波器，设计N阶数字或模拟Chebyshev I型滤波器并返回滤波器系数。

参数：
- N：滤波器的阶数
- rp：通带中允许的最大纹波低于单位增益，以分贝为单位，正数
- Wn：对于数字滤波器：Wn应该归一化为(0,1)，Wn=截止频率/信号频率，（信号频率=采样率的一半，奈奎斯特采样定理）对于模拟滤波器：Wn是角频率，弧度/样本，rad/s
- btype：滤波器的类型{'lowpass'，'highpass'，'bandpass'，'bandstop'}
- analog：如果为True，则返回模拟滤波器，否则返回数字滤波器。
- output：默认“ba”,输出分子和分母
返回
- b,a：滤波器系数， a为分母，b为分子。
```
import numpy as np 
from scipy import signal
import matplotlib.pyplot as plt

b, a = signal.cheby1(4, 5, 100, 'low', analog=True)
w, h = signal.freqs(b, a)
plt.semilogx(w, 20 * np.log10(abs(h)))
plt.title('Chebyshev Type I frequency response (rp=5)')
plt.xlabel('Frequency [radians / second]')
plt.ylabel('Amplitude [dB]')
plt.margins(0, 0.1)
plt.grid(which='both', axis='both')
plt.axvline(100, color='green') # cutoff frequency
plt.axhline(-5, color='green') # rp
plt.show()
```
切比雪夫II形状滤波器

CB II型低通滤波器的频域特性

$$|H(jw)|^2=1-frac{1}{1+varepsilon ^2C_N^2(frac{w}{w_c})}$$

N：滤波器的阶数

$varepsilon$：阻带波纹

$omega _c$：阻带截频

图 CB II型低通滤波器的幅度响应

特点：通带是单调的，阻带是等波动的

scipy.signal.cheby2(N, rs, Wn, btype='low', analog=False, output='ba')

Chebyshev II型数字和模拟滤波器，设计N阶数字或模拟Chebyshev II型滤波器并返回滤波器系数。

参数：
- N：滤波器的阶数
- rs：阻带所需最小衰减，以分贝为单位，正数
- Wn：对于数字滤波器：Wn应该归一化为(0,1)，Wn=截止频率/信号频率，（信号频率=采样率的一半，奈奎斯特采样定理）对于模拟滤波器：Wn是角频率，弧度/样本，rad/s
- btype：滤波器的类型{'lowpass'，'highpass'，'bandpass'，'bandstop'}
- analog：如果为True，则返回模拟滤波器，否则返回数字滤波器。
- output：默认“ba”,输出分子和分母
返回
- b,a：滤波器系数， a为分母，b为分子。
```
from scipy import signal
import numpy as np 
import matplotlib.pyplot as plt

b, a = signal.cheby2(4, 40, 100, 'low', analog=True)
w, h = signal.freqs(b, a)
plt.semilogx(w, 20 * np.log10(abs(h)))
plt.title('Chebyshev Type II frequency response (rs=40)')
plt.xlabel('Frequency [radians / second]')
plt.ylabel('Amplitude [dB]')
plt.margins(0, 0.1)
plt.grid(which='both', axis='both')
plt.axvline(100, color='green') # cutoff frequency
plt.axhline(-40, color='green') # rs
plt.show()
```
椭圆低通滤波器

椭圆模拟低通滤波器的频域特性

图椭圆低通滤波器的幅度相应

特点：通带和阻带都等波动

scipy.signal.ellip(N, rp, rs, Wn, btype='low', analog=False, output='ba')

椭圆数字和模拟滤波器，设计N阶数字或模拟椭圆滤波器并返回滤波器系数。

参数：
- N：滤波器的阶数
- rp：通带中允许的最大纹波低于单位增益，以分贝为单位，正数
- rs：阻带所需最小衰减，以分贝为单位，正数
- Wn：对于数字滤波器：Wn应该归一化为(0,1)，Wn=截止频率/信号频率，（信号频率=采样率的一半，奈奎斯特采样定理）对于模拟滤波器：Wn是角频率，弧度/样本，rad/s
- btype：滤波器的类型{'lowpass'，'highpass'，'bandpass'，'bandstop'}
- analog：如果为True，则返回模拟滤波器，否则返回数字滤波器。
- output：默认“ba”,输出分子和分母
返回
- b,a：滤波器系数， a为分母，b为分子。
```
import numpy as np 
from scipy import signal
import matplotlib.pyplot as plt

b, a = signal.ellip(4, 5, 40, 100, 'low', analog=True)
w, h = signal.freqs(b, a)
plt.semilogx(w, 20 * np.log10(abs(h)))
plt.title('Elliptic filter frequency response (rp=5, rs=40)')
plt.xlabel('Frequency [radians / second]')
plt.ylabel('Amplitude [dB]')
plt.margins(0, 0.1)
plt.grid(which='both', axis='both')
plt.axvline(100, color='green') # cutoff frequency
plt.axhline(-40, color='green') # rs
plt.axhline(-5, color='green') # rp
plt.show()
```
下采样方法

插值方法进行下采样

Volodymyr Kuleshov的论文中使用抗混叠滤波器对语音信号进行下采样，再通过三次样条插值把下采样信号上采样到相同的长度。
```
from scipy.signal import decimate
import librosa 
import numpy as np 
import matplotlib.pyplot as plt 
from scipy import interpolate

def upsample(x_lr, r):
    """
    上采样，每隔一步去掉语音波形的r个点，然后用三次样条插值的方法把去掉的点补回来，有机会可以画图看看
    :param x_lr:    音频数据
    :param r:       样条插值前个数
    :return:        样条插值后的音频信号
    """
    x_lr = x_lr.flatten()                   # 把x_lr数组折叠成一维的数组
    x_hr_len = len(x_lr) * r
    i_lr = np.arange(x_hr_len, step=r)
    i_hr = np.arange(x_hr_len)

    f = interpolate.splrep(i_lr, x_lr)      # 样条曲线插值系数
    x_sp = interpolate.splev(i_hr, f)       # 给定样条表示的节点和系数，返回在节点处的样条值

    return x_sp


yt, wav_fs = librosa.load("./48k/p225_001.wav", sr=16000, mono=True)
x_lr = decimate(yt, 2)          # 应用抗混叠滤波器后对信号进行下采样，获得低分辨率音频，下采样因子scale=2

print(len(yt))
print(len(x_lr))

plt.subplot(2, 1, 1)
plt.specgram(yt, Fs=16000, scale_by_freq=True, sides='default')

x_lr = upsample(x_lr, 2)       # 上采样
plt.subplot(2, 1, 2)
plt.specgram(x_lr, Fs=16000, scale_by_freq=True, sides='default')

plt.show()
```
重采样(signal.resample)——下采样

利用重新采样的方法对语音进行下采样

scipy.signal.resample(x, num, t=None, axis=0, window=None)

沿给定轴使用傅立叶方法重新采样x到num个样本。因为使用傅立叶方法，所以假设信号是周期性的。

参数：
- x：要重采样的数组
- num：重采样信号的样本数
返回：
- resample_x：重新采样返回的数组
```
import librosa 
from scipy import signal
import numpy as np
import matplotlib.pyplot as plt

y, wav_fs = librosa.load("./48k/p225_001.wav", sr=16000, mono=True) 
f = signal.resample(y, len(y)//2)
f = signal.resample(f, len(y))

plt.subplot(2,1,1)
plt.specgram(y, Fs=16000, scale_by_freq=True, sides='default')

plt.subplot(2,1,2)
plt.specgram(f, Fs=16000, scale_by_freq=True, sides='default')

plt.show()
```
librosa.core.resample重采样(下采样)

凌振华老师的下采样方法和上面的一样
```
import librosa 
from scipy import signal
import numpy as np
import matplotlib.pyplot as plt

y, wav_fs = librosa.load("./48k/p225_001.wav", sr=16000, mono=True) 
audio8k = librosa.core.resample(y, wav_fs, wav_fs/2)            # 下采样率 16000-->8000
audio8k = librosa.core.resample(audio8k, wav_fs/2, wav_fs)    # 上采样率 8000-->16000，并不恢复高频部分

plt.subplot(2,1,1)
plt.specgram(y, Fs=16000, scale_by_freq=True, sides='default')

plt.subplot(2,1,2)
plt.specgram(audio8k, Fs=16000, scale_by_freq=True, sides='default')

plt.show()
```
librosa.load下采样

用librosa.load想下采样，再不恢复频率的情况下上采样。
```
import librosa 
import matplotlib.pyplot as plt

y_16k, fs_16k = librosa.load("./48k/p225_001.wav", sr=16000, mono=True) 
y_8k, fs_8k = librosa.load("./48k/p225_001.wav", sr=8000, mono=True) 
librosa.output.write_wav('./8k_sample.wav', y_8k, sr=8000)    # 把下采样的写好
y_8k, fs_8k = librosa.load("./8k_sample.wav", sr=16000, mono=True)     # 失去的就补不回来了


plt.subplot(2, 1, 1)
plt.specgram(y_16k, Fs=16000, scale_by_freq=True, sides='default')
plt.xlabel('16k')

plt.subplot(2, 1, 2)
plt.specgram(y_8k, Fs=16000, scale_by_freq=True, sides='default')
plt.xlabel('8k')
plt.show()
```
参考文献

北京交通大学（数字信号处理）陈后金教授

信号处理（scipy.signal）

scipy.signal.butter

scipy.signal.freqs

scipy.signal.freqz

scipy.signal.cheby1

scipy.signal.ellip

scipy.signal.decimate

scipy.signal.resample

Normalized Frequency（*π rad/sample）含义

高通滤波、低通滤波、带通滤波和陷波器的区别
相关阅读:
mongodb常用命令(转)
C++位运算详解(转)
C++Vector用法(转)
php下载文件
 二维数组和指针(转)
php数据采集(转)
通过PHP实现浏览器点击下载TXT文档(转)
Linux 文件颜色的含义
 如何在Linux下创建与解压zip, tar, tar.gz和tar.bz2文件【转】
X11VNC：让Windows可以远程管理Ubuntu桌面
原文地址：https://www.cnblogs.com/LXP-Never/p/10886622.html

语音信号预处理——数字滤波器

滤波器的技术指标

巴特沃斯滤波器

Python实现

提取窄带语音信号

切比雪夫I形状滤波器

切比雪夫II形状滤波器

椭圆低通滤波器

下采样方法

插值方法进行下采样

重采样(signal.resample)——下采样

librosa.core.resample重采样(下采样)

librosa.load下采样

参考文献