''' 插值:scipy提供了常见的插值算法,可以通过一组离散数据生成符合一定规律的插值函数(连续函数)。这样就可以传入x,得到函数值。 ---插值是实现离散数据连续化的一种方式。 在scipy中的interpolate中可以实现,具体为: func = scipy.interpolate.interp1d(离散数据x坐标,离散数据垂直坐标y,kind='linear') ---返回值:函数 ---kind:表示插值算法,如'linear'线性插值器,'cubic'三次样条插值器 应用领域:数据预处理 案例:提供13个散点,基于scipy的插值得到一个连续函数,绘制这个连续函数图像 ''' import numpy as np import scipy.interpolate as si import matplotlib.pyplot as mp # 造一些散点数据 min_x = -50 max_x = 50 dis_x = np.linspace(min_x, max_x, 15) dis_y = np.sinc(dis_x) # 绘图 mp.figure('Insert Value') mp.scatter(dis_x, dis_y, s=60, c='red', marker='o') # 基于这些离散数据,使用插值获得连续函数---线性插值 func = si.interp1d(dis_x, dis_y, kind='linear') # 绘制func函数 x = np.linspace(min_x, max_x, 1000) y = func(x) mp.plot(x, y, label='linear') # 基于这些离散数据,使用插值获得连续函数---三次样条插值法 func = si.interp1d(dis_x, dis_y, kind='cubic') # 绘制func函数 x = np.linspace(min_x, max_x, 1000) y = func(x) mp.plot(x, y, label='Cubic') mp.show()
注:插值和随机数都可以用于数据预处理,如异常值修正、空白值填充等,如果符合某种概率分布的可以用随机数随机生成,其他的可以用各种插值器进行处理。