Seaborn:基于Matplotlib,seaborn提供许多功能,比如:内置主题、颜色调色板、函数和提供可视化单变量、双变量、线性回归的工具。其能帮助我们构建复杂的可视化。
————————缩写定义————————
import seaborn as sns
————————函数解析————————
1、绘制一个单变量的观测分布:sns.distplot()
(1)函数原型
distplot(a, bins=None, hist=True, kde=True, rug=False, fit=None, hist_kws=None, kde_kws=None, rug_kws=None, fit_kws=None, color=None, vertical=False, norm_hist=False, axlabel=None, label=None, ax=None)
这个函数结合了matplotlib的“hist”功能(自动计算一个好的默认bin大小)和seaborn:func:“kdeplot”和:func:“rugplot”函数。它也适合“scipy”。统计数据的分布,并根据数据绘制出估计的PDF(概率密度函数)。
(2)参数解释
a:series,1维数组或列表。观测数据。如果这是一个带有“name”属性的系列对象,那么该名称将被用来标记数据轴。
bins:对应matplotlib hist()的参数,或None,可选。设置直方图参数。默认用Freedman-Diaconis法则。设置矩形条数目。
hist:bool,可选。是否要绘制一个(normed)直方图。
kde:bool,可选。是否绘制高斯核密度估计。
rug:bool,可选。是否在支撑轴上显示观测的小细条(边际毛毯)。
fit:随机变量对象,可选。一个带有“fit”方法的对象,返回一个可以被传递到“pdf”方法的元组,该方法是在一个值网格之后的位置参数,以对pdf进行评估。{hist, kde, rug, fit}_kws:字典,可选的关键字参数,用于潜在的绘图功能。
color:matplotlib color, 可选。用于绘制所有除了拟合曲线。
vertical:bool,可选。是否在y轴上显示观测值。
norm_hist:bool,可选。如果为True,直方图高度显示的是密度而不是计数。这是暗示一个KDE或拟合密度被绘制。
axlabel:字符串、False或None,可选。支持轴标签的名称。如果为None,就试着从a那里得到它,如果是False,则不设置标签。
label:字符串,可选。图上相关成分的图例标签。
ax:matplotlib axis, 可选。如果提供,在这个轴上绘图。
(3)返回值
ax:matplotlib Axes。返回坐标轴对象,并进行进一步调整。
2、拟合和绘制单变量或双变量核密度估计:sns.kdeplot()
(1)函数原型
kdeplot(data, data2=None, shade=False, vertical=False, kernel='gau', bw='scott', gridsize=100, cut=3, clip=None, legend=True, cumulative=False, shade_lowest=True, cbar=False, cbar_ax=None, cbar_kws=None, ax=None, **kwargs)
(2)参数解释
data:1维array_like。输入数据
data2:1维array_like,可选。第二个输入数据。如果存在,则估计一个双变量KDE。
shade:bool,可选。如果True,显示在KDE曲线下的区域的阴影(或者当数据是双变量的时候用填充的轮廓线绘制)。
vertical:bool,可选。如果True,在x轴上显示密度。
kernel:{'gau' | 'cos' | 'biw' | 'epa' | 'tri' | 'triw' }, 可选。控制拟合的内核形状。双变量KDE只能使用高斯核'gau'。
bw:{'scott' | 'silverman' | scalar | pair of scalars }, 可选。为双变量图的每个维度确定内核大小、标量系数或标量的引用方法的名称。
gridsize:整型,可选。评价网格中离散点的个数。
cut:标量,可选。从最极端的数据点上画出估算值来cut * bw。
clip:pair of scalars(标量), or pair of pair of scalars, 可选。用于拟合KDE的数据点的下界和上界。可以为双变量图提供一对(低,高)边界。
legend:bool,可选。如果可能的话,添加一个图例或者标记出坐标轴。
cumulative:bool,可选。如果True,画出kde估计的累积分布。
shade_lowest:bool,可选。如果True,则绘制双变量KDE图的最低轮廓。在绘制单变量图或当“shade=False”时不相关。当你想要在同一个坐标轴上有多个密度时,把这个设置为“False”可以很有用。
cbar:bool,可选。如果True且为双变量KDE图,则添加一个colorbar。
cbar_ax:matplotlib axes, 可选。在现有的坐标轴上画除colorbar,否则space is taken from the main axes.
cbar_kws:字典,可选。对于fig.colorbar()的关键字参数。
ax:matplotlib axes, 可选。用于绘制的坐标轴,否则使用当前坐标轴。
kwargs:键值对。其他关键字参数用于传递给plt.plot()或plt.contour{f}(具体哪一个取决于单变量还是双变量KDE)
(3)返回值
ax:matplotlib Axes。