python图表绘制 | seaborn入门(一):distplot与kdeplot


官方链接:Seaborn: statistical data visualization

Seaborn是一种基于matplotlib的图形可视化python libraty。它提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表。


<img src="" data-rawwidth="547" data-rawheight="620" class="origin_image zh-lightbox-thumb" width="547" data-original="">



  • 基于matplotlib aesthetics绘图风格,增加了一些绘图模式
  • 增加调色板功能,利用色彩丰富的图像揭示您数据中的模式
  • 运用数据子集绘制与比较单变量和双变量分布的功能
  • 运用聚类算法可视化矩阵数据
  • 灵活运用处理时间序列数据
  • 利用网格建立复杂图像集



  1. 利用pip安装
pip install seaborn

2. 在Anaconda环境下,打开prompt

conda install seaborn



seaborn.distplot - seaborn 0.7.1 documentation


seaborn.distplot(a, bins=None, hist=True, kde=True, rug=False, fit=None, hist_kws=None, kde_kws=None, rug_kws=None, fit_kws=None, color=None, vertical=False, norm_hist=False, axlabel=None, label=None, ax=None)


a : Series, 1d-array, or list.

Observed data. If this is a Series object with a name attribute, the name will be used to label the data axis.

bins : argument for matplotlib hist(), or None, optional #设置矩形图数量

Specification of hist bins, or None to use Freedman-Diaconis rule.

hist : bool, optional #控制是否显示条形图

Whether to plot a (normed) histogram.

kde : bool, optional #控制是否显示核密度估计图

Whether to plot a gaussian kernel density estimate.

rug : bool, optional #控制是否显示观测的小细条(边际毛毯)

Whether to draw a rugplot on the support axis.

fit : random variable object, optional #控制拟合的参数分布图形

An object with fit method, returning a tuple that can be passed to a pdf method a positional arguments following an grid of values to evaluate the pdf on.

{hist, kde, rug, fit}_kws : dictionaries, optional

Keyword arguments for underlying plotting functions.

vertical : bool, optional #显示正交控制

If True, oberved values are on y-axis.




直方图(Histogram)又称质量分布图。是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。 一般用横轴表示数据类型,纵轴表示分布情况。

%matplotlib inline
import numpy as np
import pandas as pd
from scipy import stats, integrate
import matplotlib.pyplot as plt #导入

import seaborn as sns

np.random.seed(sum(map(ord, "distributions")))
x = np.random.normal(size=100)
sns.distplot(x, kde=False, rug=True);#kde=False关闭核密度分布,rug表示在x轴上每个观测上生成的小细条(边际毛毯)


<img src="" data-rawwidth="490" data-rawheight="345" class="origin_image zh-lightbox-thumb" width="490" data-original="">



sns.distplot(x, bins=20, kde=False, rug=True);#设置了20个矩形条

<img src="" data-rawwidth="486" data-rawheight="339" class="origin_image zh-lightbox-thumb" width="486" data-original="">


Kernel density estimaton核密度估计


seaborn.kdeplot - seaborn 0.7.1 documentation


sns.distplot(x, hist=False, rug=True);#关闭直方图,开启rug细条

<img src="" data-rawwidth="501" data-rawheight="344" class="origin_image zh-lightbox-thumb" width="501" data-original="">


sns.kdeplot(x, shade=True);#shade控制阴影

<img src="" data-rawwidth="498" data-rawheight="343" class="origin_image zh-lightbox-thumb" width="498" data-original="">


Fitting parametric distributions拟合参数分布

可以利用distplot() 把数据拟合成参数分布的图形并且观察它们之间的差距,再运用fit来进行参数控制。

x = np.random.gamma(6, size=200)#生成gamma分布的数据
sns.distplot(x, kde=False, fit=stats.gamma);#fit拟合

<img src="" data-rawwidth="502" data-rawheight="347" class="origin_image zh-lightbox-thumb" width="502" data-original="">


Example Ⅰ for practice

<img src="" data-rawwidth="536" data-rawheight="525" class="origin_image zh-lightbox-thumb" width="536" data-original="">

Python source code:[download source:]

import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

sns.set(style="white", palette="muted", color_codes=True)
rs = np.random.RandomState(10)

# Set up the matplotlib figure
f, axes = plt.subplots(2, 2, figsize=(7, 7), sharex=True)

# Generate a random univariate dataset
d = rs.normal(size=100)

# Plot a simple histogram with binsize determined automatically
sns.distplot(d, kde=False, color="b", ax=axes[0, 0])

# Plot a kernel density estimate and rug plot
sns.distplot(d, hist=False, rug=True, color="r", ax=axes[0, 1])

# Plot a filled kernel density estimate
sns.distplot(d, hist=False, color="g", kde_kws={"shade": True}, ax=axes[1, 0])

# Plot a historgram and kernel density estimate
sns.distplot(d, color="m", ax=axes[1, 1])

plt.setp(axes, yticks=[])


Example Ⅱ for practice


<img src="" data-rawwidth="300" data-rawheight="350" class="content_image" width="300">



import seaborn as sns
import matplotlib.pyplot as plt
%matplotlib inline
sns.set(style="white", palette="muted", color_codes=True)

train = pd.read_csv('train.csv')#导入数据集


<img src="" data-rawwidth="533" data-rawheight="358" class="origin_image zh-lightbox-thumb" width="533" data-original="">


你可能感兴趣的:(python图表绘制 | seaborn入门(一):distplot与kdeplot)