用 Seaborn 做数据可视化(1)——绘图功能(3)可视化数据集的数据分布

传送门:用 Seaborn 做数据可视化(0)总章

目录:可视化数据集的数据分布

    • 1. 可视化单变量分布:distplot()
    • 2. 可视化二元分布:jointplot()
      • 2.1 散点图分布:jointplot() (默认 Kind=“scatter” )
      • 2.2 核密度分布:jointplot(kind="kde" )
      • 2.3 六边形分布: jointplot(kind="hex")
    • 3. 成对关系: 矩阵图:pairplot()

注意:这里的 distplot()、jointplot()、pairplot() 是高级的函数,很多简单的图像也可以直接借助 sns.hist()、sns. kdeplot();plt.scatter()、plt.hexbin()等函数直接进行绘图。

1. 可视化单变量分布:distplot()

distplot() 将频次直方图和 KDE 结合起来(默认绘制直方图并拟合 KDE )

x = np.random.normal(size=100)
sns.distplot(x);

用 Seaborn 做数据可视化(1)——绘图功能(3)可视化数据集的数据分布_第1张图片
参数 kde=False,rug=True:不画 KDE

sns.distplot(x, kde=False, rug=True);
# 或者直接使用 rugplot() 函数

用 Seaborn 做数据可视化(1)——绘图功能(3)可视化数据集的数据分布_第2张图片当然如开头所说,,也可以直接使用 sns.hist()、sns. kdeplot() 来单独绘制频次直方图和核密度图。

2. 可视化二元分布:jointplot()

jointplot()
可视化双变量分布(二元分布),可以同时看到两个变量的联合分布与单变量的独立分布

2.1 散点图分布:jointplot() (默认 Kind=“scatter” )

mean, cov = [0, 1], [(1, .5), (.5, 1)]
data = np.random.multivariate_normal(mean, cov, 200)
df = pd.DataFrame(data, columns=["x", "y"])
sns.jointplot(x="x", y="y", data=df);

用 Seaborn 做数据可视化(1)——绘图功能(3)可视化数据集的数据分布_第3张图片

2.2 核密度分布:jointplot(kind=“kde” )

sns.jointplot(x="x", y="y", data=df, kind="kde");

用 Seaborn 做数据可视化(1)——绘图功能(3)可视化数据集的数据分布_第4张图片同理,入开头所说,,也可以直接使用 plt.scatter()、sns.kdeplot() 来分别绘制散点图、核密度图。

2.3 六边形分布: jointplot(kind=“hex”)

参数 kind=“hex” ,使用六边形块代替频次直方图

# 传递参数 kind= 'hex'
x, y = np.random.multivariate_normal(mean, cov, 1000).T
with sns.axes_style("white"):
    sns.jointplot(x=x, y=y, kind="hex", color="k");

用 Seaborn 做数据可视化(1)——绘图功能(3)可视化数据集的数据分布_第5张图片也可以使用 plt.hexbin()来单独绘制。

3. 成对关系: 矩阵图:pairplot()

pairplot() 矩阵图用来可视化数据集中的成对关系

iris = sns.load_dataset("iris")
sns.pairplot(iris);

用 Seaborn 做数据可视化(1)——绘图功能(3)可视化数据集的数据分布_第6张图片

你可能感兴趣的:(用 Seaborn 做数据可视化(1)——绘图功能(3)可视化数据集的数据分布)