写作由来:
最近在准备数学建模美赛,在画图表的时候,之前一直用的是matplotlib,但是画出来总感觉不是很好看,而美赛挺注重文章的美观,所以找到了另一个实用的高级的Python包——seaborn。
风格(style)
有5种风格 white,whitegrid,dark,darkgrid,ticks,默认是darkgrid
sns.set()
sns.set(style="ticks")
坐标轴出现刻度线
环境(context)
sns.plotting_context("notebook") # 默认
sns.plotting_context("paper")
sns.plotting_context("talk")
sns.plotting_context("poster")
##字体大小和线的粗细
sns.set_context("paper",font_scale=2,rc={"lines.linewidth":3.5})
plt.figure(figsize=(10,6)) ##表的大小
画图就是参数很多,列举一些下面用到常用的
hue:也是具体的某一可以用做分类的列,作用是分类;
palette:调色板
markers:绘图的形状
x_jitter,y_jitter:设置点的抖动程度
Categorical plots(分类图)
##默认提供的颜色
current_palette = sns.color_palette()
sns.palplot(current_palette)
当我们画12条线的时候,有两条颜色是相同的,因为他默认提供10种颜色
这时最简单的方法就是在一个圆形的颜色空间中画出均匀间隔的颜色
sns.palplot(sns.color_palette("hls",12))
sns.palplot(sns.light_palette("purple"))
sns.palplot(sns.dark_palette("yellow"))
回归regplot和implot,推荐用regplot,implot更高级,参数更多
sns.regplot(x='total_bill',y='tip',data=tips)
sns.stripplot(x="day",y="total_bill",data=tips,jitter=False)
##上面那个左右误差的不太均匀,那下面的这个图就左右比较均匀
##长的像树
sns.swarmplot(x="day",y="total_bill",data=tips)
sns.swarmplot(x="day",y="total_bill",hue="sex",data=tips)
sns.violinplot(x="day",y="total_bill",hue="sex",data=tips)
sns.violinplot(x="day",y="total_bill",hue="sex",data=tips,split=True)
更好的描述变化差异
sns.pointplot(x="class",y="survived",hue="sex",data=titanic,palette={"male":"g","female":"m"},
markers=["^","o"],linestyles=["-","--"]
)
sns.barplot(x="sex",y="survived",hue="class",data=titanic)
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
sns.set_context("paper",font_scale=2,rc={"lines.linewidth":3.5})
tips = sns.load_dataset("tips",data_home="D:\JJH\Documents\seaborn-data-master\seaborn-data-master")
查看tip的分布情况
sns.displot(data=tips,x="tip")
核密度估计
sns.displot(data=tips,x="tip",kind="kde")
在直方图中,显示核密度估计
sns.displot(data=tips,x="tip",kde=True)
在分布图中区分男女
通过hue参数
sns.displot(data=tips,x="tip",kind="kde",hue="sex")
为了更加美观可以设置multiple,默认是layer
multiple有三个参数分别是layer,stack,fill
sns.displot(data=tips,x="tip",hue="sex",kind="kde",multiple="stack")
二元分布图
sns.displot(data=tips,x="tip",y="total_bill")
另一种二元分布图
sns.displot(data=tips,x="tip",y="total_bill",kind="kde")
col参数,绘制分图
sns.displot(data=tips,x="tip",kind="kde",col="sex")
jointplot
即可以查看二元变量的分布情况
g=sns.jointplot(x="total_bill",y="tip",data=tips)
六边形
g=sns.jointplot(x="total_bill",y="tip",data=tips,kind="hex")
pairplot
查看所有变量(数值型)之间的关系
sns.pairplot(tips,
kind = 'scatter', #散点图/回归分布图{'scatter', 'reg'})
diag_kind = 'hist', #直方图/密度图{'hist', 'kde'}
hue = 'time', #按照某一字段进行分类
palette = 'husl', #设置调色板
markers = ['o', 's'], #设置不同系列的点样式(这里根据参考分类个数)
)
热度图 相关系数
因为有些不是数值型的,相关系数是没法计算的,所以要转化为int
for field in ["sex","day","time","smoker"]:
tips[field]=tips[field].astype("category").cat.codes
sns.heatmap(tips.corr(),annot=True,fmt='.2f',cmap="coolwarm")