Seaborn是matplotlib库的扩展,主要专注于统计学的分析
Seaborn背后有调色板
import seaborn as sns
sns.set_style(‘darkgrid’) 设置一些背景
sns.load_dataset(‘tips’) 加载数据 seaborn datasets
sns.relplot(x=‘total_bill’,y=‘tip’, data=tips) 画散点图 relational plots
-x 针对同一个x对应多个y的情况,line plot会根据mean和95%的置信区间(confidence interval)来作图
-y
-ci = None ‘sd标准差/None’ 取消置信区间
-estimator= None 取消所有的东西
用hue可以根据某个column分成不同的颜色绘制 hue和style像groupby
sns.lmplot() 画一个线性回归的模型
sns.scatterplot()
sns.lineplot()
sns.catplot(data=tips,x=‘day’, y=‘total_bill’) categorical plots分类的 replot也可以 只是好看了
sns.boxplot(x=“time”, y=“tip”, data=data)
sns.catplot(x=‘sex’, y=‘survived’,hue=‘class’, kind=‘bar’,data=titainc)
tips[‘weekend’] = tips[‘day’].isin([‘sat’,‘sun’])
g = sns.catplot(x='day',y = 'total_bill',kind='violin',data=tips)
sns.catplot(x='day',y = 'total_bill',kind='swarm',data=tips,as = g.ax) #2条形图的上面
x = np.random.normal(size=100) 拿到了100个高斯分布的数据
sns.distplot(x, kde=True) 他是一个直方图,连续的曲线是kde
-kde= True 就会有连续的曲线
-bins = 20 分20份
-rug = True 标识下面的小数字 的一个数据点,越密就越多
KDE Kernel Density Estimation 核密度估计 就是把离散的函数变平滑
sns.barplot(x=“month”, y=“passengers”, hue=‘year’, data=data)
seaborn.countplot() 分类直方图对输入的定量就是不变的量进行分类,只能对x或者y 不能同时x和y
sns.scatterplot(x=“tip”, y=“total_bill”, data=data)
sns.jointplot(x=‘x’ ,y=‘y’,data=df) 这两个维度都是高斯分布 会把两个维度都展示在一起
f, ax = plt.subplots()
sns.kdeplot(df.x,df.y, ax=ax)
sns.rugplot(df.y,color=‘blue’ vertical=True,ax=ax) 这是y轴 x轴去掉vertical
iris.corr()
sns.pairplot(iris) 自己跟自己是直方图 自己跟别人是散点图
-hue
sns.lmplot(data=tips,x=‘total_bill’,y=‘tip’) 会有95置信区间和拟合的线
sns.residplot(x=‘x’,y=‘y’,data=anscombe.query(’'dataset == ‘I’ “”))