Seaborn是对matplotlib的extend,是一个数据可视化库,提供更高级的API封装,在应用中更加的方便灵活。下面我简单介绍一下他的用法,实际应用的时候,可以直接从文档中查找这个库,这时候使用就很快捷了。
提要:1、直方图和密度图
2、柱状图和热力图
3、设置图形显示效果
4、调色功能
老样子,首先将使用它所需要的库导入进来,当然,其中包括numpy之类的是为了演示它的功能才导入的,大家要先理解一下每个库的作用。
1 importnumpy as np2 importpandas as pd3 importmatplotlib.pyplot as plt4 from pandas importSeries,DataFrame5 import seaborn as sns
1、直方图和密度图
如果在交互式环境中,可以通过%matplotlab来解决每次通过plt.show()来显示图像(本人在ipython中,貌似jupyter中%matplotlib inline等等)
# matplotlib
1 s1 = Series(np.random.randn(1000)) #生成1000个点的符合正态分布的随机数
2 plt.hist(s1) #直方图,也可以通过plot(),修改里面kind参数实现
3 s1.plot(kind='kde') #密度图
# seaborn
1 sns.distplot(s1,hist=True,kde=True,rug=True) #前两个默认就是True,rug是在最下方显示出频率情况,默认为False
2 #bins=20 表示等分为20份的效果,同样有label等等参数
3 sns.kdeplot(s1,shade=True,color='r') #shade表示线下颜色为阴影,color表示颜色是红色
4 sns.rugplot(s1) #在下方画出频率情况
给出两种方式通过最基本的方式画出来的效果,怎么样,是不是发现seaborn很强大。
2、柱状图和热力图
(1)下载实验数据:
1 df = sns.load_dataset('flights') #在线下载一个数据用于实验,在sns.load_dataset()函数里有很多的数据,想了解更多的可以到GitHub中找到源码,你就会很清楚了
我们可以先看一下里面的数据,可以看到,这是一个航空的数据,里面有年、月和乘客数量,接下来我们就要在这份数据上进行分析。
(2)我们可以通过透视表来先对这份数据进行一下处理:
1 df = df.pivot(index='month',columns='year',values='passengers') #生成一个透视表,得到一个以年、月为轴的二维数据表
大家可以自己试一下,这样生成的结果是以年为columns,以月为index,表内数据为对应的乘客数量。
(3)绘制柱状图
1 s =df.sum()2 #通过matplotlib绘出图形
3 s.plot(kind='bar')4 #通过seaborn绘出图形
5 sns.barplot(x=s.index,y=s.values)
(4)绘制热力图
1 df.plot() #线性的显示数据情况
2 sns.heatmap(df) #生成热力图
3 #sns.heatmap(df,annot=True,fmt='d') # annot参数是指显示数据,fmt='d'是指以整数形式显示
3、设置图形显示效果
(1)axes_style and set_style
1 x = np.linspace(0,14,100)2 y1 =np.sin(x)3 y2 = np.sin(x+2)*1.25
4 defsinplot():5 plt.plot(x,y1)6 plt.plot(x,y2)7
8 sinplot() #以matplotlib显示,生成两个函数图像
1 #seaborn的5种装饰风格
2 styles = ['darkgrid','dark','white','whitegrid','tricks'] #颜色代表背景颜色,grid代表是否有网格
3 sns.set_style(style[0]) #进行装饰,括号内可以直接写装饰风格
4 sinplot() #经过修饰之后的图像
5
6 sns.axes_style() #显示当前主题的内容,这些数据都可以修改微调
7 #更改的时候就将其信息的以字典形式复制到set_style()里,当做参数来修改(注意是以字典的形式)
8 sns.set() #设置风格为空,即清空自己定义的,恢复到默认的时候
(2)plotting_context() and set_context()
1 context = ['paper','notebook','talk','poster'] #seaborn本身定义好的
2 sns.set_context('paper',rc={'grid.linewidth':3.0}) #rc参数
3 sinplot()4
5 sns.plotting_context() #显示出当前状态的数据
6 sns.set() #恢复到默认
图像貌似一样,但并不是没有成功,只是变化比较细微,真正用到的时候就可以体会到了。
4、调色功能
1 #先绘制一个图像
2 defsinplot1():3 x = np.linspace(0,14,100)4 plt.figure(figsize=(8,6)) #图像比较小时,通过这个函数更改大小
5 for i in range(4):6 plt.plot(x,np.sin(x+i)*(i+0.75),label='sin(x+%s)*(%s+0.75)' %(i,i))7 plt.legend()8 sinplot1()
1 #引入seaborn
2 sns.color_palette() #使用调色板
3 #不传入参数返回当前使用的调色板(RGB)
4 sns.palplot(sns.color_palette()) #画出调色板,参数为上面的调色板
接下来,我们就要调整我们的调色板了
1 pal.style = ['deep','nuted','pastel','bright','dark','colorblind'] #seaborn默认定义的调色板
2
3 #第一种设置画板方式
4 sns.set_palette(sns.color_palette('dark')) #设置色板
5 sns.set() #恢复默认风格
6
7 #第二种设置画板方式,并且最后恢复到默认
8 with sns.color_palette():9 sinplot1() #在内部调整画板输出图形,当with结束时,则恢复默认
调色板里的颜色是定义好的,那么如果我们将要绘制的图形包括很多的函数,需要更多的颜色,该怎么办呢。
1 #默认提供的色板数量是固定的,如果图像是更多的函数,那么颜色将循环色板中的风格。如果想不使他颜色有相同,可以通过sns.color_palette()来修改
2 sns.color_palette([(0.5,0.2,0.6),(0.3,0.3,0.4)]) #因为色板是以列表的形式存储的,里面的每种风格以元组的形式存在所以需要用[()]
3
4 #第二种增加色板颜色的方法
5 sns.color_palette('hls',8) #hls方法,后面写参数8,即生成有8种不同颜色的色板
作者:渔单渠(yudanqu)