1.简介
Seaborn是一个基于Matplotlib开发的第三方可视化库,在matplotlib的基础上进行了更高级的API封装。可做更多统计图表。
eg:sns.relplot(x=‘年份’,y=‘人口出生率’,data=population,kind=‘line’)
数据的基本分类:定性数据(分类数据)事务属性或类别以及区间值的数据
定量数据(离散数据、连续数据),通常以数字形式出现。
描述性统计(Descriptive Statistics):描绘或总结数据基本情况
描述性统计图形:用于表现数据的关系、分布或者分类情况
(Relational)关系:定量数据
(Distribution)分布:定量数据
(Categorical)分类:定性数据
2.Seaborn图形分类:
(Relational)关系
(Distribution)分布
(Categorical)分类
(Regression)回归:线性回归
(Matrix)矩阵:热力图和聚类图
(Multiple)复合
Seaborn安装:pip install seaborn
导入:import seaborn as sns
3.Relational(关系图):
散点图(X,Y轴;相关关系;离群值)
seaboen.replot(x,y,data,hue,size,style,kind)
data:传入DataFrame对象
hue:添加维度,不同颜色表示维度下的不同含义, eg:hue=‘性别’,男女会区分标记
size:传入数据的大小在散点图中生成大小不同的点
style:某一维度上,不同形状区分同一维度
kind= scatter(散点图)
折线图:与散点图语法相同。x一般为连续时间;kind=‘line’
4.Distribution(分布图):
直方图(高度表示频数,定量数据)
seaborn.displot(x,data,hue,kind)
与散点图语法相同
hue:某一维度区分不同数据;kind=‘hist’
柱状图用于画定性数据(分类数据)
众数<中位数<平均数,右偏分布
众数>中位数>平均数,左偏分布
核密度估计图
经验累积分布图
轴须图
5.Categorical(分类图):
箱型图(盒须图;盒式图;箱线图)
(异常值、上相邻值,第三四分位数Q3,中位数median,第一四分位数Q1,下相邻值)
Q3-Q1=IQR(四分位距),箱子短,数据集中
Q1-1.5*IQRz下内围栏,Q3+1.5IQR上内围栏
seaborn.catplot(x,y,data,hue,order,kind)
order=将类型顺序传入列表参数order_list(让x轴数据按照一定顺序显示);kind=‘box’
散点图
点图
条形图
图级(figure-level)图形层面函数
轴级(axes-level)图形参数函数
6.可视化扩展库:(可交互)plotly,pyecharts