学习笔记(46):零基础搞定Python数据分析与挖掘-关系型数据的可视化

立即学习:https://edu.csdn.net/course/play/6861/326791?utm_source=blogtoedu

散点图的绘制

如果需要研究两个数值型变量之间是否存在某种关系,例如正向的线性关系,或者是趋势性的非线性关系,哪么散点图将是最佳的选择。

scatter(x,y,s=20,c=None,maker='o',alpha=None,linewidths=None,edgecolors=Nones)

x:指定散点图的x轴的数据

y:指定散点图的y轴数据

s:指定散点图点的大小,默认是20,通过传入其他数值型的变量,可以实现气泡图的绘制

c:指散点图的点的颜色,默认是蓝色,也可以传递其他数值型变量,通过cmap参数的色阶表示数值大小

marker:指定散点图点的形状,默认是空心圆

alpha:设置散点的透明度

linewidths:设置散点边界线的宽度

edgecolors:设置散点边界线的颜色

 

%matplotlib
import matplotlib.pyplot as plt
import pandas as pd
data  = pd.read_csv(r'E:\pylean\database\第8章 数据可视化\iris.csv')
plt.scatter(x=data.Petal_Width,y=data.Petal_Length,color='red',alpha=0.6)
plt.xlabel('花瓣宽度')
plt.ylabel('花白长度')
plt.title("鸢尾花的花瓣宽度与长度的关系")
plt.show()

 

热力图的绘制

热力图也称作价差填充表,图形最典型的用法就是实现列联表的可视化,即通过图形的方式展现两个离散变量之间的组合关系。

import seaborn as sns

 

sns.heatmap(data,cmap=None,annot=None,fmt='.2g',annot_kws=None,linewidths=0,linecolor='white')

data:指定绘制热力图的数据集合

cmap:指定一个colormap对象,用于热力图的填充表

annot:指定一个bool类型的值或者与data参数形状一样的数组,如果为True,就在热力图的每个单元上显示数值

fmt:指定单元格中数据的显示格式

annot_kws:有关单元格中数值标签的与其他属性的描述,如颜色,大小等

linewidths:指定每个单元格的边框宽度

linecolor:指定每个单元格的边框颜色

import numpy as np
import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt
Sales= pd.read_excel(r'E:\pylean\database\第8章 数据可视化\Sales.xlsx')
print(Sales)
Sales['year']=Sales.Date.dt.year
Sales['month']=Sales.Date.dt.month
Summary=Sales.pivot_table(index='month',columns='year',values='Sales',aggfunc=np.sum)
Summary
sns.heatmap(data=Summary,#指定绘图数据
           cmap='PuBuGn',#指定填充颜色
           linewidth=.1,#设置每个单元格边框宽度
           annot=True,#显示数值
           fmt='.1e')#以科学计算法显示数据
plt.title("每年各月份销售总额热力图")
plt.show()

 

 

你可能感兴趣的:(研发管理)