数据分析是用适当的方法对收集来的大量数据进行分析,帮助人们作出判断,以便采取适当行动。
matplotlib: 最流行的Python底层绘图库,主要做数据可视化图表,名字取材于MATLAB,模仿MATLAB构建
from matplotlib import pyplot as plt
x = range(2,26,2)
y = [15,13,14.5,17,20,25,26,26,27,22,18,15]
#绘图
plt.plot(x,y)
#展示图形
plt.show()
但是目前存在以下几个问题:
如果列表a表示10点到12点的每分钟的气温,如何绘制折线图观察每分钟气温的变化情况?
from matplotlib import pyplot as plt
import random
from matplotlib import font_manager
#从windows自带的字体库导入宋体
my_font = font_manager.FontProperties(fname='C:\\Windows\\Fonts\\simsun.ttc')
x = range(0,120)
y = [random.randint(20,35) for i in range(120)]
#设置图片大小
fig = plt.figure(figsize=(10,5),dpi=80)
#绘图
plt.plot(x,y)
#保存
plt.savefig("./wendu2.png")
#调整X轴的刻度
_xtick_labels = ["10点{}分".format(i) for i in range(60)]
_xtick_labels += ["11点{}分".format(i) for i in range(60)]
#取步长,数字和字符串一一对应,数据的长度一样
plt.xticks(list(x)[::3],_xtick_labels[::3],rotation = 45,fontproperties = my_font)#rotation旋转的角度,fontproperties字体
plt.yticks(range(min(y),max(y)+1))
#添加描述信息
plt.xlabel("时间",fontproperties = my_font)
plt.ylabel("温度,单位(℃)",fontproperties = my_font)
plt.title("十点到十二点温度变化情况",fontproperties = my_font)
#展示图形
plt.show()
假设大家在30岁的时候,根据自己的实际情况,统计出来了你和你同桌各自从11岁到30岁每年交的女(男)朋友的数量如列表a和b,请在一个图中绘制出该数据的折线图,以便比较自己和同桌20年间的差异,同时分析每年交女(男)朋友的数量走势
a = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]
b = [1,0,3,1,2,2,3,3,2,1 ,2,1,1,1,1,1,1,1,1,1]
要求:
y轴表示个数
x轴表示岁数,比如11岁,12岁等
from matplotlib import pyplot as plt
from matplotlib import font_manager
#从windows自带的字体库导入宋体
my_font = font_manager.FontProperties(fname='C:\\Windows\\Fonts\\simsun.ttc')
x = range(11,31)
y1 = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]
y2 = [1,0,3,1,2,2,3,3,2,1 ,2,1,1,1,1,1,1,1,1,1]
#设置图片大小
fig = plt.figure(figsize=(10,5),dpi=80)
#绘图
plt.plot(x,y1,label="自己",color="red",linestyle="--",linewidth=2)
plt.plot(x,y2,label="同桌",color="blue",linestyle=":")
#调整X轴的刻度
_xtick_labels = ["{}岁".format(i) for i in x]
_ytick_labels = ["{}个".format(i) for i in range(0,9)]
#取步长,数字和字符串一一对应,数据的长度一样
plt.xticks(x,_xtick_labels,fontproperties = my_font)#fontproperties字体
plt.yticks(range(0,9),_ytick_labels,fontproperties = my_font)
#添加描述信息
plt.xlabel("年纪",fontproperties = my_font)
plt.ylabel("女(男)朋友的个数",fontproperties = my_font)
plt.title("每年交女(男)朋友的数量走势",fontproperties = my_font)
#绘制网格
plt.grid(alpha=0.8)#alpha为透明度
#添加图例
plt.legend(prop=my_font,loc="upper left")#prop在图例里设置字体,loc设置图例位置
#保存
plt.savefig("./shili.png")
#展示图形
plt.show()
折线图:以折线的上升或下降来表示统计数量的增减变化的统计图
特点:能够显示数据的变化趋势,反映事物的变化情况。(变化)
直方图:由一系列高度不等的纵向条纹或线段表示数据分布的情况。
一般用横轴表示数据范围,纵轴表示分布情况。
特点:绘制连续性的数据,展示一组或者多组数据的分布状况(统计)
**条形图:**排列在工作表的列或行中的数据可以绘制到条形图中。
特点:绘制连离散的数据,能够一眼看出各个数据的大小,比较数据之间的差别。(统计)
**散点图:**用两组数据构成多个坐标点,考察坐标点的分布,判断两变量
之间是否存在某种关联或总结坐标点的分布模式。
特点:判断变量之间是否存在数量关联趋势,展示离群点(分布规律)