数据科学库(HM)DAY 1

什么是数据分析

数据分析是用适当的方法对收集来的大量数据进行分析,帮助人们作出判断,以便采取适当行动。

什么是matplotlib

matplotlib: 最流行的Python底层绘图库,主要做数据可视化图表,名字取材于MATLAB,模仿MATLAB构建

数据科学库(HM)DAY 1_第1张图片

matplotlib的基础绘图

from matplotlib import pyplot as plt
x = range(2,26,2)
y = [15,13,14.5,17,20,25,26,26,27,22,18,15]

#绘图
plt.plot(x,y)
#展示图形
plt.show()

数据科学库(HM)DAY 1_第2张图片

但是目前存在以下几个问题:

  1. 设置图片大小(想要一个高清无码大图)
  2. 保存到本地
  3. 描述信息,比如x轴和y轴表示什么,这个图表示什么
  4. 调整x或者y的刻度的间距
  5. 线条的样式(比如颜色,透明度等)
  6. 标记出特殊的点(比如告诉别人最高点和最低点在哪里)
  7. 给图片添加一个水印(防伪,防止盗用)

设置图片大小

数据科学库(HM)DAY 1_第3张图片

调整X或者Y轴上的刻度

数据科学库(HM)DAY 1_第4张图片
数据科学库(HM)DAY 1_第5张图片

设置中文显示

数据科学库(HM)DAY 1_第6张图片

给图像添加描述信息

数据科学库(HM)DAY 1_第7张图片

matplotlib的绘制10点到12点的气温

如果列表a表示10点到12点的每分钟的气温,如何绘制折线图观察每分钟气温的变化情况?

from matplotlib import pyplot as plt
import random
from matplotlib import font_manager
#从windows自带的字体库导入宋体
my_font = font_manager.FontProperties(fname='C:\\Windows\\Fonts\\simsun.ttc')

x = range(0,120)
y = [random.randint(20,35) for i in range(120)]

#设置图片大小
fig = plt.figure(figsize=(10,5),dpi=80)
#绘图
plt.plot(x,y)
#保存
plt.savefig("./wendu2.png")
#调整X轴的刻度
_xtick_labels = ["10点{}分".format(i) for i in range(60)]
_xtick_labels += ["11点{}分".format(i) for i in range(60)]
#取步长,数字和字符串一一对应,数据的长度一样
plt.xticks(list(x)[::3],_xtick_labels[::3],rotation = 45,fontproperties = my_font)#rotation旋转的角度,fontproperties字体
plt.yticks(range(min(y),max(y)+1))

#添加描述信息
plt.xlabel("时间",fontproperties = my_font)
plt.ylabel("温度,单位(℃)",fontproperties = my_font)
plt.title("十点到十二点温度变化情况",fontproperties = my_font)

#展示图形
plt.show()

数据科学库(HM)DAY 1_第8张图片

实例

假设大家在30岁的时候,根据自己的实际情况,统计出来了你和你同桌各自从11岁到30岁每年交的女(男)朋友的数量如列表a和b,请在一个图中绘制出该数据的折线图,以便比较自己和同桌20年间的差异,同时分析每年交女(男)朋友的数量走势

a = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]

b = [1,0,3,1,2,2,3,3,2,1 ,2,1,1,1,1,1,1,1,1,1]

要求:

y轴表示个数
x轴表示岁数,比如11岁,12岁等
from matplotlib import pyplot as plt
from matplotlib import font_manager
#从windows自带的字体库导入宋体
my_font = font_manager.FontProperties(fname='C:\\Windows\\Fonts\\simsun.ttc')
x = range(11,31)
y1 = [1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]
y2 = [1,0,3,1,2,2,3,3,2,1 ,2,1,1,1,1,1,1,1,1,1]

#设置图片大小
fig = plt.figure(figsize=(10,5),dpi=80)

#绘图
plt.plot(x,y1,label="自己",color="red",linestyle="--",linewidth=2)
plt.plot(x,y2,label="同桌",color="blue",linestyle=":")

#调整X轴的刻度
_xtick_labels = ["{}岁".format(i) for i in x]
_ytick_labels = ["{}个".format(i) for i in range(0,9)]

#取步长,数字和字符串一一对应,数据的长度一样
plt.xticks(x,_xtick_labels,fontproperties = my_font)#fontproperties字体
plt.yticks(range(0,9),_ytick_labels,fontproperties = my_font)

#添加描述信息
plt.xlabel("年纪",fontproperties = my_font)
plt.ylabel("女(男)朋友的个数",fontproperties = my_font)
plt.title("每年交女(男)朋友的数量走势",fontproperties = my_font)

#绘制网格
plt.grid(alpha=0.8)#alpha为透明度

#添加图例
plt.legend(prop=my_font,loc="upper left")#prop在图例里设置字体,loc设置图例位置

#保存
plt.savefig("./shili.png")

#展示图形
plt.show()

数据科学库(HM)DAY 1_第9张图片

对比常用统计图

折线图:以折线的上升或下降来表示统计数量的增减变化的统计图

特点:能够显示数据的变化趋势,反映事物的变化情况。(变化)

直方图:由一系列高度不等的纵向条纹或线段表示数据分布的情况。
一般用横轴表示数据范围,纵轴表示分布情况。

特点:绘制连续性的数据,展示一组或者多组数据的分布状况(统计)

**条形图:**排列在工作表的列或行中的数据可以绘制到条形图中。

特点:绘制连离散的数据,能够一眼看出各个数据的大小,比较数据之间的差别。(统计)

**散点图:**用两组数据构成多个坐标点,考察坐标点的分布,判断两变量
之间是否存在某种关联或总结坐标点的分布模式。

特点:判断变量之间是否存在数量关联趋势,展示离群点(分布规律)

你可能感兴趣的:(笔记,matlab,python)