机器学习数据科学库--数据分析流程,matplotlib

机器学习数据科学库--第一天

    • 数据分析流程
    • matplotlib

数据分析流程

提出问题
准备数据
分析数据
获得结论
成果可视化

matplotlib

好处:
1.能将数据进行可视化,更直观的呈现
2.使数据更加客观、更具说服力

例子:

from matplotlib import pyplot as plt

# 假设一天中每隔1.5个小时的气温(℃)分别是[15,13,14.5,17,20,25,26,26,27,22,18,15]

# 设置图片大小,figsize设置尺度,dpi设置每英寸像素点个数
fig = plt.figure(figsize=(16, 9), dpi=80)
x = range(2, 26, 2)
y = [15, 13, 14.5, 17, 20, 25, 26, 26, 27, 22, 18, 15]
# 绘图
plt.plot(x, y)

# 设置x轴的刻度,如果需要更小的步长,可以通过传入列表尝试
_xtich_labels = [i / 2 for i in range(4, 49)]
plt.xticks(_xtich_labels[::3])
# 设置y轴的刻度
plt.yticks(range(min(y), max(y) + 1))

plt.xticks(_xtich_labels[::3])
# 保存文件,可以保存为svg这种矢量图格式,放大不会有锯齿
plt.savefig("./t1.png")
# 展示图形,show()方法运行后会把plt对象的数据置空,所以要先保存再展示
plt.show()

输出:

机器学习数据科学库--数据分析流程,matplotlib_第1张图片

Ps.下方设置x轴时,字符串长度要与数字一一对应

from matplotlib import pyplot as plt
import random
from matplotlib import font_manager

# 第一种方法,设置中文字体
# plt.rcParams['font.sans-serif'] = ['SimHei']
# plt.rcParams['axes.unicode_minus'] = False
# 第二种方法,设置中文字体
my_font = font_manager.FontProperties(fname=r"C:/Windows/Fonts/simsun.ttc")
# "C:\Windows\Fonts\微软雅黑\msyh.ttc"

# 列表啊表示10点到12点的每一分钟的气温,绘制折线图观察每分钟气温的变化情况
y = [random.randint(20, 35) for i in range(120)]
x = list(range(120))
fig = plt.figure(figsize=(16, 9), dpi=144)
plt.plot(x, y)
# 调整x轴刻度
_xtick_labels = ["10点{}分".format(i) for i in range(60)]
_xtick_labels += ["11点{}分".format(i) for i in range(60)]
# 取步长,数字和字符串一一对应,数据的长度一样,rotation设置的旋转的度数
plt.xticks(x[::5], _xtick_labels[::5], rotation=45, fontproperties=my_font)
plt.yticks(range(min(y), max(y)))
# 添加描述信息
plt.xlabel("时间", fontproperties=my_font)
plt.ylabel("温度 单位(℃)", fontproperties=my_font)
plt.title("时间-温度表", fontproperties=my_font)
plt.savefig("./t2.png")

输出:
机器学习数据科学库--数据分析流程,matplotlib_第2张图片

你可能感兴趣的:(数据科学库学习,python,matplotlib)