0113学习记录

机器学习-数据科学库(HM)

01 【数据分析介绍和环境安装】01数据分析的介绍

0113学习记录_第1张图片
分析数据,就是进行数据清洗

02 【数据分析介绍和环境安装】02jupyter和conda的使用

anaconda
conda
jupyter notebook

03 【matplotlib折线图】01matplotlib的基础绘图

0113学习记录_第2张图片

04 【matplotlib折线图】02matplotlib的基础绘图和调整x轴的刻度

0113学习记录_第3张图片
dpi 每英寸上像素点的个数

#!usr/bin/env python
# -*- coding:utf-8 -*-
from matplotlib import pyplot as plt
fig=plt.figure(figsize=(20,8),dpi=80)
x=range(2,26,2)
y=[15,13,14.5,17,20,25,26,26,24,22,18,15]

plt.plot(x,y)

# 绘制x轴的刻度
_xtick_labels=[i/2 for i in range(4,49)] #列表推导式
plt.xticks(_xtick_labels[::3])#指定步长
plt.yticks(range(min(y),max(y)+1))  # 包左不包右


#保存
#plt.savefig("./t1.png")


plt.show()

05 【matplotlib折线图】03matplotlib的绘制10点到12点的气温

# -*- coding:utf-8 -*-
import random
from matplotlib import pyplot as plt
fig=plt.figure(figsize=(20,8),dpi=80)
x=range(0,121) #包左不包右
y=a= [random.randint(20,35) for i in range(121)]

plt.plot(x,y)

# 绘制x轴的刻度
_xtick_labels=[i for i in x] #列表推导式
plt.xticks(_xtick_labels[::1])#指定步长
plt.yticks(range(min(y),max(y)+1))  # 包左不包右

plt.show()

06 【matplotlib折线图】04matplotlib设置显示中文

0113学习记录_第4张图片

#coding=utf-8
import random
from matplotlib import pyplot as plt
import matplotlib
from  matplotlib import  font_manager #实例化font_manager

#windows 和linux 设置字体的方式
# font = {'family': 'Microsoft YaHei',
#         'weight': 'bold',
#         'size': 'larger'}
# matplotlib.rc("font",**font)
# matplotlib.rc("font",family="Microsoft YaHei",weight="bold")

my_font=font_manager.FontProperties(fname="C:\Windows\Fonts\simkai.ttf")  按照这种方式处理图片中中文不显示的问题

x=range(0,120) #包左不包右
y=[random.randint(20,35) for i in range(120)]

plt.figure(figsize=(20,8),dpi=80)

plt.plot(x,y)

# 绘制并调整x轴的刻度
_xtick_labels=["10点{}分".format(i) for i in range(60)]
_xtick_labels += ["11点{}分".format(i) for i in range(60)]  #分段把两个放在一块 下边使用列表取步长
plt.xticks(list(x)[::3],_xtick_labels[::3],rotation=45,fontproperties=my_font)  #字符串和数字一一对应,所以两个长度必须一致,字符串旋转45

#matplotlib默认字体不显示中文

plt.show()

不是什么超级特殊的参数,也并不奇特,只是编程人员约定的变量名字,args 是 arguments 的缩写,表示位置参数;kwargs 是 keyword arguments 的缩写,表示关键字参数。

这其实就是 Python 中可变参数的两种形式,并且 *args 必须放在 **kwargs 的前面,因为位置参数在关键字参数的前面。

事实上,在*args中,唯一的星号是真正的参与者,创建了列表,其内容则是来自函数调用的位置参数(在这些定义变元后)。

这些理清楚之后,**kwargs就很容易理解了。名称并不重要,重要的是双星号创建了字典,其内容是关键字参数,来自函数调用(在这些定义变元后)。

07 【matplotlib折线图】05matplotlib的设置图形信息

0113学习记录_第5张图片

plt.xlabel("时间",fontproperties=my_font)  
plt.ylabel("温度 单位C",fontproperties=my_font)
plt.title("10点到12点每分钟的气温变化情况",fontproperties=my_font)

就是图形信息处理这方面的东西

08 【matplotlib折线图】mp绘制多次图形和不同图形的差异介绍和总结

结合课件内容学习
1绘制了折线图(plt.plot)
2设置了图片的大小和分辨率(plt.figure)
3实现了图片的保存(plt.savefig)
4设置了xy轴上的刻度和字符串(xticks)
5解决了刻度稀疏和密集的问题(xticks)
6设置了标题,xy轴的lable(title,xlable,ylable)
7设置了字体(font_manager. fontProperties,matplotlib.rc)
8在一个图上绘制多个图形(plt多次plot即可)
9为不同的图形添加图例

#coding=utf-8

from matplotlib import pyplot as plt
import matplotlib
from  matplotlib import  font_manager

my_font=font_manager.FontProperties(fname="C:\Windows\Fonts\simkai.ttf")


y_1=[1,0,1,1,2,4,3,2,3,4,4,5,6,5,4,3,3,1,1,1]
y_2=[2,2,1,5,1,5,1,4,3,5,1,0,4,0,5,2,6,1,4,3]
x=range(11,31)

plt.figure(figsize=(20,8),dpi=80)

_xtick_labels=["{}岁".format(i) for i in range(11,31)]
plt.xticks(list(x)[::2],_xtick_labels[::2],rotation=90,fontproperties=my_font)
plt.yticks(range(0,9))

plt.xlabel("年纪",fontproperties=my_font)
plt.ylabel("对象个数",fontproperties=my_font)
plt.title("年纪和对象的关系",fontproperties=my_font)

#绘制两个人  也可以传输颜色,线宽等信息
plt.plot(x,y_1,label="自己",color="r",linestyle=":",linewidth=5)
plt.plot(x,y_2,label="同桌",color="g",linestyle="-.")

#绘制网格
plt.grid(alpha=0.4,linestyle=":") #alpha表示透明度

#添加图例
plt.legend(prop=my_font,loc="upper left")  #只有在这里是用prop=   显示中文 #loc可以有其它的比如upperright 等信息来调整
#来调整图例的位置

plt.show()

09 【matplotlib常用统计图】01绘制散点图.

散点图和折线图没区别,scatter的用法

# coding:utf-8
from matplotlib import pyplot as plt
from matplotlib import font_manager

y_3 = [11,17,16,11,12,11,12,6,6,7,8,9,12,15,14,17,18,21,16,17,20,14,15,15,15,19,21,22,22,22,23]
y_10 = [26, 26, 28, 19, 21, 17, 16, 19, 18, 20, 20, 19, 22, 23, 17, 20, 21, 20, 22, 15, 11, 15, 5, 13, 17, 10, 11, 13, 12,
   13, 6]

x_3=range(1,32)
x_10=range(51,82)

#调整字体
my_font=font_manager.FontProperties(fname="C:\Windows\Fonts\simkai.ttf")

#设置图形大小
plt.figure(figsize=(20,8),dpi=80)

#使用scatter方法绘制散点图,和折线图的唯一区别
plt.scatter(x_3,y_3,label="3月份")
plt.scatter(x_10,y_10,label="10月份")

#调整x轴刻度
_x=list(x_3)+list(x_10)
_xtick_labels=["3月{}日".format(i) for i in x_3]
_xtick_labels+=["10月{}日".format(i-50) for i in x_10]
plt.xticks(_x[::3],_xtick_labels[::3],fontproperties=my_font,rotation=45)

#添加描述信息
plt.xlabel("时间",fontproperties=my_font)
plt.ylabel("温度",fontproperties=my_font)
plt.title("标题",fontproperties=my_font)
#图例
plt.legend(loc="upper left",prop=my_font)#仅仅是legend这里用到prop=my_font

#展示
plt.show()

10 【matplotlib常用统计图】02绘制条形图

竖着的条形图和横着的条形图还是有一些区别的

# coding:utf-8
from matplotlib import pyplot as plt
from matplotlib import font_manager

y_3 = [11,17,16,11,12,11,12,6,6,7,8,9,12,15,14,17,18,21,16,17,20,14,15,15,15,19,21,22,22,22,23]
y_10 = [26, 26, 28, 19, 21, 17, 16, 19, 18, 20, 20, 19, 22, 23, 17, 20, 21, 20, 22, 15, 11, 15, 5, 13, 17, 10, 11, 13, 12,
   13, 6]

x_3=range(1,32)
x_10=range(51,82)

#调整字体
my_font=font_manager.FontProperties(fname="C:\Windows\Fonts\simkai.ttf")

#设置图形大小
plt.figure(figsize=(20,8),dpi=80)

#使用scatter方法绘制散点图,和折线图的唯一区别
plt.scatter(x_3,y_3,label="3月份")
plt.scatter(x_10,y_10,label="10月份")

#调整x轴刻度
_x=list(x_3)+list(x_10)
_xtick_labels=["3月{}日".format(i) for i in x_3]
_xtick_labels+=["10月{}日".format(i-50) for i in x_10]
plt.xticks(_x[::3],_xtick_labels[::3],fontproperties=my_font,rotation=45)

#添加描述信息
plt.xlabel("时间",fontproperties=my_font)
plt.ylabel("温度",fontproperties=my_font)
plt.title("标题",fontproperties=my_font)
#图例
plt.legend(loc="upper left",prop=my_font)

#展示
plt.show()
#绘制横着的条形图
# coding:utf-8
from matplotlib import pyplot as plt
from matplotlib import font_manager

my_font=font_manager.FontProperties(fname="C:\Windows\Fonts\simkai.ttf") #显示中文

#插入\n把字符串做成两行
a = ["战狼2","速度与激情8","功夫瑜伽","西游伏妖篇","变形金刚5:\n最后的骑士","摔跤吧!爸爸","加勒比海盗5:\n死无对证","金刚:骷髅岛","极限特工:\n终极回归","生化危机6:终章","乘风破浪","神偷奶爸3","智取威虎山","大闹天竺","金刚狼3:殊死一战","蜘蛛侠:\n英雄归来","悟空传","银河护卫队2","情圣","新木乃伊",]
b = [56.01,26.94,17.53,16.49,15.45,12.96,11.8,11.61,11.28,11.12,10.49,10.3,8.75,7.55,7.32,6.99,6.88,6.86,6.58,6.23]

plt.figure(figsize=(20,15),dpi=80)#设置图形大小
#绘制横着的条形图 用barh
plt.barh(range(len(a)),b,height=0.3,color="green")

#把刻度和字符串一一对应,设置字符串到x轴上
plt.yticks(range(len(a)),a,fontproperties=my_font)

#保存本地文件
plt.savefig("./movie.png")

plt.grid(alpha=0.3)

plt.show()


11 【matplotlib常用统计图】03绘制多次条形图

可以用于数量统计和频率统计

#绘制横着的条形图,三个条形图
# coding:utf-8
from matplotlib import pyplot as plt
from matplotlib import font_manager

my_font=font_manager.FontProperties(fname="C:\Windows\Fonts\simkai.ttf") #显示中文

#插入\n把字符串做成两行
a = ["猩球崛起3:\n终极之战","敦刻尔克","蜘蛛侠:英雄归来","战狼2"]
b_16 = [15746,312,4497,319]
b_15 = [12357,156,2045,168]
b_14 = [2358,399,2358,362]

plt.figure(figsize=(20,8),dpi=80)
#绘制竖着的条形图,多行

bar_width=0.2
#把x往右移动,对比散点图中的代码
x_14=list(range(len(a)))
x_15=[i+bar_width for i in x_14]
x_16=[i+bar_width*2 for i in x_14]
#绘制对应的条形图
plt.bar(range(len(a)),b_14,width=bar_width,color="green",label="14日")#设置图形格式
plt.bar(x_15,b_15,width=bar_width,color="red",label="15日") #在这里设置图例label= 
plt.bar(x_16,b_16,width=bar_width,color="blue",label="16日")

#把刻度和字符串一一对应,设置字符串到x轴上,设置y轴的刻度
plt.xticks(x_15,a,fontproperties=my_font)
#显示图例
plt.legend(prop=my_font,loc="upper center")#图例设置在最中间

plt.show()

12 【matplotlib常用统计图】04绘制直方图

hist 方法使用 单组数据绘制成直方图 一般来说能够使用plt.hist方法的的是那些没有统计过的数据,对于已经整理好的数据,可以使用条形图表达数据 应用场景
用户的年龄分布状态
一段时间内用户点击次数的分布状态
用户活跃时间的分布状态
是需要分布的这个东西

#绘制直方图
# coding:utf-8
from matplotlib import pyplot as plt
from matplotlib import font_manager

a=[131,  98, 125, 131, 124, 139, 131, 117, 128, 108, 135, 138, 131, 102, 107, 114, 119, 128, 121, 142, 127, 130, 124, 101, 110, 116, 117, 110, 128, 128, 115,  99, 136, 126, 134,  95, 138, 117, 111,78, 132, 124, 113, 150, 110, 117,  86,  95, 144, 105, 126, 130,126, 130, 126, 116, 123, 106, 112, 138, 123,  86, 101,  99, 136,123, 117, 119, 105, 137, 123, 128, 125, 104, 109, 134, 125, 127,105, 120, 107, 129, 116, 108, 132, 103, 136, 118, 102, 120, 114,105, 115, 132, 145, 119, 121, 112, 139, 125, 138, 109, 132, 134,156, 106, 117, 127, 144, 139, 139, 119, 140,  83, 110, 102,123,107, 143, 115, 136, 118, 139, 123, 112, 118, 125, 109, 119, 133,112, 114, 122, 109, 106, 123, 116, 131, 127, 115, 118, 112, 135,115, 146, 137, 116, 103, 144,  83, 123, 111, 110, 111, 100, 154,136, 100, 118, 119, 133, 134, 106, 129, 126, 110, 111, 109, 141,120, 117, 106, 149, 122, 122, 110, 118, 127, 121, 114, 125, 126,114, 140, 103, 130, 141, 117, 106, 114, 121, 114, 133, 137,  92,121, 112, 146,  97, 137, 105,  98, 117, 112,  81,  97, 139, 113,134, 106, 144, 110, 137, 137, 111, 104, 117, 100, 111, 101, 110,105, 129, 137, 112, 120, 113, 133, 112,  83,  94, 146, 133, 101,131, 116, 111,  84, 137, 115, 122, 106, 144, 109, 123, 116, 111,111, 133, 150]

#计算组数
d=3  #组距
num_bins=(max(a)-min(a))//d #组数

plt.figure(figsize=(20,8),dpi=80)

#设置x轴刻度
plt.xticks(range(min(a),max(a)+d,d))
plt.grid(alpha=0.4)
#plt.hist(a,num_bins)#需要统计数据,需要统计的组数 把a分成 num_bins组
plt.hist(a,num_bins,density=True)   #频率分布直方图
plt.show()

已有分组的数据 画成条形图

# coding=utf-8
from matplotlib import pyplot as plt
from matplotlib import font_manager

interval = [0,5,10,15,20,25,30,35,40,45,60,90]
width = [5,5,5,5,5,5,5,5,5,15,30,60]
quantity = [836,2737,3723,3926,3596,1438,3273,642,824,613,215,47]

#设置图形大小
plt.figure(figsize=(20,8),dpi=80)

#条形图的width可以是列表   调整图形的展示
plt.bar(range(12),quantity,width=1)

#设置x轴的刻度   调整图形的展示和调整刻度的展示,是两个内容
_x=[i-0.5 for i in range(13)]
_xtick_labels=interval+[150] #在列表后边加个数 方便把90显示出来
plt.xticks(_x,_xtick_labels)

plt.grid(alpha=0.4)
plt.show()

13 【matplotlib常用统计图】05更多的绘图工具的了解

常见问题总结
1应该选择那种图形来呈现数据
2 matplotlib.plot(x,y)
3 matplotlib.bar(x,y)
4 matplotlib.scatter(x,y)
5 matplotlib.hist(data,bins,normed)
6 xticks和yticks的设置 刻度
7 label和titile,grid的设置 图例 图名 线条
8 绘图的大小和保存图片

常用流程
1 明确问题
2 选择图形的呈现方式
3 准备数据
4 绘图和图形完善

常用的其它绘图工具
百度的 Echarts
plotly for python
seaborn

https://blog.51cto.com/u_13919520/3152749
这个网址有更多的关于matplotlib画图的内容

你可能感兴趣的:(matplotlib,python)