笔记|数据分析之pandas基础----matplotlib基础功能(一)

image

matplot API入门

如何引入:

import matplotlib.pyplot as plt

一个简单的例子:

import numpy as np

data = np.arange(10)
plt.plot(data)

print(data)
[0 1 2 3 4 5 6 7 8 9]

效果如下:


case-1.png

Figure和Subplot

matplot的图像都位于Figure对象中,相当于一个画板,如何创建Figure对象。

fig = plt.figure()
ax1 = fig.add_subplot(2, 2, 1)
ax2 = fig.add_subplot(2, 2, 2)
ax3 = fig.add_subplot(2, 2, 3)

想要实现绘图,必须先使用add_subplot方法来创建画板。上面我们创建了三个2X2的画板:

plt.plot(np.random.randn(50).cumsum(), 'k--')

创建了一个随机曲线图:

case-2.png

最终matplotlib会选择在最后一张画板上绘图,如果没创建画板它会自动创建。

fig = plt.figure()

plt.plot(np.random.randn(50).cumsum(), 'k--')
case-3.png

其中k--是一个线性选项,表示黑色虚线。
如果想对其中一个进行绘图,调用其实例的绘图方法即可:

_ = ax1.hist(np.random.randn(100), bins=20, color='k', alpha=0.3)
ax2.scatter(np.arange(30), np.arange(30) + 3 * np.random.randn(30))
case-4.png

ps: 其他图表类型可以查看文档

创建包含subplot网格的figure

通过plt.subplots方法来创建一个包含多个subplot(图表)的Figure,并返回包含它们的NumPy数组

fig,axes = plt.subplots(2,3)
print(axes)

返回了一个包含subplot对象的2X3数组

[[
  
  ]
 [
  
  ]]

这里我是这么理解的:
这是在一个figure中创建多个图表的一种方式。非常实用,因为可以轻松的对这个数组索引,可以像操作数据一样去操作这些对象。
当然多个图标进行对比首要条件就是刻度必须是相同的,pyplot.subplotssharex、sharey属性就能做到这点。

pyplot.subplots的其他选项


case-5.png

调整subplots周围的间距

利用subplots_adjust方法来修改间距
表达式:

subplots_adjust(left=None, bottom=None, right=None, top=None, wspace=None, hspace=None)

wspace、hspace:代表宽度和高度的百分比,可以用来修改subplot之间的间距
看下例:

fig,axes = plt.subplots(2, 2, sharex=True, sharey=True)
for i in range(2):
    for j in range(2):
        axes[i,j].hist(np.random.randn(500), bins=50, color='k', alpha=0.5)
plt.subplots_adjust(wspace=0, hspace=0)

使用双重循环将4个subplot的间距都改为了0。

case-6.png

颜色、标记和线型

可以用matplotlib的plot函数来修改颜色、标记和线型。
表达式:

ax.plot(x, y, linesstyle='--', color='g')

其中x, y 表示X和Y坐标,linestyle修改线型,具体需要查看文档,color代表颜色,都有缩写具体查看文档

如果是线型图,可对数据加上锚点

from numpy.random import randn
plt.plot(randn(30).cumsum(), 'ko--')
case-7.png

也有另外一种写法,更加容易看懂些

plt.plot(randn(30), color='k', linestyle='dashed', marker='o')

在线性图中,除了锚点其他数据值都是以线性方式展现的。可以通过drawstyle选项做修改:

fig2 = plt.figure()
data = randn(30).cumsum()
ax1 = fig2.add_subplot(2, 2, 1)
ax2 = fig2.add_subplot(2, 2, 2)
ax1.plot(data, 'k--', label='Default')
ax2.plot(data, 'k--', drawstyle='steps-post', label='steps-post')
plt.legend(loc='best')
case-8.png

刻度、标签和图例

xlim、xticks和xticklabels之类的方法分别控制图标的范围、刻度位置、刻度标签等。
使用方法:

  • 如果填写参数则按照参数进行设置
  • 如果不填写则返回当前的参数值

plt.xlim([0, 10])

这段代码会将X轴的范围设置为0到10。也可以用ax.get_xlimax.set_xlim来达到上面的方法。

设置标题、轴标签、刻度以及刻度标签 ---- 轴的自定义

fig3 = plt.figure()
ax = fig3.add_subplot(1, 1, 1)
ax.plot(randn(1000).cumsum())
case-9.png

修改X轴的刻度,可以用set_xticksset_xticklabels
set_xticks只能设置数据范围

ticks = ax.set_xticks([0, 250, 500, 750, 1000])
case-10.png

如果要完全自定义,需要用set_xticklabels方法:

labels = ax.set_xticklabels(['one', 'two','three', 'four', 'five'], rotation=30, fontsize='small')
case-11.png

set_xlabel可以为X轴设置名称,用set_title对图表设置一个标题:

ax.set_title('My first matplotlib plot')
ax.set_label('Stages')
case-12.png

添加图例

图例是一种用于标识图表元素的工具
例如下面这个例子,光看图表很难区分这几条曲线,通过label参数来进行标识并且在最后通过legend来创建图例

fig4 = plt.figure()
ax = fig4.add_subplot(1, 1, 1)
ax.plot(randn(1000).cumsum(), 'k', label='one')
ax.plot(randn(1000).cumsum(), 'k--', label='two')
ax.plot(randn(1000).cumsum(), 'k.', label='_nolegend_')
ax.legend(loc='best')

如果将label设置为_nolegend_,那将不显示该图例

case-13.png

注解以及在Subplot上绘图

注解:可以通过text、arrow、annotate等函数添加

  • text : 可以在指定坐标上添加注解,并设置字体格式
ax.text(10,10,'Hello world', family='monospace', fontsize=10)
case-14.png

图形绘制:
和图表一样也需要在一个fingure中绘制。要添加图形需要创建一个shp对象,通过add_patch添加到subplot

fig5 = plt.figure()
ax = fig5.add_subplot(1, 1, 1)

rect = plt.Rectangle((0.2, 0.75), 0.4, 0.15, color='k', alpha=0.3)
circ = plt.Circle((0.7, 0.2), 0.15, color='b', alpha=0.3)
pgon = plt.Polygon([[0.15, 0.15],[0.35, 0.4],[0.2,0.6]], color='g', alpha=0.5)

ax.add_patch(rect)
ax.add_patch(circ)
ax.add_patch(pgon)
case-15.png

将图表保存到文件

利用plt.savefig可以保存图表到文件中:

plt.savefig('filepath.svg')

也可以设置dpi

plt.savefig('filepath.png', dpi=400, bbox_inches='tight')

你可能感兴趣的:(笔记|数据分析之pandas基础----matplotlib基础功能(一))