Python数据可视化工具matplotlib的学习笔记(二)

(2020.03.24)

  • 使用颜色映射(http://matplotlib.org/)
    颜色映射时一系列颜色,它们从起始颜色渐变到结束颜色。在可视化中,颜色映射用于突出数据的规律。
    模块pyplot内置了一组颜色映射。要使用这些颜色映射,你需要告诉pyplot该如何设置数据集中每个点的颜色。
x_values = list(range(1,1001))
y_values = [x**2 for x in x_values]

plt.scatter(x_values,y_values,c=y_values,cmap=plt.cm.Blues,
    edgecolor='none',s=40)

步骤:将参数c(表示颜色的参数)设置成一个y值列表,并使用参数cmap(“cmap=plt.cm.Blues”)告诉pyplot使用哪个颜色映射这些代码将y值较小的点显示为浅蓝色,并将y值较大的点显示为深蓝色。

  • 自动保存图表
    可将对plt.show()的调用替换为plt.savefig()的
    调用。
plt.savefig('squares_plot.png',bbox_inches='tight')

第一个实参指定要以什么样的文件名保存图表,并且会存储到编写的python文件所在的目录中;
第二个实参指定将图表多余的空白区域裁剪掉。如果要保留图表周围多余的空白区域,可省略这个实参。

随机漫步

随机漫步每次行走都完全是随机的,没有明确的方向,结果是由一系列随机决策决定的。

  • 创建RandomWalk()类 (随机地选择前进方向)
    这个类需要三个属性,其中一个是存储随机漫步次数的变量,其他两个是列表,分别存储随机漫步经过的每个点的x和y坐标。
    RandomWalk类只包含两个方法:__ init __ ()和fill_walk(),后者计算随机漫步经过的所有点。

  • 方法__ init __() :

from random import choice
class RandonWalk():
    #一个生成随机漫步数据的类

    def __init__(self,num_points=5000):
        #初始化随机漫步的属性
        self.num_points = num_points

        #所有随机漫步都始于(0,0)
        self.x_values = [0]
        self.y_values = [0]

将随机漫步包含的默认点数设置为5000;
然后创建两个用于存储x和y值的列表,并让每次漫步都从点(0,0)出发。

  • 选择方向
    使用fill_walk()来生成漫步包含的,并决定每次漫步的方向
    这个方法告诉Python如何模拟四种漫步决定:向右走还是向左走?沿指定的方向走多远?向上
    走还是向下走?沿选定的方向走多远?
def fill_walk(self):
        #计算随机漫步包含的所有点

        #不断漫步,直到列表达到指定的长度
        while len(self.x_values) < self.num_points:
            
            #决定前进方向以及沿这个方向前进的距离
            x_direction = choice([1,-1])
            x_distance = choice([0,1,2,3,4])
            x_step = x_direction * x_distance

            y_direction = choice([1,-1])
            y_distance = choice([0,1,2,3,4])
            y_step = y_direction * y_distance

            #拒绝原地踏步
            if x_step == 0 and y_step == 0:
                continue
            
            #计算下一个点的x和y值
            next_x = self.x_values[-1] + x_step
            next_y = self.y_values[-1] + y_step

            self.x_values.append(next_x)
            self.y_values.append(next_y)

首先建立一个循环,这个循环不断运行,直到漫步包含所需数量的点。

(1)、使用choice([1, -1]) 给-(x_direction)选择一个值,结果要么是表示向右走的1,要么是表示向左走的-1
(2)、choice([0, 1, 2, 3, 4])随机地选择一个0~4之间的整数,告诉Python 沿指定的方向走多远(x_distance)。(通过包含0,不仅能够沿x轴移动,还能够沿y轴移动。
(3)、将移动方向乘以移动距离,以确定沿x和y轴移动的距离。如果x_step为正,将向右移动为负向左移动,而为零垂直移动;如果y_step为正,就意味着向上移动,为负意味着向下移动,而为零意味着水平移动。
(4)、如果x_step和y_step都为零,则意味着原地踏步,使用if语句拒绝这种情况,接着执行下一次循环。
(5)、为获取漫步中下一个点的x值,将x_step与x_values中的最后一个值相加,对于y值也做相同的处理。获得下一个点的x值和y值后,我们将它们分别附加到列表x_values和y_values的末尾。

  • 绘制随机漫步图
import matplotlib.pyplot as plt

from random_walk import RandomWalk

#创建一个RandomWalk实例,并将其包含的点都绘制出来
rw = RandomWalk()
rw.fill_walk()
plt.scatter(rw.x_values,rw.y_values,s=15)
plt.show()

(1)、导入模块pyplotRandomWalk类,然后创建一个RandomWalk实例,将其存储在rw中,再调用fill_walk()
(2)、将随机漫步包含的x和y值传递给scatter(),并选择合适地点尺寸(s=15)。

  • 模拟多次随机漫步
    方法:将这些代码放在一个while循环中
import matplotlib.pyplot as plt

from random_walk import RandomWalk

#只要程序处于活动状态,就不断的模拟随机漫步
while True:

    #创建一个RandomWalk实例,并将其包含的点都绘制出来
    rw = RandomWalk()
    rw.fill_walk()
    plt.scatter(rw.x_values,rw.y_values,s=15)
    plt.show()

    keep_running = input("Make another walk?(y/n): ")
    if keep_running == 'n':
        break
  • 给点着色
    point_numbers = list(range(rw.num_points))
    plt.scatter(rw.x_values,rw.y_values,c=point_numbers,
            cmap=plt.cm.Blues,edgecolor='none',s=15)
    plt.show()

(1)、使用range()生成一个数字列表,其中包含的数字个数与漫步包含的点数相同。然后将这个列表存储在point_numbers中,以便后面使用它来设置每个漫步点的颜色。即:将参数c设置为point_numbers
(2)、指定使用颜色映射Blues。(“cmap=plt.cm.Blues”)
(3)、传递实参edgecolor=none以删除每个点周围的轮廓。(edgecolor=‘none’)

  • 重新绘制起点和终点
    #突出起点和终点
    plt.scatter(0,0,c='green',edgecolors='none',s=100)
    plt.scatter(rw.x_values[-1],rw.y_values[-1],c='red',edgecolors='none',
            s=100)
  • 隐藏坐标轴
 	#隐藏坐标轴
    plt.axes().get_xaxis().set_visible(False)
    plt.axes().get_yaxis().set_visible(False)

使用函数plt.axes()将每条坐标轴的可见性都设置为False。

  • 调整尺寸以适合屏幕
    #设置绘图窗口的尺寸
    plt.figure(dpi=1080,figsize=(10,6))

(1)、函数figure()用于指定图表的宽度高度分辨率背景色。需要给形参figsize指定一个元组,向其指出绘图窗口的尺寸,单位为英尺
(2)、Python假定屏幕分辨率为80像素/英尺,若需要调整,可使用形参dpifigure()传递分辨率数值。

你可能感兴趣的:(Python数据可视化工具matplotlib的学习笔记(二))