01_Python NumPy数组

2019.3.23

因为自己没什么动力，真的很久没有顺着自己的心思来学习了，趁着有数据分析的课，今天一大早起来学习一下Numpy库的使用。特以此文记录学习进度。

Numpy

一.ndarray数组的创建

1. 概述

numpy官网

NumPy是使用Python进行科学计算的基础包。它包含其他内容：一个强大的N维数组对象、复杂的（广播）功能、用于集成C / C ++和Fortran代码的工具、有用的线性代数，傅里叶变换和随机数功能除了明显的科学用途外，NumPy还可以用作通用数据的高效多维容器。可以定义任意数据类型。这使NumPy能够无缝快速地与各种数据库集成。Numpy具有两类对象，分别是ndarray(N-dimensional Array Object)以及ufunc(Universal Function Object)，前者类似于多维数组，后者则是可以对前者操作的函数。

2. 基本方法

numpy.array(object, dtype=None, copy=True, order='K', subok=False, ndmin=0)

numpy.array()是最原始的手动生成ndarray对象的方法。其中的object 需传入一个数组对象(n维)。注：当ndarray的维度过大时，numpy的输出会折叠中间结果。如果想要取消折叠。需要这样设置

np.set_printoptions(threshold=np.nan)

# Use the numpy.array to create the ndarray
import numpy as np
array1 = np.array([[1, 2, 3], [4, 5, 6]]) #必须传入一个列表或数组
"""Output: 
[[1 2 3]
 [4 5 6]]
"""

常用属性

常用属性	属性说明
ndim	矩阵的秩，即轴的数量或维度的数量
shape	数组的维度，对于矩阵，n 行 m 列
size	数组元素的总个数，相当于 .shape 中 nm 的值*
dtype	ndarray 对象的元素类型
real	ndarray元素的实部
imag	ndarray 元素的虚部

使用样例

# Use the numpy.array to create the ndarray
import numpy as np
array1 = np.array([[1, 2, 3], [4, 5, 6]])
print(array1.ndim)
""" Output: 2 """

arange([start]stop[,step], dtype=Nope)

numpy.arange()用于生成一个指定步长的等差数组。其做法与range()相似，包括start而不包括stop。其中start和step为可选参数，默认start为0，step为1；stop指定了区间的结束（开区间）；dtype默认为Nope。可惜的是，无法指定其形状shape，故只能通过修改shape的值的方法来生成多维数组。

使用样例

# Use the numpy.array to create the ndarray
import numpy as np
print("利用arange()来创建一个ndarray:", np.arange(0, 1, 0.1))
""" Output: 利用arange()来创建一个ndarray: [0. 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9] """

numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None, axis=0)

numpy.logspace()用于创建一个等比数组。其中start, stop 都是必须给出的参数，表示区间（规则与range()相同）。num表示元素的个数，默认50。在闭合区间[start，stop]或半开区间[start，stop]中存在数量等间距的样本（取决于端点是True还是False）。

numpy.logspace(start, stop, num=50, endpoint=True, base=10.0, dtype=None, axis=0)

numpy.logspace()与numpy.lonspqce()的区别在于，前者多了一个参数base，这意味着numpy.logspace()是根据10为底数来创建等比数组的（当然，可以传入别的值作为底），start与stop将被理解为“在[10^start, 10^stop]区间内构建等比数组”。

几个构建特殊矩阵数组的函数（不予以例子说明）

numpy.zeros()： 需要一个元组类似于(3,4)来指定形状，元素全部用0充填
numpy.ones()：需要一个元组类似于(3,4)来指定形状，元素全部用1充填
numpy.eye()：只需传入一个代表维数的int型整数即可，生成一个单位n维矩阵
numpy.diag()：需要传入一个具有n个元素的一维数组, 生成一个n维的，对角线上的元素依次为传入的一维数组的元素的矩阵（类似于对角矩阵）

二.Numpy的各种操作方式

矩阵运算

import numpy as np
a = np.array([20, 30, 40, 50])
b = np.arange(4)
print(a-b)
""" Output: [20 29 38 47] """
print(b**2)
""" Output: [0 1 4 9] """
print(10*np.sin(a))
""" Output: array([ 9.12945251, -9.88031624,  7.4511316 , -2.62374854]) """
print(a<35)
""" Output: [ True  True False False] """

与大部分的数学语言(如MATLAB)不同，Numpy中的乘号(*) 的数组运算是求元素积，而不是数量积（矩阵相乘）。如果需要求数量积，就需要使用@或者dot()。其他的诸如加减除（+ - /）等运算符，均在Numpy中通用。还有一些诸如求和，求最大最小值的函数也可用（sum(), min()等）。

import numpy as np
A = np.array([[1, 1],  [0, 1]]) 
B = np.array([[2, 0],  [3, 4]])
print(A * B)
""" Output: 
[[2, 0]
 [0, 4]]
"""
print(A @ B)
""" Output: 
[[5, 4]
 [3, 4]]
"""
print(A.dot(B)) 
""" Output:
[5, 4]
 [3, 4]]
"""

通用函数

一些通用的数学函数，例如sin、cos、exp等，此类函数被称作 通用函数，其操作的对象也是数组的元素，即元素积之类的。

import numpy as np
B = np.arange(3)
print(np.exp(B))
""" Output: [1.         2.71828183 7.3890561 ] """
print(np.sqrt(B))
""" Output: [0.         1.         1.41421356] """

索引

ndarray的索引使用方法与列表的写法相近。如果是多维的数组，则每一维的索引用逗号分隔。 其中还有一种比较有趣的写法--- 省略号：表示全集（即那个维度的全部元素）。索引甚至可以是一个数组，表示一次索引多个值、还可以是布尔表达式。 还有更多的高级玩法就不一一演示了。

import numpy as np
a = np.arange(10)**3 # 幂的写法，表示3次方
print(a[2:5])
""" Output: [ 8 27 64] """
def f(x, y):
  return 10*x + y
# fromfunction()可以从一个函数中获得数据来创建ndarray
b = np.fromfunction(f, (5, 4), dtype=int) 
print(b[1:3, 2:3])
"""Output:
[[12]
 [22]]
"""
print(b[:2 ,...]) #表示第二维输出全部元素
"""Output:
[[ 0  1  2  3]
 [10 11 12 13]]
"""
print(b[..., :2]) #表示第一维输出所有元素
"""Output:
[[ 0  1]
 [10 11]
 [20 21]
 [30 31]
 [40 41]]
"""

遍历

对一个多维的ndarray对象使用迭代器的话，默认是遍历一行。

import numpy as np
def f(x, y):
  return 10*x + y
b = np.fromfunction(f, (5, 4), dtype=int) 
for row in b:
  print(row)
"""Output:
[0 1 2 3]
[10 11 12 13]
[20 21 22 23]
[30 31 32 33]
[40 41 42 43]
"""
for elements in b.flat:
    print(elements)
"""Output:
0
1
2
3
...
"""

维度控制

numpy中有很多函数可以改变一个ndarray的维度。以下列出几个常用的。

ravel(): 对多维的矩阵进行降到一维的操作。并且，numpy.ravel()返回的是视图，会影响原始矩阵。
flatten()：功能与ravel()一致。但其是对矩阵的一个深拷贝进行操作，所以不会改变原矩阵。（不予以例子）

import numpy as np
a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]])
print(a) # 输出原矩阵
"""Output:
[[ 1  2  3]
 [ 4  5  6]
 [ 7  8  9]
 [10 11 12]]
"""
a = a.ravel()
print(a) #输出降维的矩阵，发现确实改变了原矩阵
"""Output: [ 1  2  3  4  5  6  7  8  9 10 11 12] """

reshape()与resize()：两者的功能都是将矩阵改变成指定的维度。reshape()传入一个元组，表示指定的维度（要合理）；resize()需要传入矩阵，和一个指定的元组。区别是，resize()会改变原矩阵。

import numpy as np
a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]])
print(a.reshape(3, 4))
"""Output:
[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]
"""Output:
print(a) # 原数组并没有被改变
"""Output:
[[ 1  2  3]
 [ 4  5  6]
 [ 7  8  9]
 [10 11 12]]
"""
print(np.resize(a, (3, 4))) # 必须这样来调用
"""Output:
[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]
"""
print(a) # 原矩阵被改变
"""Output:
[[ 1  2  3  4]
 [ 5  6  7  8]
 [ 9 10 11 12]]
"""
print(a.reshape(2, -1)) # 可以传入-1，numpy会自动计算剩下的维度，但还是要合理
"""Output:
[[ 1  2  3  4  5  6]
 [ 7  8  9 10 11 12]]
"""

复制

一般的矩阵复制并不会复制任何内存（只是改变了标签名）。 而视图(view)是矩阵的一个浅拷贝，虽不是原矩阵（即会另外分配内存），但对视图的操作会影响到原矩阵。 深复制则是另外分配内存，把原矩阵所有值复制过来，操作不会改变原矩阵。

import numpy as np
a = np.arange(12).reshape(3, 4)
b = a
b is a # True表示b和a是同一个内存对象
"""Output: True """
c = a.view()
c is a # c并不和a是同一个对象
"""Output: False """ 
print(a) # 输出原矩阵
"""Output:
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
"""
c[0, 0] = 111
print(a) # 改变视图，原矩阵元素改变
"""Output:
[[111   1   2   3]
 [  4   5   6   7]
 [  8   9  10  11]]
"""
b = a.copy()
b is a # 深拷贝不是同一对象
"""Output: False """
b[0, 0] = 222
print(a) # 深拷贝的操作不会改变原矩阵
"""Output:
[[111   1   2   3]
 [  4   5   6   7]
 [  8   9  10  11]]
"""

更多的进阶功能：
官方教程
函数详细说明文档及手册

三.实例联系：康威生命棋（用Numpy和pygame模拟）

剑桥大学 约翰·何顿·康威(John Horton Conway) 教授设计了一个叫做“生命游戏”的计算机程序，生命游戏是一个二维网格游戏，这个网格中每个方格居住着一个活着或死了的细胞。一个细胞在下一个时刻的生死取决于相邻8个方格中活着或死了的细胞的数量。如果相邻方格活着的细胞数量过多，这个细胞会因为资源匮乏而在下一个时刻死去；相反，如果周围活细胞过少，这个细胞会因为孤单而死去。

大致规则
(1)当前细胞为死亡状态时，当周围有3个存活细胞时，则迭代后该细胞变成存活状态(模拟繁殖)；若原先为生，则保持不变。
(2)当前细胞为存活状态时，当周围的邻居细胞低于两个(不包含两个)存活时，该细胞变成死亡状态(模拟生命数量稀少)。
(3)当前细胞为存活状态时，当周围有两个或3个存活细胞时，该细胞保持原样。
(4)当前细胞为存活状态时，当周围有3个以上的存活细胞时，该细胞变成死亡状态(模拟生命数量过多)。

这里就不多说什么了，直接上训练的代码。

import sys
import numpy as np # numpy用于存储康威生命棋的矩阵
import pygame # pygame可以提供游戏窗口


def life_step(x, y, world):
    # sum(a[, axis, dtype, out, keepdims]) 给定轴上的数组元素的总和
    neighbours = np.sum(world[x-1:x+2, y-1:y+2])-world[x, y]
    if world[x, y] == 1 and not 2 <= neighbours <= 3:
         return 0
    elif neighbours == 3:
         return 1
    return world[x, y]


def main():
    screen_size = 500
    tile_size = 10
    background_color = (0, 0, 0)
    cell_color = (255, 55, 255)
    pygame.init()
    screen = pygame.display.set_mode((screen_size, screen_size))
    pygame.display.set_caption('Convay\'s Game of Life')
    clock = pygame.time.Clock()
    world = np.random.choice(a=[0], size=(screen_size // tile_size + 1, screen_size // tile_size+1))
    gun = [(5, 1), (5, 2), (6, 1), (6, 2), (5, 11), (6, 11), (7, 11), (4, 12),
              (3, 13), (3, 14), (8, 12), (9, 13), (9, 14), (6, 15), (4, 16), (5, 17),
              (6, 17), (7, 17), (6, 18), (8, 16), (3, 21), (4, 21), (5, 21), (3, 22),
              (4, 22), (5, 22), (2, 23), (6, 23), (1, 25), (2, 25), (6, 25), (7, 25),
              (3, 35), (4, 35), (3, 36), (4, 36)]

    # 根据gun里的元素，将world相应位置的元素设置为1
    for i, j in gun:
        world[j, i] = 1

    fps = 0
    epoch = 0

    while True:
        for event in pygame.event.get():
            if event.type == pygame.QUIT:
                pygame.quit()
                sys.exit()
        pygame.display.set_caption("Convay\'s Game of Life /" + str(fps) +"FPS /" + str(epoch) + "epoch")
        screen.fill(background_color)
        new_world = np.copy(world)
        for (x, y), value in np.ndenumerate(world):
            new_world[x, y] = life_step(x, y, world)
            if new_world[x, y] == 1:
                pygame.draw.rect(screen, cell_color, (tile_size*(x-1), tile_size*(y-1), tile_size, tile_size), 0)
        world = new_world
        epoch += 1
        pygame.display.update()
        clock.tick(fps)


if __name__ == '__main__':
    main()

运行截图

康威生命棋01.png

康威生命棋02.png

01_Python NumPy数组

2019.3.23

一.ndarray数组的创建

1. 概述

2. 基本方法

二.Numpy的各种操作方式

三.实例联系：康威生命棋（用Numpy和pygame模拟）

你可能感兴趣的:(01_Python NumPy数组)