NumPy(Numerical Python)是 Python 语言的一个扩展程序库。其中提供了许多向量和矩阵操作,能让用户轻松完成最优化、线性代数、积分、插值、特殊函数、傅里叶变换、信号处理和图像处理、常微分方程求解以及其他科学与工程中常用的计算,不仅方便易用而且效率更高。
NumPy 是一个开源的Python科学计算基础库,是SciPy、Pandas等数据处理或科学计算库的基础。包含:
一维数据由对等关系的有序或无需数据构成,采用线性方式组织,对应列表、数组和集合等概念。其中,列表和数组都是一维数据的有序结构。列表:数据类型可以不同;数组:数据类型可以相同。
高维数据仅利用最基本的二元关系展示数据间的复杂结构。
四维数组(数据柱)
五维数组(数据墙)
对于数据维度的Python表示,一维数据可以用列表或集合类型表示;二维或多维可以用列表类型表示;高维数据可以用字典或数据表示格式表示。目前,国际公认的数据表示格式有三种,分别是JSON、XML和YMAL格式。
数组的形状(Shape):描述数组的维度,用一个元组来表示,以及各个维度内部的元素个数。
( n 0 n_0 n0, n 1 n_1 n1…, n i n_i ni,… n m n_m nm)
数组的长度(Length):某个维度中的元素个数
Anaconda:安装了anaconda之后,NumPy就已经被安装好了
pip:pip installnumpy
import numpy as np
我们先来看一个例子:计算A的平方+B的三次方,其中,A和B是一维数组。
传统写法:
def pySum():
a = [0,1,2,3,4]
b = [9,8,7,6,5]
c = []
for i in range(len(a)):
c.append(a[i]**2 + b[i]**3)
return c
print(pySum())
# [729, 513, 347, 225, 141]
使用NumPy写法:
def npSum():
a = np.array([0,1,2,3,4])
b = np.array([9,8,7,6,5])
c = a**2 + b**3
return c
print(npSum())
# [729 513 347 225 141]
从中可以看出,①数组对象可以去掉元素运算所需的循环,使一维向量更像单个数据;②由于NumPy的底层是由c语言实现的,所以设置专门的数组对象,经过优化,可以提升这类应用的运算速度;通过观察,在科学计算中,一个维度所有数据的类型往往相同。③数组对象采用相同的数据类型,有助于节省运算和存储空间。
NumPy中定义的最重要的对象是称为ndarray的N维数组对象(矩阵),它描述相同类型的元素集合。ndarray对象由计算机内存中的一维连续区域组成,ndarray中的每个元素在内存中使用相同大小的块。
ndarray由两部分构成:①实际的数据;②描述这些数据的元数据(数据维度、数据类型等)。
np.array()生成一个ndarray数组:
从ndarray对象提取的任何元素(通过切片)由一个数组标量类型的 Python 对象表示。 下图显示了ndarray,数据类型对象(dtype)和数组标量类型之间的关系。
综上可以看出,数组的存储结构使其性能大大提高,优于使用列表。
属性 | 说明 |
---|---|
.shape | ndarray对象维度的元组 |
.ndim | ndarray对象的维度 |
.size | ndarray对象中元素总数,相当于.shape中n*m的值 |
.dtype | ndarray对象的元素类型 |
.itemsize | ndarray对象中每个元素的大小,以字节为单位 |
.flags | 这个函数返回了它们的当前值 |
a = np.array([[0,1,2,3,4],
[9,8,7,6,5]])
a.ndim
Out[15]: 2 #一共有2个维度
a.shape
Out[16]: (2, 5) #第一个维度有两个方向,第二个维度有5个元素
a.size
Out[17]: 10 #一共有10个元素
a.dtype
Out[18]: dtype('int32') #这是一个32位的整数类型
a.itemsize
Out[19]: 4 #每个元素由4个字节构成
a.flags
Out[20]:
C_CONTIGUOUS : True #(C) 数组位于单一的、C 风格的连续区段内
F_CONTIGUOUS : True #(F) 数组位于单一的、Fortran 风格的连续区段内
OWNDATA : True # (O) 数组的内存从其它对象处借用
WRITEABLE : True # (W) 数据区域可写入。 将它设置为flase会锁定数据,使其只读
ALIGNED : True # (A) 数据和任何元素会为硬件适当对齐
UPDATEIFCOPY : False # (U) 这个数组是另一数组的副本。当这个数组释放时,源数组会由这个数组中的元素更新
类型 | 类型代码 | 说明 |
---|---|---|
int8, uint8 | i1, u1 | 有符号和无符号的8位(1个字节)整型 |
int16, uint16 | i2, u2 | 有符号和无符号的16位(2个字节)整型 |
int32, uint32 | i4, u4 | 有符号和无符号的32位(4个字节)整型 |
int64, uint64 | i8, u8 | 有符号和无符号的64位(8个字节)整型 |
float16 | f2 | 半精度浮点数 |
float32 | f4 或 f | 标准的单精度浮点数。与C的float兼容 |
float64 | f8 或 d | 标准的双精度浮点数。与C语言的double和python的float对象兼容 |
float128 | f16 或 g | 扩展精度浮点数 |
complex64, complex128, complex256 | c8, c16, c32 | 分别用两个32位,64位,128位浮点数表示的复数 |
bool | ? | 存储True和False值的布尔类型 |
object | O | python对象类型 |
string_ | S | 固定长度的字符串类型(每个字符一个字节)。例如:要创建一个长度为10的字符串,应使用S10 |
unicode_ | U | 固定长度的Unicode类型(字节数由平台决定)跟字符串的定义方式一样 |
ndarray为什么要支持这么多种元素类型?
对比:Python语法仅支持整数、浮点数和复数3种类型。
基本的ndarray是使用NumPy中的数组函数创建的,它接收一切序列型的对象,比如:列表
、元组
、可迭代对象
等等,当然也包括它自己。
如下所示:
numpy.array(object, dtype = None, copy = True, order = None, subok = False, ndmin = 0)
上面的构造器接受以下参数:
参数 | 描述 |
---|---|
object | 一切序列型的对象,比如:列表 、元组 、可迭代对象 等等 |
dtype | 数组的所需数据类型,可选。 |
copy | 默认为true,对象是否被复制,可选 |
order | C(按行)、F(按列)或A(任意,默认 |
subok | 默认情况下,返回的数组被强制为基类数组。 如果为true,则返回子类。 |
ndmin | 指定返回数组的最小维数。 |
当np. array()不指定dtype时,NumPy将根据数据情况关联一个dtype类型。
下面我们看一些简单例子:
# 二维数组
import numpy
array = numpy.array([[1,2,3],[4,5,6]])
print(array)
# [[1 2 3]
# [4 5 6]]
# dtype为复数
import numpy
array = numpy.array([1,2,3],dtype=complex)
print(array)
# [1.+0.j 2.+0.j 3.+0.j]
x = np.array([0,1,2,3]) #从列表类型创建
print(x)
[0 1 2 3]
x = np.array((4,5,6,7)) #从元组类型创建
print(x)
[4 5 6 7]
x = np.array([[1,2],[9,8],(0.1,0.2)]) #从列表和元组混合类型创建
print(x)
[[1. 2. ]
[9. 8. ]
[0.1 0.2]]
这个函数返回ndarray对象,包含给定范围内的等间隔值。
a = numpy.arange(start, stop, step, dtype)
相关参数说明如下:
参数 | 说明 |
---|---|
start | 范围的起始值,默认为0 |
stop | 范围的终止值(不包含) |
step | 步长,默认为1 |
dtype | 指定填充值的数据类型,如果没有提供,则会使用输入数据的类型 |
import numpy as np
# 设置了 dtype
x = np.arange(5, dtype=float)
print x
# [0. 1. 2. 3. 4.]
# 设置了起始值和终止值参数
import numpy as np
x = np.arange(10,20,2)
print(X)
# [10 12 14 16 18]
该函数值分配数组大小内存,而不产生实际值。具有相同效果的还有有empty_like()函数。
np.empty(shape, dtype=None, order='C')
相关参数说明如下:
参数 | 说明 |
---|---|
shape | 列表或元祖表现的多维数组 |
order | C或者F,是否将多维数组以C或者Fortrain的形式存在内存中。默认为C |
dtype | 指定填充值的数据类型,如果没有提供,则会使用输入数据的类型 |
a = np.empty((3,3))
print(a)
print(a[0]) # 值为0
# 打印
[[0.00000000e+000 0.00000000e+000 0.00000000e+000]
[0.00000000e+000 0.00000000e+000 2.41104035e-321]
[1.37962320e-306 1.29060870e-306 2.22518251e-306]]
[0. 0. 0.]
认为empty()和empty_like()结果的值为0是不正确的,因为很多情况下,它返回的是未初始化的垃圾值
ones():返回特定大小,以1填充的新数组。
numpy.ones(shape, dtype = None, order = 'C')
相关参数说明如下:
参数 | 说明 |
---|---|
start | 范围的起始值,默认为0 |
stop | 范围的终止值(不包含) |
step | 两个值的间隔,默认为1 |
dtype | 指定填充值的数据类型,如果没有提供,则会使用输入数据的类型 |
import numpy
x = numpy.ones([2,2], dtype = int)
print(x)
# [[1 1]
# [1 1]]
zeros():返回特定大小,以0填充的新数组。
numpy.zeros(shape, dtype = None, order = 'C')
相关参数说明如下:
参数 | 说明 |
---|---|
start | 范围的起始值,默认为0 |
stop | 范围的终止值(不包含) |
step | 两个值的间隔,默认为1 |
dtype | 指定填充值的数据类型,如果没有提供,则会使用输入数据的类型 |
# 含有5个0的数组,默认类型为float
import numpy
x = numpy.zeros(5)
print(x)
# [0. 0. 0. 0. 0.]
指定输出的形状,再指定一个数填充入该结构中,输出该结果。
np.full(shape, fill_value, dtype=None, order='C')
相关参数说明如下:
参数 | 说明 |
---|---|
shape | 列表或元祖表现的多维数组 |
fill_value | 填充值 |
dtype | 指定填充值的数据类型,如果没有提供,则会使用输入数据的类型 |
order | C或者F,是否将多维数组以C或者Fortrain的形式存在内存中。默认为C |
np.full((2, 2), np.inf)
# 结果
array([[ inf, inf],
[ inf, inf]])
创建一个类单位矩阵,即对角线上为1,其余为0的数组。指定形状即可创建。
np.eye(N, M=None, k=0, dtype=float, order='C')
相关参数说明如下:
参数 | 说明 |
---|---|
N | 输出的行数 |
M | 输出的列数。如果为空,默认大小等于N |
k | 设定对角线索引位置。默认为主对角线,即0。正值,是上对角线;负值是下对角线。 |
dtype | 指定填充值的数据类型,如果没有提供,则会使用输入数据的类型 |
order | C或者F,是否将多维数组以C或者Fortrain的形式存在内存中。默认为C |
a = np.eye(5, k=-2)
b = np.eye(5, k=2)
print(a) # 右移两格
print(b) # 左移两格
# 打印
[[0. 0. 0. 0. 0.]
[0. 0. 0. 0. 0.]
[1. 0. 0. 0. 0.]
[0. 1. 0. 0. 0.]
[0. 0. 1. 0. 0.]]
[[0. 0. 1. 0. 0.]
[0. 0. 0. 1. 0.]
[0. 0. 0. 0. 1.]
[0. 0. 0. 0. 0.]
[0. 0. 0. 0. 0.]]
将输入值的整体或某部分,在原来的基础上,进行指定次数的复制,从而创建新的输出值。
np.repeat(a, repeats, axis=None)
相关参数说明如下:
参数 | 说明 |
---|---|
a | array-like |
repeats | 重复次数 |
axis | 执行方向 |
x = np.array([[1,2],[3,4]])
np.repeat(x, [1, 2], axis=0)
# 结果
array([[1, 2],
[3, 4],
[3, 4]])
使用NumPy包中的random模块,它包含很多函数可以创建基于随机的数组。
具体函数可以参考:np.random模块的使用
np.random.randint(start, end, size)
相关参数说明如下:
参数 | 说明 |
---|---|
start | 随机范围的下边界 |
end | 随机范围的上边界 |
size | 随机结果的形态 |
n1 = np.random.randint(5, 15, size=(4, 4))
# 输出:
array([[12, 11, 14, 6],
[ 5, 6, 13, 13],
[ 8, 14, 13, 12],
[ 8, 11, 10, 6]])
此函数类似于arange()函数。 在此函数中,指定了范围之间的均匀间隔数量,而不是步长
numpy.linspace(start, stop, num, endpoint, retstep, dtype)
相关参数说明如下:
参数 | 说明 |
---|---|
start | 序列的起始值 |
end | 序列的终止值 |
num | 要生成的等间隔样例数量,默认为50 |
endpoint | 如果为true,终止值包含在输出数组当中 |
retstep | 如果为true,返回样例,以及连续数字之间的步长 |
dtype | 输出数组的数据类型,如果没有提供,则取决于其它参数 |
a = np.linspace(10,20,5)
print(a)
# [10. 12.5 15. 17.5 20.]
x = np.linspace(1,2,5, retstep = True)
print(x)
#(array([ 1. , 1.25, 1.5 , 1.75, 2. ]), 0.25)
此函数返回一个ndarray对象,其中包含在对数刻度上均匀分布的数字。 刻度的开始和结束端点是某个底数的幂,通常为 10。
numpy.logscale(start, stop, num, endpoint, base, dtype)
相关参数说明如下:
参数 | 说明 |
---|---|
start | 起始值是base的start次幂 |
end | 终止值是base的stop次幂 |
num | 范围内的数值数量,默认为50 |
endpoint | 如果为true,终止值包含在输出数组当中 |
base | 对数空间的底数,默认为10 |
dtype | 输出数组的数据类型,如果没有提供,则取决于其它参数 |
# 默认底数是 10
a = np.logspace(1, 5, num=5, base=2)
print(a)
# [ 2. 4. 8. 16. 32.]
此函数类似于numpy.array,这个例程对于将Python序列转换为ndarray非常有用。
基本功能和array()一样
numpy.asarray(a, dtype = None, order = None)
相关参数说明如下:
参数 | 说明 |
---|---|
a | 任意形式的输入参数,比如列表、列表的元组、元组、元组的元组、元组的列表。 |
dtype | 通常,输入数据的类型会应用到返回的ndarray。 |
order | 'C’为按行的C风格数组,'F’为按列的Fortran风格数组。 |
例子1:
list1 = [[1, 1, 1], [1, 1, 1], [1, 1, 1]]
arr1 = np.array(list1)
arr2 = np.asarray(list1)
list1[0][0] = 3
print(list1)
print(arr1)
print(arr2)
[[3, 1, 1], [1, 1, 1], [1, 1, 1]]
[[1 1 1]
[1 1 1]
[1 1 1]]
[[1 1 1]
[1 1 1]
[1 1 1]]
array()和asarray()都是对列表进行了深复制,所以列表改变,数组对象不变
例子2:
arr1 = np.ones((3, 3))
arr2 = np.array(arr1)
arr3 = np.asarray(arr1)
arr1[0][0] = 3
print(arr1)
print(arr2)
print(arr3)
"""
[[3. 1. 1.]
[1. 1. 1.]
[1. 1. 1.]]
[[1. 1. 1.]
[1. 1. 1.]
[1. 1. 1.]]
[[3. 1. 1.]
[1. 1. 1.]
[1. 1. 1.]]
"""
可见,arr2没有发生改变,而arr3发生了改变。
当数据源本身已经是一个ndarray对象时,array()仍然会复制出一个副本,asarray()则直接引用了原来的数组。这是和array()的区别
ones_like(a):根据数组a的形状生成一个全1的数组
zeros_like(a):根据数组a的形状生成一个全0的数组
full_like(a,val):根据数组a的形状生成一个数组,每个元素值都是val
x.shape
# (2, 3, 4)
np.ones_like(x)
"""
array([[[1., 1., 1., 1.],
[1., 1., 1., 1.],
[1., 1., 1., 1.]],
[[1., 1., 1., 1.],
[1., 1., 1., 1.],
[1., 1., 1., 1.]]])
"""
np.zeros_like(x)
"""
array([[[0., 0., 0., 0.],
[0., 0., 0., 0.],
[0., 0., 0., 0.]],
[[0., 0., 0., 0.],
[0., 0., 0., 0.],
[0., 0., 0., 0.]]])
"""
np.full_like(x,3)
"""
array([[[3., 3., 3., 3.],
[3., 3., 3., 3.],
[3., 3., 3., 3.]],
[[3., 3., 3., 3.],
[3., 3., 3., 3.],
[3., 3., 3., 3.]]])
"""
此函数将缓冲区解释为一维数组。 暴露缓冲区接口的任何对象都用作参数来返回ndarray。
numpy.frombuffer(buffer, dtype=float, count=-1, offset=0)
参数说明如下:
参数 | 说明 |
---|---|
buffer | 任何暴露缓冲区借口的对象。 |
dtype | 通常,输入数据的类型会应用到返回的ndarray。 |
count | 需要读取的数据数量,默认为-1,读取所有数据。 |
offset | 需要读取的起始位置,默认为0。 |
例子
s = 'Hello World'
a = np.frombuffer(s, dtype = 'S1')
print(a)
# ['H' 'e' 'l' 'l' 'o' ' ' 'W' 'o' 'r' 'l' 'd']
此函数从任何可迭代对象构建一个ndarray对象,返回一个新的一维数组。
numpy.fromiter(iterable, dtype, count = -1)
参数说明如下:
参数 | 说明 |
---|---|
iterable | 任何可迭代对象。 |
dtype | 通常,输入数据的类型会应用到返回的ndarray。 |
count | 需要读取的数据数量,默认为-1,读取所有数据。 |
例子
# 从列表中获得迭代器
list1 = range(5)
it = iter(list1)
# 使用迭代器创建 ndarray
x = np.fromiter(it, dtype=float)
print(x)
# [0. 1. 2. 3. 4.]
对于创建后的ndarray数组,可以对其进行维度变换和元素类型变换。
方法 | 说明 |
---|---|
.reshape(shape) | 不改变数组元素,返回一个shape形状的数组,原数组不变 |
.resize(shape) | 与.reshape()功能一样,但修改原数组 |
.swapaxes(ax1, ax2) | 将数组n个维度中两个维度进行调换 |
.flatten() | 对数组进行降维,返回折叠后的一维数组,原数组不变,深拷贝 |
.ravel() | 对数组进行降维,返回折叠后的一维数组,原数组改变,浅拷贝 |
b = np.arange(12)
print(b)
# [ 0 1 2 3 4 5 6 7 8 9 10 11]
c = b.reshape(3, 4)
print(c)
"""
[[ 0 1 2 3]
[ 4 5 6 7]
[ 8 9 10 11]]
"""
b.resize(3, 4)
print(b)
"""
[[ 0 1 2 3]
[ 4 5 6 7]
[ 8 9 10 11]]
"""
当改变形状时,应该考虑到数组中的元素的个数,确保改变前后,元素总个数相等。
b = np.arange(12)
c = b.reshape(2, 5)
print(c)
b = np.arange(12).reshape(3, 4)
print(b)
"""
[[ 0 1 2 3]
[ 4 5 6 7]
[ 8 9 10 11]]
"""
reshape(shape)还可以根据数组中元素的总个数、以及其他维度的取值,来自动计算出这个维度的取值。通过-1
来实现
b = np.arange(12).reshape(-1, 6)
print(b)
"""
[[ 0 1 2 3 4 5]
[ 6 7 8 9 10 11]]
"""
# 只有一个参数表示一维数组,-1表示长度不知道,由numpy自动计算
b = np.arange(12).reshape(-1)
print(b)
# [ 0 1 2 3 4 5 6 7 8 9 10 11]
flatten方法和ravel方法
import numpy as np
n1 = np.random.randint(10,size=(4,4))
n1
# 结果
array([[8, 6, 0, 6],
[5, 1, 2, 4],
[9, 5, 9, 2],
[9, 5, 4, 1]])
(1) flatten方法
n1.flatten()
# 结果
array([8, 6, 0, 6, 5, 1, 2, 4, 9, 5, 9, 2, 9, 5, 4, 1])
再次打印n1:
n1
array([[8, 6, 0, 6],
[5, 1, 2, 4],
[9, 5, 9, 2],
[9, 5, 4, 1]])
(2) ravel属性
n1.ravel()
# 结果 同上
array([8, 6, 0, 6, 5, 1, 2, 4, 9, 5, 9, 2, 9, 5, 4, 1])
再次打印n1,同上:
n1
array([[8, 6, 0, 6],
[5, 1, 2, 4],
[9, 5, 9, 2],
[9, 5, 4, 1]])
区别:
n1.flatten()[0] = 100
n1
# 不改变原数组的值,重新拷贝一份
array([[8, 6, 0, 6],
[5, 1, 2, 4],
[9, 5, 9, 2],
[9, 5, 4, 1]])
n1.ravel()[0] = 100
n1
# 改变原数组的值,浅拷贝
array([[100, 6, 0, 6],
[5, 1, 2, 4],
[9, 5, 9, 2],
[9, 5, 4, 1]])
flatten和ravel都有返回值,ravel是浅拷贝,它的地址还是指向原来的数组,改变任意一方,都会受影响;flatten是深拷贝,它已经被分配了新的地址,所以改变自身的值,原值不受影响。
astype()方法一定会创建新的数组,即使两个类型一致(原始数据的一个拷贝)。
new_a = a.astype(new dtype)
a = np.ones((2, 3), dtype=np.int) #np.int表示整数类型这一类
print(a)
"""
[[1 1 1]
[1 1 1]]
"""
b = a.astype(np.float)
print(b)
"""
[[1. 1. 1.]
[1. 1. 1.]]
"""
ls = a.tolist()
a = np.full((2, 3), 25, dtype=np.int32)
print(a)
a.tolist()
print(a)
"""
[[25 25 25]
[25 25 25]]
[[25 25 25]
[25 25 25]]
"""
数组的转置/轴对换只会返回源数据的一个视图,不会对源数据进行修改。
print('ndarray数组的转置和轴对换')
k = np.arange(9) #[0,1,....8]
m = k.reshape((3,3)) # 改变数组的shape复制生成2维的,每个维度长度为3的数组
print(k) # [0 1 2 3 4 5 6 7 8]
print(m)
"""
[[0 1 2]
[3 4 5]
[6 7 8]]
"""
# 转置(矩阵)数组:T属性 : mT[x][y] = m[y][x]
print(m.T)
"""
[[0 3 6]
[1 4 7]
[2 5 8]]
"""
# 高维数组的轴对象
k = np.arange(8).reshape((2, 2, 2))
print(k)
"""
[[[0 1]
[2 3]]
[[4 5]
[6 7]]]
"""
print(k[1][0][0]) # 4
# 轴变换 transpose 参数:由轴编号组成的元组
m = k.transpose((1,0,2)) # m[y][x][z] = k[x][y][z] (0:x, 1:y, 2:z)
print(m)
"""
[[[0 1]
[4 5]]
[[2 3]
[6 7]]]
"""
# 轴交换 swapaxes (axes:轴),参数:一对轴编号
m = k.swapaxes(0,1) # 将第一个轴和第二个轴交换 m[y][x][z] = k[x][y][z]
print(m)
"""
[[[0 1]
[4 5]]
[[2 3]
[6 7]]]
"""
# 使用轴交换进行数组矩阵转置
m = np.arange(9).reshape((3,3))
print(m)
"""
[[0 1 2]
[3 4 5]
[6 7 8]]
"""
print(m.swapaxes(1,0))
"""
[[0 3 6]
[1 4 7]
[2 5 8]]
"""
v是vertical的英文单词缩写,是垂直的意思,所以是进行上下垂直方向上的堆叠,即:垂直堆叠。按照轴的标准看,则是axis=0,即按行拼接,将每一个水平行都堆叠在一起。那么列数必须相等。(注意理解,这并不矛盾)
import numpy as np
n1 = np.random.randint(10, size=(4, 4))
n2 = np.random.randint(10, size=(1, 4))
display(n1, n2)
# 结果
array([[5, 4, 7, 2],
[7, 6, 4, 3],
[7, 2, 5, 7],
[0, 6, 9, 3]])
array([[0, 8, 4, 1]])
np.vstack([n1, n2])
# 结果
array([[5, 4, 7, 2],
[7, 6, 4, 3],
[7, 2, 5, 7],
[0, 6, 9, 3],
[0, 8, 4, 1]])
h是horizontal的英文缩写,表示垂直的意思,所以是进行水平方向上的堆叠:即水平堆叠。按照轴的标准看,则是axis=1,即按列拼接,将每一个垂直列都堆叠在一起。那么
行数必须相等。
import numpy as np
n1 = np.random.randint(10, size=(4, 4))
n2 = np.random.randint(10, size=(4, 1))
display(n1, n2)
# 结果
array([[1, 4, 7, 8],
[2, 6, 7, 3],
[9, 0, 1, 4],
[1, 3, 3, 7]])
array([[4],
[4],
[6],
[4]])
np.hstack([n1, n2])
# 结果
array([[1, 4, 7, 8, 4],
[2, 6, 7, 3, 4],
[9, 0, 1, 4, 6],
[1, 3, 3, 7, 4]])
import numpy as np
n1 = np.random.randint(10, size=(4, 4))
n2 = np.random.randint(10, size=(4, 4))
display(n1, n2)
# 结果
array([[3, 5, 4, 6],
[8, 4, 1, 5],
[8, 7, 6, 9],
[5, 3, 7, 6]])
array([[6, 7, 9, 1],
[4, 1, 9, 7],
[6, 4, 0, 6],
[9, 9, 7, 9]])
np.concatenate([n1, n2])
# 结果 默认axis=0, 从第一层内容对应开始拼接(np.concatenate([n1, n2], axis=0))
array([[3, 5, 4, 6],
[8, 4, 1, 5],
[8, 7, 6, 9],
[5, 3, 7, 6],
[6, 7, 9, 1],
[4, 1, 9, 7],
[6, 4, 0, 6],
[9, 9, 7, 9]])
np.concatenate([n1, n2], axis=1)
# 结果 从第二层内容对应开始拼接
array([[3, 5, 4, 6, 6, 7, 9, 1],
[8, 4, 1, 5, 4, 1, 9, 7],
[8, 7, 6, 9, 6, 4, 0, 6],
[5, 3, 7, 6, 9, 9, 7, 9]])
a = np.arange(10).reshape(2, -1)
b = np.repeat(1, 10).reshape(2, -1)
# 打印a,b
array([[0, 1, 2, 3, 4],
[5, 6, 7, 8, 9]])
array([[1, 1, 1, 1, 1],
[1, 1, 1, 1, 1]])
np.c_[a,b]
# 结果
array([[0, 1, 2, 3, 4, 1, 1, 1, 1, 1],
[5, 6, 7, 8, 9, 1, 1, 1, 1, 1]])
创建一个 6 * 6 的二维数组:
import numpy as np
n1 = np.random.randint(10, size=(6, 6))
n1
# 结果
array([[9, 1, 9, 5, 7, 9],
[8, 9, 0, 6, 8, 1],
[5, 1, 5, 6, 4, 9],
[3, 2, 1, 9, 8, 8],
[3, 1, 5, 2, 2, 0],
[0, 3, 1, 4, 0, 3]])
注意:split理解为分离的意思,而不是切割的意思,否则,后面的结果会理解相反。
要想实现水平方向的分离,则需要从列方向进行切割。
np.hsplit(n1, 2)
# 输出
[array([[9, 1, 9],
[8, 9, 0],
[5, 1, 5],
[3, 2, 1],
[3, 1, 5],
[0, 3, 1]]), array([[5, 7, 9],
[6, 8, 1],
[6, 4, 9],
[9, 8, 8],
[2, 2, 0],
[4, 0, 3]])]
np.hsplit(n1, [2, 4])
# 结果
[array([[9, 1],
[8, 9],
[5, 1],
[3, 2],
[3, 1],
[0, 3]]), array([[9, 5],
[0, 6],
[5, 6],
[1, 9],
[5, 2],
[1, 4]]), array([[7, 9],
[8, 1],
[4, 9],
[8, 8],
[2, 0],
[0, 3]])]
np.vsplit(n1, 2)
# 输出
[array([[9, 1, 9, 5, 7, 9],
[8, 9, 0, 6, 8, 1],
[5, 1, 5, 6, 4, 9]]), array([[3, 2, 1, 9, 8, 8],
[3, 1, 5, 2, 2, 0],
[0, 3, 1, 4, 0, 3]])]
np.vsplit(n1, [2, 4])
# 结果
[array([[9, 1, 9, 5, 7, 9],
[8, 9, 0, 6, 8, 1]]), array([[5, 1, 5, 6, 4, 9],
[3, 2, 1, 9, 8, 8]]), array([[3, 1, 5, 2, 2, 0],
[0, 3, 1, 4, 0, 3]])]
axis指定按照哪一层进行切割,默认从axis=0、第0层为标准进行切割, 即vsplit方法,将垂直方向分成多个垂直子数组
np.array_split(n1, [1, 4])
# 结果 9, (8, 5, 3), (3, 0) 或(np.arrat_split(n1, [1, 4], axis=0))
[array([[9, 1, 9, 5, 7, 9]]), array([[8, 9, 0, 6, 8, 1],
[5, 1, 5, 6, 4, 9],
[3, 2, 1, 9, 8, 8]]), array([[3, 1, 5, 2, 2, 0],
[0, 3, 1, 4, 0, 3]])]
np.arrat_split(n1, [1, 4], axis=1)
# 结果 9, (1,9,5), (7, 9)
[array([[9],
[8],
[5],
[3],
[3],
[0]]), array([[1, 9, 5],
[9, 0, 6],
[1, 5, 6],
[2, 1, 9],
[1, 5, 2],
[3, 1, 4]]), array([[7, 9],
[8, 1],
[4, 9],
[8, 8],
[2, 0],
[0, 3]])]
nadarry数组的操作包括数组的索引和切片。①索引:获取数组中特定位置元素的过程;②切片:获取数组元素子集的过程。
与Python的列表类似
a = np.array([9,8,7,6,5])
print(a[2]) # 7
print(a[1:4:2]) #起始编号:终止编号(不含):步长
# [8 6]
a = np.arange(24).reshape((2, 3, 4))
print(a)
print(a[1, 2, 3]) #每个维度一个索引值,逗号分割
print(a[-1, 2, -2])
"""
[[[ 0 1 2 3]
[ 4 5 6 7]
[ 8 9 10 11]]
[[12 13 14 15]
[16 17 18 19]
[20 21 22 23]]]
"""
"""
23
22
"""
一维数组
a = np.array([0, 1, 2, 3])
print(a[0:3]) # [0 1 2]
print(a[:3]) # [0 1 2]
print(a[0:]) # [0 1 2 3]
二维数组
a = np.array([[0, 1, 2], [4, 5, 6]])
print(a[0])
# [0 1 2]
print(a[0:2])
"""
[[0 1 2]
[4 5 6]]
"""
print(a[:2])
"""
[[0 1 2]
[4 5 6]]
"""
print(a[0:2, 0:2])
"""
[[0 1]
[4 5]]
"""
print(a[0:2, 1:3])
"""
[[1 2]
[5 6]]
"""
print(a[:, 0])
"""
[0 4]
"""
三维数组
a = np.array([[[0, 1, 2], [3, 4, 5]], [[6, 7, 8], [9, 10, 11]]])
print(a[:, :, 0])
"""
[[0 3]
[6 9]]
"""
print(a[:, :, 0:2:2]) # print(a[:, :, ::2])
"""
[[ 2 5]
[ 8 11]]
"""
切片还可以包括省略号(…),来使选择元组的长度与数组的维度相同。 如果在行位置使用省略号,它将返回包含行中元素的ndarray。
a = np.array([[1, 2, 3], [3, 4, 5], [4, 5, 6]])
print(a)
"""
[[1 2 3]
[3 4 5]
[4 5 6]]
"""
# 这会返回第二列元素的数组:
print(a[..., 1])
"""
[2 4 5]
"""
# 现在我们从第二行切片所有元素:
print(a[1, ...])
"""
[3 4 5]
"""
# 现在我们从第二列向后切片所有元素:
print(a[..., 1:])
"""
[[2 3]
[4 5]
[5 6]]
"""
选出方形索引区域,使用ix_()函数
索引的数量与维度对应,并且,每个索引列表内都是一维的。
np.ix_([索引1],[索引2],[索引3])
例子:
arr1 = np.array([[8, 2, 3, 4],
[3, 5, 3, 9],
[3, 9, 9, 9],
[3, 2, 5, 5]])
print(arr1[np.ix_([0,2],[1,3])])
# 打印
"""
[[2 4]
[9 9]]
"""
布尔索引:使用布尔数组作为索引。arr[condition],condition为一个条件/多个条件组成的布尔数组。
示例:
x = np.array([3, 2, 3, 1, 3, 0])
# 布尔型数组的长度必须跟被索引的轴长度一致
y = np.array([True, False, True, False, True, False])
print(x[y]) # [3,3,3]
print(x[y == False]) # [2,1,0]
print(x >= 3) # [ True False True False True False]
print(x[~(x >= 3)]) # [2,1,0]
print((x == 2) | (x == 1)) # [False True False True False False]
print(x[(x == 2) | (x == 1)]) # [2 1]
x[(x == 2) | (x == 1)] = 0
print(x) # [3 0 3 0 3 0]
参考:
NumPy库的介绍与使用教程
Python之Numpy详细教程
NumPy — 从零到入门