一、简介
NumPy是Python中诸多数据科学库的重要基础,例如,pandas,OpenCV,TensorFlow等,学习NumPy对其它NumPy依赖数据科学库意义重大
Numpy数组中插入、移除元素没Python列表高效;
Numpy数组可直接做四则运算
、Python列表则需借助列表推倒式等;
Numpy数组更紧凑,高维
时尤为明显;
Numpy数组向量化后运算
速度比Python列表更快;
Numpy数组通常是同质化
的,仅仅当数组中元素类型一致时处理速度快。
通过Python列表创建
⚠️必须确保列表中元素类型一致,否则,进一步处理报错。⚠️NumPy数组区别于Python列表,不能在数组末尾直接扩展元素。
通过np.zeros或np.empty等创建 可以通过np.zeros、np.ones、np.empty、np.full等创建数组。
通过np.zeros_like或np.empty_like等创建 以上都有对应的_like函数,可快速创建a数组长度一致数组,
通过np.arange和np.linspace创建 np.arange类似于Python range
⚠️np.arange对元素数据类型敏感,特别是float类别,以下方式可供参考
创建随机数组 已弃用方法,
新方法,
1.1中介绍了多种构建数组的方法,1.2中介绍如何愉快的从数组中取元素。
计算速度是NumPy的亮点之一,其数组运算操作速度接近C++,把数组当作整体来运算,避免Python的循环,可以解决一部分Python慢的问题,这一节介绍NumPy的数组操作。
无Python list的index函数,通常有三种方法,
同一维数组,⚠️使用[[]],
随机数组构建
比Python嵌套列表更方便
NumPy支持跨行、跨列操作,此时NumPy引入了axis的概念,axis=1,axis=0,
行列or行or列求和
+、-、*、/、//、**和@ +、-、*、/、//、**类似一维数组,@为二维数组独有,二维数组整体计算,
二维数组与单个元素、一维数组计算,@计算非对称线性代数外积,
行/列向量计算
二维数组变形
一维数组、二维数组之间互转,
hstack、vstack、column_stack拼接数组
hsplit、vsplit拆分二维数组
tile、repeat复制数组
delete二维数组删除
insert二维数组插入
append二维数组末尾操作
pad二维数组边界操作
针对网格化,C、传统Python及MATLAB都有解决办法,
NumPy的广播机制让网格化更高效,此外,网格还可以用于数组索引,
支持min/max, argmin/argmax, mean/median/percentile, std/var等函数,前面2.3节介绍过部分。
argmin/argmax返回最大、最小值下标,all和any适用特定维度,
注意指定axis,
下面主要以3维数组为例。
通过reshape 1维数组、嵌套Python list创建多维数组,索引(z,y,x)中,z是平面方向,(y,x)在z平面上坐标,
适用3维数组,多了一个dstack,
⚠️但是,这些函数支持的索引顺序是(y,x,z),
需要借助concatenate改变多维数组布局,广播机制也适用多维数组,einsum(Einstein summation)函数在多维数组中可避免过多Python循环,让代码更简洁。