NumPy图解操作详解

一、简介

NumPy是Python中诸多数据科学库的重要基础,例如,pandas,OpenCV,TensorFlow等,学习NumPy对其它NumPy依赖数据科学库意义重大

NumPy图解操作详解_第1张图片

 

0、NumPy数组 vs Python列表

  • Numpy数组中插入、移除元素没Python列表高效;

  • Numpy数组可直接做四则运算、Python列表则需借助列表推倒式等;

    NumPy图解操作详解_第2张图片

  • Numpy数组更紧凑,高维时尤为明显;

  • Numpy数组向量化后运算速度比Python列表更快;

  • Numpy数组通常是同质化的,仅仅当数组中元素类型一致时处理速度快。


1、一维数组 (向量)

1.1 数组创建

  • 通过Python列表创建

    ⚠️必须确保列表中元素类型一致,否则,进一步处理报错。⚠️NumPy数组区别于Python列表,不能在数组末尾直接扩展元素。

  • 通过np.zeros或np.empty等创建 可以通过np.zeros、np.ones、np.empty、np.full等创建数组。

    NumPy图解操作详解_第3张图片

  • 通过np.zeros_like或np.empty_like等创建 以上都有对应的_like函数,可快速创建a数组长度一致数组, 

    NumPy图解操作详解_第4张图片

  • 通过np.arange和np.linspace创建 np.arange类似于Python range

    NumPy图解操作详解_第5张图片

    ⚠️np.arange对元素数据类型敏感,特别是float类别,以下方式可供参考

  • 创建随机数组 已弃用方法,

    NumPy图解操作详解_第6张图片

    新方法, 


1.2 数组索引

1.1中介绍了多种构建数组的方法,1.2中介绍如何愉快的从数组中取元素。

  • 常见索引方法

    NumPy图解操作详解_第7张图片

  • 布尔运算符索引 

    NumPy图解操作详解_第8张图片

    ⚠️不能用三元运算符,如3<=a<=5。

  • np.where、np.clip+布尔运算符索引

    NumPy图解操作详解_第9张图片


1.3 数组操作

计算速度是NumPy的亮点之一,其数组运算操作速度接近C++,把数组当作整体来运算,避免Python的循环,可以解决一部分Python慢的问题,这一节介绍NumPy的数组操作。

  • 加减乘除、取整等基础操作 类似python加减乘除、取余数,

    NumPy图解操作详解_第10张图片

    向上、向下、四舍五入最大、最小、均值等,

  • 三角函数

    NumPy图解操作详解_第11张图片

  • 标量计算

    NumPy图解操作详解_第12张图片

  • 支持更多数学方法

    NumPy图解操作详解_第13张图片

  • 排序 只有部分Python列表排序操作,

    NumPy图解操作详解_第14张图片


1.4 数组元素查找

无Python list的index函数,通常有三种方法,

  • where,但不够pythonic、需压遍历数组;

  • next,较快,需要Numba;

  • searchsorted,适合已排序数组。

    NumPy图解操作详解_第15张图片


1.5 浮点数比较

NumPy图解操作详解_第16张图片


2 二维数组 (矩阵)

2.1 二维数组创建

同一维数组,⚠️使用[[]],

NumPy图解操作详解_第17张图片

随机数组构建


2.2 二维数组索引

比Python嵌套列表更方便

NumPy图解操作详解_第18张图片


2.3 二维数组操作

NumPy支持跨行、跨列操作,此时NumPy引入了axis的概念,axis=1,axis=0,

NumPy图解操作详解_第19张图片

  • 行列or行or列求和 

    NumPy图解操作详解_第20张图片

  • +、-、*、/、//、**和@  +、-、*、/、//、**类似一维数组,@为二维数组独有,二维数组整体计算,

    NumPy图解操作详解_第21张图片

    二维数组与单个元素、一维数组计算,@计算非对称线性代数外积,

  • 行/列向量计算

    NumPy图解操作详解_第22张图片

  • 二维数组变形 

    NumPy图解操作详解_第23张图片

    一维数组、二维数组之间互转,

  • hstack、vstack、column_stack拼接数组

    NumPy图解操作详解_第24张图片

  • hsplit、vsplit拆分二维数组

    NumPy图解操作详解_第25张图片

  • tile、repeat复制数组

    NumPy图解操作详解_第26张图片

  • delete二维数组删除 

    NumPy图解操作详解_第27张图片

  • insert二维数组插入 

    NumPy图解操作详解_第28张图片

  • append二维数组末尾操作

    NumPy图解操作详解_第29张图片

  • pad二维数组边界操作

    NumPy图解操作详解_第30张图片


2.4 二维数组网格化

针对网格化,C、传统Python及MATLAB都有解决办法,

NumPy图解操作详解_第31张图片

NumPy的广播机制让网格化更高效,此外,网格还可以用于数组索引,


2.5 二维数组统计

支持min/max, argmin/argmax, mean/median/percentile, std/var等函数,前面2.3节介绍过部分。

NumPy图解操作详解_第32张图片

argmin/argmax返回最大、最小值下标,all和any适用特定维度, 


2.6 二维数组排序

注意指定axis,

NumPy图解操作详解_第33张图片

  • argsort按某一列排序

    NumPy图解操作详解_第34张图片

  • lexsort对所有列进行排序 ⚠️总是按行执行,从下到上,

    NumPy图解操作详解_第35张图片

  • sort结合order

    NumPy图解操作详解_第36张图片


多维数组 (3维及更高维数组)

下面主要以3维数组为例。

3.1 多维数组创建

通过reshape 1维数组、嵌套Python list创建多维数组,索引(z,y,x)中,z是平面方向,(y,x)在z平面上坐标,

NumPy图解操作详解_第37张图片


3.2 多维数组创建hstack,vstack

适用3维数组,多了一个dstack,

⚠️但是,这些函数支持的索引顺序是(y,x,z),

NumPy图解操作详解_第38张图片

需要借助concatenate改变多维数组布局,广播机制也适用多维数组,einsum(Einstein summation)函数在多维数组中可避免过多Python循环,让代码更简洁。

 

你可能感兴趣的:(实战,Python,BIGDATA,python,Numpy)