NumPy(Numerical Python) 是使用Python进行科学计算的基础软件包。支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。
numpy.array()
numpy为我们提供了一个特殊的数组对象, 用它表示一维数组、二维矩阵等。
numpy提升了Python中数据计算的速度,比python快,因为底层是C。
对于任何想要运算的数据,需要预先将他们表示成numpy数组的形式。
——即向量化(Vectorization)
一、创建数组
numpy的计算围绕数组
首先要将计算的数据表示成数组的形式
>>> import numpy as np #导入numpy库,并起别名为np
>>> np.array([1,2,3]) #创建一个数组
>>> a = np.zeros((3,2)) #创建一个全0的数组,此处为三行两列的全0数组
>>> a.shape #获取数组的尺寸,此处输出(3,2)
>>>np.ones((2,4)) #创建一个全部是一的数组
>>>np.arange(3,7) #创建一个递增的数列,此处array([3,4,5,6]),类似于python的range
>>>np.linspace(0,1,5) #返回介于某个区间等间距分布的数,此处返回范围0到1,输出5个数
>>>np.random.rand(2,4) #生成随机数组
数组默认的数据类型是64位浮点数
>>> a=np.zeros((4,2),dtype=np.int32) #通过dtype指定其他的数据类型
>>> b=a.astype(int) #转换数据类型
二、基本运算
四则运算:相同尺寸的两个数组
点乘:np.dot(a,b) #对两个向量进行点乘
矩阵乘法:a @ b #等同于np.matmul()
对所有数依次求平方根:np.sqrt(a)
三角运算:np.sin(a) , np.cos(a)
对数指数运算:np.log(a) , np.power(a,2) #平方
数组与实数运算:a * 5 #各个元素与这个数的乘积,这个操作称为广播(Broadcasting)
求最值:a.min() a.max() #数组a中最小或最大的元素
最值的索引:a.argmin() a.argmax() #返回最小或最大元素所在的索引
求和:a.sum()
返回平均值:a.mean()
返回中位数:np.median(a)
返回方差:a.var()
返回标准差:a.std()
不同尺寸的数组也可以做运算,numpy会将这两个数组扩展至相同的尺寸
然后将相同位置的元素相加,
axis参数
axis=0代表第一个维度,也就是行
axis=1代表第二个维度,也就是列
获取数组内元素,例如第一行第二列的元素,则为下标0,1
按照条件筛选出指定的元素,如小于3的元素。
此处“条件”可以通过逻辑运算符==、&、|等组合出更复杂的条件
切片获取数据,如第一行第1-2列的所有数据,0:2代表[0,2),不包含2
这和Python中list的切片方式是一样的。
获取第一行所有列的元素,则 a[0, :] 或 a[0]
第二个冒号的后面可以跟一个跨度,如下举例
这个跨度还可以取负值,从右往左逆向返回这个数组
从右往左逆向返回这个数组,会经常看到 ::-1 的写法,翻转数组。
三、numpy的典型应用:图片处理
通常可以把一张灰度图看作是一个二维的数组,数组中的每个元素用来表示像素点的亮度值。
对于彩色的图片,可以用三维数组来表示。数组中的第三维分别存储了像素点的红绿蓝分量。
使用Pillow这个库在Python中读取图片(pip install pilllow安装)
from PIL import Image
im = Image.open('picture.jpg')
im.show() #显示图片
im= np.array(im) #将图片转换成一个numpy数组
im.shape #可以看到图片一共有多少行、多少列,以及颜色分量的数量(如彩色是3)
可以通过下标访问某个像素点的颜色,如100,100
提取所有像素点的红色分量 :,:,0
将两张图片按比例混合在一起,即对其进行四则运算。
这里的运算结果是浮点数,为了显示图片,需要将图片转换成整型数。
可利用跨度对图片进行降采样 im[::10 , ::10 , :]
翻转图片 im[::-1 , : , : ] ,利用跨度-1,这里指定的是第一个维度,因此图片会上下翻转。
裁剪图片,可以利用切片,如im[40:540 , 40:900 , :]
书籍:https://www.labri.fr/perso/nrougier/from-python-to-numpy/