本文总结了numpy 常见的用法 ,全文阅读大约需要 10 10 10分钟,可以按目录按需使用 。
NumPy是使用Python进行科学计算的基础包,主要用于对多维数组计算。numpy这个词来源于两个单词Numerical和Python。所以我之前读成“扭爬哎”是错的,应该是“难爬哎”。
配置好python之后,安装numpy的最快也是最简单的方法是在命令提示符中输入下命令:pip install numpy
numpy提供的最重要的数据结构是一个称为NumPy数组的强大对象, numpy数组是通常的Python数组的扩展。NumPy数组配备了大量的函数和运算符,让我们看看如何快速定义一维NumPy数组。
命令 | 数组 |
---|---|
np.array([1,2,3,4]) | 列表转为数组 |
np.arange(start, stop, step) | 整数序列数组 |
np.linspace(start, stop,num,endpoint=True) | 等差数列 |
np.logspace(start, stop,num,base) | 等比数列 |
np.zeros(shape, dtype=float, order=‘C’) | 全为 0 0 0的数组 |
np.ones(shape, dtype=float, order=‘C’) | 全为 1 1 1的数组 |
np.full((shape, fill_value) | 全为fill_value的数组 |
np.empty(shape,int) | 数组内容是随机的 |
np.zeros_like() | 生产一个和一样形状的数组 |
np.eye(N,M) | 生产N*M的单位矩阵 |
np.fromstring(str,dtype=np.int8) | 字符串转为数组 |
np.fromfunction(function, shape) | 函数生成数组 |
import numpy as np # 导入numpy模块
a=np.array([1,2,3,4],dtype='int') # 生成一维整形数组,dtype指定数组类型
# dtype参数泛类可选 int,float,complex,bool,string等
" array([1, 2, 3, 4]) "
a=np.arange(1,10,2) # 等差序列不包含结束值。
" array([1, 3, 5, 7, 9]) "
a=np.linspace(1,9,5,dtype="float",endpoint=True)
# 等差数组,注意第三个参数是数组元素个数,endpoint=True指定数组包含结束值.
" array([1., 3., 5., 7., 9.]) "
a=np.logspace(1,3,3, base=10, endpoint=True) # 对数等比数列,生成的数列以base=10取对数就是np.linspace(1,3,3)
" array([ 10., 100., 1000.]) "
# 可以生成任意等比数列,例如:
a=np.logspace(1,5,5, base=2, endpoint=True)
" array([ 2., 4., 8., 16., 32.]) "
a=np.zeros(shape=4) # 生成全为0的数组
" array([0., 0., 0., 0.]) "
a=np.ones(shape=(2,2),order='C') #shape 指定数组形状,order指定排布方向,C为行,F为列。
"" array([[1., 1.],
[1., 1.]]) ""
a=np.full((2,3),10) # shape指定形状,fill_value指定填充的值
"" array([[10, 10, 10],
[10, 10, 10]]) ""
b=np.zeros_like(a) # 和a数组一样全为0的数组
"" array([[0, 0, 0],
[0, 0, 0]]) ""
a=np.eye(2,2,k=0) # 生成单位矩阵 # 参数k控制为1的对角线位置, k=0是主对角线, k=1为右上↗, k=-1为左下↙。
"" array([[1., 0.],
[0., 1.]]) ""
a=np.empty((2,2),int)# 数组内容是随机的,不占用内存
"" array([[1506027568, 573],
[ 0, 0]]) ""
a=np.fromstring('1, 2', dtype=int, sep=',') # 字符串转换成数组
" array([1, 2]) "
def f1(x):
return 2*x
a=np.fromfunction(f1,(4,)) # 索引值为自变量,函数值为数组值
" array([0., 2., 4., 6.]) "
def f2(x,y):
return x+y
a=np.fromfunction(f2,(3,3)) # 二维数组则需要二元函数 , 变量分别为各个维度的索引, 更高维也是一样。
"""
array([[0., 1., 2.],
[1., 2., 3.],
[2., 3., 4.]])
"""
对数组操作之前,我们必须知道数组的底细,除了打印出来看之外,下面属性可以快速了解数组 。
a = np.array([[1,2,3],[4,5,6],[7,8,9]])
type(a)
' numpy.ndarray'> ' # 谁能告诉我为什么叫 ndarray
a.dtype # 数组数据类型
' dtype('int32') '
a.size # 数组元素个数
" 9 "
a.shape # 数组形状
" (3, 3) "
a.ndim # 数组的维数
" 2 "
a.itemsize # 每个项占用的字节数
" 4 "
a.nbytes # 数组中的所有数据消耗掉的字节数
" 36 "
待更新
使用numpy,可以轻松地在数组上执行数学运算, 加减乘除直接可以通过 + − ∗ / +-*/ +−∗/计算。
a = np.array([[1.0, 2.0], [3.0, 4.0]])
b = np.array([[5.0, 6.0], [7.0, 8.0]])
Sum= a + b
Difference = a - b
Product = a * b
Quotient = a / b
"""
Sum = array([[ 6., 8.],[10., 12.]])
Difference = array([[-4., -4.],[-4., -4.]])
Product =array([[ 5., 12.],[21., 32.]])
Quotient = array([[0.2 , 0.33333333], [0.42857143, 0.5 ]])
"""
注意乘法运算符( ∗ * ∗)执行逐元素乘法而不是矩阵乘法。矩阵乘法是下面的方法
matrix_product = np.dot(a,b)
"" matrix_product = array([[19., 22.],
[43., 50.]]) ""
下面的操作都可以对数组 所有元素 或者某一轴 进行, 如果没有指定轴就是对所有元素计算 。
a = np.array([[1,2,3],[4,5,6],[7,8,9]])
a.sum() " 45 " # 计算所有元素 # 下面都以定轴举例
a.sum(axis=0) # 指定第0轴求和
" array([12, 15, 18]) "
a.mean(axis=0) # 均值
" array([4., 5., 6.]) "
a.std(axis=0) # 标准差
" array([2.44948974, 2.44948974, 2.44948974]) "
a.var(axis=0) # 方差
" array([6., 6., 6.]) "
a.prod(axis=0) # 定轴乘积
" array([ 28, 80, 162]) "
a.ptp(axis=0) # 定轴极差
" rray([6, 6, 6]) "
a.min()# a.max # 数组中最小最大值
" 1 "
a.argmin(axis=0) # argmax # 数组中最小最大值的索引
" array([0, 0, 0]) "
numpy数据的格式为.npy 。
a = np.array([[1,2,3],[4,5,6],[7,8,9]])
np.save("npy_data_a.npy",a) # 参数分别为保存的文件路径# 需要保存的数组
np.load("npy_data_a.npy") # 加载路径
"""
array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])
"""
np.savetxt("tet_data_a.txt",a) # 保存为txt文件数据
np.loadtxt("tet_data_a.txt") # 加载txt数据
"""
array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])
"""
np.savetxt("csv_data_a.csv",a,delimiter=",") # 保存为csv , delimiter为分隔符
b,c=np.loadtxt('csv_data_a.csv',delimiter=",",usecols=(1,2),max_rows=2,encoding='utf-8',unpack=True)
# 加载csv数据
# delimiter为分隔符 # usecols 为指定的列 # max_rows 加载最大行数
# encoding 选择编码方式 ,编码方式不同会报错 # unpack 是否解包,这里两列分别解包给b,c
"" b=array([2., 5.])
c=array([3., 6.]) ""
numpy切片和列表切片一样 ,方法是 np.array [起始 : 终点 : 步长] ,返回数组包含起始值不包含终点值, 起始和终点位置为负,则从后面数,倒数第一为 − 1 -1 −1 。步长为负则从后面向前切片 。
a=np.arange(6) " array([0, 1, 2, 3, 4, 5]) "
a[0:5:2] " array([0, 2, 4]) "
a[-1:2:-1] " array([5, 4, 3]) "
location=[0,3] #指定任意位置
a[location] " array([0, 3]) "
a>3 " array([False, False, False, False, True, True]) "
a[a>3] " array([4, 5]) "
a[(a>3)&(a<5)] " array([4]) "
多维索引就是在每一维分别做一维索引 。
a = np.array([[1,2,3],[4,5,6],[7,8,9]])
a[1,2] " 6 "
a[::2 , np.array([False,True,True])] # 第 0 维度切片,第 1 维度布尔值索引 ,可以看成在各轴独立的指定
"" array([[2, 3],
[8, 9]]) ""
感谢您在茫茫的网络世界中阅读了本文, 真心希望没有浪费您宝贵的时间,期待您指出文中的不足!