NumPy提供了一个名为ndarray的多维数组对象,该数组元素具有固定大小。即NumPy数组元素是同质的,只能存放同一种数据类型的对象。能够运用向量化运算来处理整个数组,具有较高的运算效率。
array()函数可以将Python的列表、元组、数组或其他序列类型作为参数创建ndarray数组。
import numpy as np
a1 = np.array([1, 2, 3, 4, 5, 6]) #一维列表
print("a1=",a1)
a2 = np.array([[1, 2, 3], [4, 5, 6]]) #二维列表
print("a2=",a2)
a3 = np.array('abcdf') #字符串
print("a3=",a3)
a4 = np.array((1, 2, 3)) #元组
print("a4=",a4)
a5 = np.array({'zhang':12, 'dd':45}) #字典
print("a5=",a5)
## 输出 ##
a1= [1 2 3 4 5 6]
a2= [[1 2 3]
[4 5 6]]
a3= abcdf
a4= [1 2 3]
a5= {'zhang': 12, 'dd': 45}
NumPy提供了创建特殊数组的函数
import numpy as np
n1 = np.empty((2, 3))
print("empty()创建没有具体值的数,括号中是矩阵的大小:\n",n1)
n2 = np.zeros((3, 5))
print("zeros()创建全0数组,括号中是矩阵形状:\n",n2)
n3 = np.ones((4, 2))
print("ones()创建全1数组,括号中是矩阵形状:\n",n3)
n4 = np.eye(3)
print("eye()创建正方形的N×N单位矩阵,括号中是N的值:\n",n4)
n5 = np.ones_like(n1)
print("ones_like()创建和n1形状相同的全1数组:\n",n5)
## 输出 ##
empty()创建没有具体值的数,括号中是矩阵的大小:
[[0. 0. 0.]
[0. 0. 0.]]
zeros()创建全0数组,括号中是矩阵形状:
[[0. 0. 0. 0. 0.]
[0. 0. 0. 0. 0.]
[0. 0. 0. 0. 0.]]
ones()创建全1数组,括号中是矩阵形状:
[[1. 1.]
[1. 1.]
[1. 1.]
[1. 1.]]
eye()创建正方形的N×N单位矩阵,括号中是N的值:
[[1. 0. 0.]
[0. 1. 0.]
[0. 0. 1.]]
ones_like()创建和n1形状相同的全1数组:
[[1. 1. 1.]
[1. 1. 1.]]
从数值范围创建数组的NumPy函数有3个:arange(),linspace(),logspace();
numpy.arange(start, stop, step, dtype) #范围是左闭右开,step——步长:默认值“1”,dtype——返回ndarray数据类型,未提供,则使用输入数据的类型;
np.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None) #生成num个等步长的样本数量,若endpoint为True,则包括stop的值,反之不包括;若retstep为True,则显示间距,反之不显示;
np.logspace(start, stop, num=50, endpoint=True, base=10.0, dtype=None) #生成num个等步长的样本数量,若endpoint为True,则包括stop的值,反之不包括;base——对数log的底数,dtype——ndarray的数据类型。
import numpy as np
c1 = np.arange(10)
c2 = np.linspace(1, 10, 10) #等差数值
c3 = np.logspace(10, 100, 10) #等比数值
print("c1=",c1)
print("c2=",c2)
print("c3=",c3)
## 输出 ##
c1= [0 1 2 3 4 5 6 7 8 9]
c2= [ 1. 2. 3. 4. 5. 6. 7. 8. 9. 10.]
c3= [1.e+010 1.e+020 1.e+030 1.e+040 1.e+050 1.e+060 1.e+070 1.e+080 1.e+090
1.e+100]
函数asarray()把Python列表、元组等转换为NumPy数组:
numpy.asarray(a, dtype=None, order=None)
import numpy as np
d1 = [1, 2, 3, 4, 5, 6]
d2 = np.asarray(d1)
print(d2,d2.dtype)
## 输出 ##
[1 2 3 4 5 6] int32
在numpy.random模块中,提供了多种随机生成函数:
rand()函数,数组中的值服从[0,1)之间的均匀分布;
uniform()函数,uniform(low=0.0, high=1.0, size=None)返回一个区间在[low,high)中均匀分布的数组;
randn()函数,返回一个指定形状的数组,数组中的值服从标准正态分布(均值为0,方差为1);
normal()函数,numpy.random.normal(loc=0.0, scale=1.0, size=None)生成一个由size指定形状的数组,数组中的值服从μ=loc,σ=scale的正态分布;
randint()函数,numpy.random.randint(low, high=None, size=None, dtype=‘1’)生成一个区间[low,high)中离散均匀抽样的数组;
numpy.random.random(size=None),random()函数生成[0,1)之间均匀抽样的数组。
import numpy as np
a1 = np.random.rand(2, 4) #矩阵形状
print("rand()服从[0,1)之间的均匀分布:\n",a1)
print("")
a2 = np.random.uniform(size=(2, 4)) #矩阵形状,[low,high)为默认值[0,1)
b2 = np.random.uniform(3, 5, (2, 4)) #low=3, high=5
print("uniform()返回[low,high)中均匀分布的数组:\n",a2)
print(b2)
print("")
a3 = np.random.randn(2, 4) #返回指定形状的数组,数组中的值服从标准正态分布
print("randn()返回指定形状的数组,数组中的值服从标准正态分布:\n",a3)
print("")
a4 = np.random.normal(size=(2, 4))
print("normal()函数生成数组中的值服从μ=loc,σ=scale的正态分布:\n",a4)
print("")
a5 = np.random.randint(1, 10, size=(2, 4))
print("randint()函数生成一个区间[low,high)中离散均匀抽样的数组;\n",a5)
print("")
a6 = np.random.random((2, 4))
print("random()函数生成[0,1)之间均匀抽样的数组:\n",a6)
## 输出 ##
rand()服从[0,1)之间的均匀分布:
[[0.50117497 0.09453935 0.24949911 0.35242339]
[0.27614506 0.45828183 0.59054133 0.7599126 ]]
uniform()返回[low,high)中均匀分布的数组:
[[0.83404081 0.29614946 0.87971516 0.68255478]
[0.76991185 0.75489118 0.24766135 0.40941723]]
[[4.95719423 4.47697204 3.69370563 4.73220347]
[3.72110036 3.42003985 3.35648397 3.97719674]]
randn()返回指定形状的数组,数组中的值服从标准正态分布:
[[ 0.56189735 0.03944787 1.10676961 -0.9235279 ]
[ 1.16715689 0.98365254 -1.48988996 1.40805524]]
normal()函数生成数组中的值服从μ=loc,σ=scale的正态分布:
[[-0.65418483 0.25075608 -0.60689788 -0.21853615]
[ 1.22485674 -0.82383098 0.68833713 -1.03313177]]
randint()函数生成一个区间[low,high)中离散均匀抽样的数组;
[[4 1 2 5]
[7 6 9 6]]
random()函数生成[0,1)之间均匀抽样的数组:
[[0.59022693 0.06508505 0.24775246 0.30724648]
[0.32689472 0.54365446 0.13251454 0.89979262]]
import numpy as np
a = np.array([np.arange(3), np.linspace(3, 5, 3)])
print(np.arange(5).T) #一维数组的转置为自身(不改变)
print("a=",a)
print("秩,数据轴的个数:",a.ndim,"形状:", a.shape,"元素总个数:", a.size, "元素类型:",a.dtype,"每个元素的字节大小:", a.itemsize, "字节大小×数据个数:",a.nbytes)
print("数组转置:\n",a.T)
for item in a.flat: #flat迭代器遍历数组
print(item, end=",")
## 输出 ##
[0 1 2 3 4]
a= [[0. 1. 2.]
[3. 4. 5.]]
秩,数据轴的个数: 2 形状: (2, 3) 元素总个数: 6 元素类型: float64 每个元素的字节大小: 8 字节大小×数据个数: 48
数组转置:
[[0. 3.]
[1. 4.]
[2. 5.]]
0.0,1.0,2.0,3.0,4.0,5.0,
1、dtype指定数据类型
2、astype转换数据类型
import numpy as np
a = np.array([[1.1, 2.2],[3.3, 3.4]],dtype=np.float)
b = a.astype(np.int)
print('a=',a)
print('b=',b)
c = np.arange(5, dtype=np.int8)
print('c=',c)
print('c.dtype=',c.dtype)
print('数据类型转换后的dtype=',c.astype(np.float).dtype)
print('数据类型转换后的c=',c.astype(np.float))
print('c的数据类型未改变c.dtype=',c.dtype)
## 输出 ##
a= [[1.1 2.2]
[3.3 3.4]]
b= [[1 2]
[3 3]]
c= [0 1 2 3 4]
c.dtype= int8
数据类型转换后的dtype= float64
数据类型转换后的c= [0. 1. 2. 3. 4.]
c的数据类型未改变c.dtype= int8
一维数组索引
import numpy as np
a = np.linspace(-10, 10, 11)
print(a)
a[0], a[1], a[2] = 100, 200, 300
print(a)
## 输出 ##
[-10. -8. -6. -4. -2. 0. 2. 4. 6. 8. 10.]
[100. 200. 300. -4. -2. 0. 2. 4. 6. 8. 10.]
二维数组索引
import numpy as np
a = np.arange(12).reshape(3, 4)
print('a=',a)
print('a[0]=',a[0], 'a[2]=',a[2])
print('a[0][0]=',a[0][0], 'a[0,0]=',a[0,0], 'a[1][2]=',a[1][2], 'a[1,2]=',a[1,2])
a[0] = 10
print("a[0]修改后的a",a)
a[2,0] = 1000
print("a[2,0]修改后的a",a)
## 输出 ##
a= [[ 0 1 2 3]
[ 4 5 6 7]
[ 8 9 10 11]]
a[0]= [0 1 2 3] a[2]= [ 8 9 10 11]
a[0][0]= 0 a[0,0]= 0 a[1][2]= 6 a[1,2]= 6
a[0]修改后的a [[10 10 10 10]
[ 4 5 6 7]
[ 8 9 10 11]]
a[2,0]修改后的a [[ 10 10 10 10]
[ 4 5 6 7]
[1000 9 10 11]]
一维数组切片的格式是[starting_index, ending_index, step],step是步长,左闭右开原则,默认值为[0,1);
多维数组按照轴方向切片,默认是0轴。
import numpy as np
#一维数组切片
a = np.arange(12)
print('a=',a)
print('a[1:3]=',a[1:3], 'a[9:]=',a[9:])
print('a[1:7:2]=',a[1:7:2])
print('a[:]=', a[:])
## 输出 ##
a= [ 0 1 2 3 4 5 6 7 8 9 10 11]
a[1:3]= [1 2] a[9:]= [ 9 10 11]
a[1:7:2]= [1 3 5]
a[:]= [ 0 1 2 3 4 5 6 7 8 9 10 11]
import numpy as np
#二维数组切片
a = np.arange(12).reshape(3, 4)
print('a=',a)
print('a[0:2][1:3]=',a[0:2][1:3], 'a[2:][:2]=',a[2:][1:2]) #都是0轴上的索引,取交集
print('a[0:2]=',a[0:2])
## 输出 ##
a= [[ 0 1 2 3]
[ 4 5 6 7]
[ 8 9 10 11]]
a[0:2][1:3]= [[4 5 6 7]] a[2:][:2]= []
a[0:2]= [[0 1 2 3]
[4 5 6 7]]
注意:布尔数组的长度必须与目标数组对应的轴的长度一致
import numpy as np
from numpy.random import randn
name = np.array(['张','王','李','赵','钱']) #行索引
data = randn(5,3)
print(data)
print('钱对应的行:',data[name=='钱'])
## 输出 ##
[[ 2.37684956 -2.13037039 -1.63255503]
[ 1.05606501 1.64442386 -0.48824817]
[ 0.38975109 1.51344443 0.71365647]
[ 0.46663813 -0.62115848 -0.03084856]
[-0.49633786 0.34521226 0.86970657]]
钱对应的行: [[-0.49633786 0.34521226 0.86970657]]
import numpy as np
a = np.arange(12).reshape(3, 4)
print(a)
print('a>5', a>5)
print('a[a>5]', a[a>5])
## 输出 ##
[[ 0 1 2 3]
[ 4 5 6 7]
[ 8 9 10 11]]
a>5 [[False False False False]
[False False True True]
[ True True True True]]
a[a>5] [ 6 7 8 9 10 11]
通过整数列表或数组进行索引,也可以使用np.ix_()函数完成相同操作。
import numpy as np
a = np.arange(16).reshape(4, 4)
print(a)
print('花式索引1:\n', a[[0, 2, 3]][[0, 2]]) #“行”先对第一个数组进行索引,再对第二个数组进行索引
print('花式索引2:\n', a[[0, 2, 3]][:, [0, 2]]) #“行、列”
print('ix=\n', np.ix_([0, 2, 3], [0, 2]))
print('花式索引3:\n', a[np.ix_([0, 2, 3], [0, 2])])
## 输出 ##
[[ 0 1 2 3]
[ 4 5 6 7]
[ 8 9 10 11]
[12 13 14 15]]
花式索引1:
[[ 0 1 2 3]
[12 13 14 15]]
花式索引2:
[[ 0 2]
[ 8 10]
[12 14]]
ix=
(array([[0],
[2],
[3]]), array([[0, 2]]))
花式索引3:
[[ 0 2]
[ 8 10]
[12 14]]
1、dot()函数:计算两个数组的矩阵乘积;
2、vdot()函数:计算两个向量的点积。
import numpy as np
a = np.array([[1, 2], [3, 4]])
b = np.array([[5, 6], [7, 8]])
c = np.dot(a, b)
d = np.vdot(a, b)
print(a)
print(b)
print('dot=', c)
print('vdot=', d)
## 输出 ##
[[1 2]
[3 4]]
[[5 6]
[7 8]]
dot= [[19 22]
[43 50]]
vdot= 70
numpy.linalg.det()函数计算输入矩阵的行列式。
import numpy as np
a = np.array([[1, 2], [3, 4]])
b = np.linalg.det(a)
print(b)
## 输出 ##
-2.0000000000000004
numpy.linalg.inv()函数计算矩阵的乘法逆矩阵。
注意:如果矩阵是奇异的或者非方阵,使用inv()函数求逆矩阵,会出错。
import numpy as np
a = np.array([[1, 2], [3, 4]])
b = np.linalg.inv(a)
print(a)
print(b)
print(np.dot(a, b))
## 输出 ##
[[1 2]
[3 4]]
[[-2. 1. ]
[ 1.5 -0.5]]
[[1.00000000e+00 1.11022302e-16]
[0.00000000e+00 1.00000000e+00]]
numpy.linalg中的solve()函数可以求解线性方程组;
线性方程组 = ,其中A是一个矩阵,b是一维或者二维数组,而x是未知量。
令已知的线性方程组为:++=6 ;2+5=−4 ;2+5=27
import numpy as np
A = np.mat("1 1 1; 0 2 5; 2 5 -1");
b = np.array([6, -4, 27])
x = np.linalg.solve(A, b)
print('方程解:',x)
print(x.ndim) #维度
print(np.dot(A, x)) #验证
## 输出 ##
方程解: [ 5. 3. -2.]
1
[[ 6. -4. 27.]]
使用numpy.linalg程序包提供的eigvals()函数和eig()函数;
其中eigvals()返回矩阵的特征向量,eig()函数返回一个元组,其元素为特征值和特征向量。
import numpy as np
A = np.mat("1 -1; 2 4")
print(A)
e = np.linalg.eigvals(A)
print('evigvals特征值:', e)
e, v = np.linalg.eig(A)
print("eig特征值:", e)
print("eig特征向量:", v)
d = v * np.diag(e) * np.linalg.inv(v) #原矩阵
print('原矩阵:', d)
## 输出 ##
[[ 1 -1]
[ 2 4]]
evigvals特征值: [2. 3.]
eig特征值: [2. 3.]
eig特征向量: [[-0.70710678 0.4472136 ]
[ 0.70710678 -0.89442719]]
原矩阵: [[ 1. -1.]
[ 2. 4.]]
Numpy通过np.savetxt()函数对数组进行存储,通过np.loadtxt()函数对存储数组文件进行读取,并将其加载到一个数组中。
import numpy as np
a = np.arange(12).reshape(3, 4)
np.savetxt('1.txt', a)
b = np.loadtxt('1.txt')
print(b)
## 输出 ##
[[ 0. 1. 2. 3.]
[ 4. 5. 6. 7.]
[ 8. 9. 10. 11.]]