NumPy 是一个运行速度非常快的数学库,主要用于数组计算,包含:
一个强大的N维数组对象 ndarray
广播功能函数
整合 C/C++/Fortran 代码的工具
线性代数、傅里叶变换、随机数生成等功能
pip install numpy
import numpy as np
##Numpy的数据结构##
n维数组对象:ndarray(所有元素的数据类型必须一致,提高数据处理效率)
维度:一组数据的组织形式
N维数组的维度叫轴(axis),轴的个数叫秩(rank)
一维数据 :列表,数组,集合等
二维数据:由多个一维数据构成,是一维数据的组合形式(表格)
多维数据:由一维和二维数据在新维度上扩展形成
高维数据:仅利用最基本的二元关系展示数据间的复杂结构(键值对)
数组与列表的区别:
列表:数据类型可以不同
数组:数据类型相同 (也可不同,最好不要!)
print(array)
print('number of dim:',array.ndim)
print('shape:',array.shape)
print('size',array.size)
x = np,array(list/tuple)
x = np.array(list/tuple,dtype=np.float32)
###使用Numpy中函数创建ndarray数组###
np.arange(n) : #返回ndarray类型,元素从0到n-1
np.ones((m,n),dtype): #根据shape生成一个全1的数组,shape是元组类型
np.zeros((m,n),dtype): #根据shape生成一个全0的数组,shape是元组类型
np.full(shape,val): #根据shape生成一个数组,每个元素值都是val
np.eye(n) : #创建一个正方的n*n单位矩阵,对角线为1,其余为0
np.ones_like(a) : #根据数组a的形状生成一个全1数组
np.zeros_like(a) : #根据数组a的形状生成一个全0数组
np.full_like(a,val) : #根据数组a的形状生成一个数组,每个元素值都是val
np.linspace(起始值,结束值,元素个数,endpoint= T or F ) : #根据起止数据等间距地填充数据,形成数组 endpoint表示结束值是否为最后一个元素
np.concatenate() : 将两个或多个数组合并成一个新的数组
np.indices((m,n)) : #创建一个m行n列的矩阵
np.random.rand(m,n) #创建一个m行n列的随机数组
np.random.randn(m,n) : #创建一个m行n列的随机数组
np.random.rand() #产生0-1均匀分布的随机数数组
np.random.randn() #产生0-1标准正态分布的随机数数组
np.random.randint(low[,high,shape]) #根据shape创建随机整数数组,范围[low,high)
np.random.seed(s) #随机数种子,s为给定的种子值
new_a = a.astype(new_type )
ls = a.tolist()
一维数组
a = np.array([1,2,3,4,5,6,7])
a[2]
out: 3
a[1:4:2]
out: array[2,4]
多维数组
a = array([[[0 ,1 ,2 ,3 ],
[4, 5, 6, 7],
[8, 9, 10 ,11]],
[[12 ,13 ,14 ,15 ],
[16, 17, 18, 19],
[20, 21, 22 ,23]]])
a[1,2,3]
out: 23
a[0,1,2]
out:6
a[-1,-2,-3]
out:17
a[:,1,-3]
out: array([5,17])
a[:,1:3,:]
out: array([[[4 ,5 , 6, 7],
[8, 9, 10 ,11]],
[16 ,17, 18, 19],
[20, 21, 22, 23]]])
a[ : , : , : : 2]
out: array([[[ 0 , 2],
[ 4 , 6],
[ 8 ,10]],
[[12, 14],
[16, 18],
[20,22]]])
还可按条件进行切片
a[条件]
np.abs(x) np.fabs(x): #计算数组各元素的绝对值
np.sqrt(x) : #计算数组各元素的平方根
np.square(x) : #计算数组各元素的平方
np.log(x) np.log10(x) np.log2(x) : #计算数组各元素的自然对数、10底对数和2底对数
np.ceil(x) np.floor(x) : #计算数组各元素的ceiling值or floor值
np.rint(x) : #计算各元素的四舍五入值
np.modf(x) : #将数组各元素的小数和整数部分以两个独立数组形式返回
np.cos(x) np.cosh(x) : #计算各元素的普通型和双曲型三角函数
np.sin(x) np.sinh(x) : #计算各元素的普通型和双曲型三角函数
np.tan(x) np.tanh(x) : #计算各元素的普通型和双曲型三角函数
np.exp(x) : #计算数组各元素的指数值
np.sign(x) : #计算数组各元素的符号值
+-*/** #两个数组各元素进行对应运算
np.maximum(x,y) np.fmax()
np.minimum(x,y) np.fmin() #元素级的最大值最小值计算
np.mod(x,y) 元素级的模运算
np.copysign(x,y) 将数组y中各元素值的符号赋值给数组x对应的元素
<>>=<= == != #算术比较,产生布尔型数组
###从csv文件读入与数据###
import numpy as np
c = np.loadtxt(‘name’, dtype=’ ‘,
delimiter=’,’,usecols= ,skiprows= ,unpack= )
fname是文件名,数据类型为字符串str;
dtype是数据类型
delimiter是分隔符,数据类型为字符串str;
usecols是读取的列数,数据类型为元组tuple,其中元素个数有多少个,则选出多少列;
skiprows是需要跳过的行数
unpack是是否解包,数据类型为布尔bool,默认为False
’ ‘,
delimiter=’,’,usecols= ,skiprows= ,unpack= )
fname是文件名,数据类型为字符串str;
dtype是数据类型
delimiter是分隔符,数据类型为字符串str;
usecols是读取的列数,数据类型为元组tuple,其中元素个数有多少个,则选出多少列;
skiprows是需要跳过的行数
unpack是是否解包,数据类型为布尔bool,默认为False