一维数据
列表和数组的区别
列表:数据类型可以不同
数组:数据类型相同
二维数据
表格是典型的二维数据
多维数据
时间维度
高维数据
字典类型表示
通过键值对将数据组织起来的数据结构
numpy的N维数组对象 :ndarray
数组对象可以去掉元素间运算所需要的循环,使一维向量更像单个数据
np.array() 输出成[]形式 ,元素由空格分割
轴(axis):保存数据的维度
秩(rank):轴的数量
import numpy as np
# 生成一个ndarray数组
a = np.array([[0,1,2,3,4],[9,8,7,6,5]])
属性 | 说明 |
---|---|
.ndim | 秩,即轴的数量或维度的数量 |
.shape | ndarray对象的尺度,对于矩阵,n行m列 |
.size | ndarray对象元素的个数,相当于.shape中n*m的值 |
.dtype | ndarray对象元素的类型 |
.itemsize | ndarray对象中每个元素的大小,以字节为单位 |
x = np.array(list/tuple,dtype=np.float32)
函数 | 说明 |
---|---|
np.arange(n) | 类似range()函数,返回ndarray类型,元素从0到n-1 |
np.ones(shape) | 根据shape生成一个全1数组,shape是元组类型 |
np.zeros(shape) | 根据shape生成一个全0数组,shape是元组类型 |
np.full(shape,val) | 根据shape生成一个数组,每个元素都是val |
np.eye(n) | 创建一个正方的n*n单位矩阵,对角线为1,其余为0 |
np.ones_like(a) | 根据数组a的形状生成一个全1数组 |
np.zeros_like(a) | 根据数组a的形状生成一个全0数组 |
np.full_like(a,val) | 根据数组a的形状生成一个数组,每个元素值都是val |
np.linspace() | 根据起止数据等间距地填充数据,形成数组 |
np.concatenate() | 将两个或多个数组合并成一个新的数组 |
# 维度变换和元素类型变换
a = np.ones((2,3,4),dtype=np.int32)
# astype()方法会生成一个新的数组
new_a = a.astype(new_type)
# ndarray数组向列表转换
ls = a.tolist()
方法 | 说明 |
---|---|
.reshape(shape) | 不改变数组元素,返回一个shape形状的数组,原数组不变 |
.resize(shape) | 与.reshape()的功能一致,但是修改原数组 |
.swapaxes(ax1,ax2) | 将数组n个维度中两个维度进行调换 |
.flatten() | 对数组进行降维,返回折叠后的一维数组,原数组不变 |
数组的索引和切片
一维数组的索引和切片与列表类似
a = np.array([9,8,7,6,5])
a[2]
a[1:4:2]
多维数组的索引
a = np.arange(24).reshape((2,3,4))
a[1,2,3]
23
多维数组的切片
a[:,1,-3] # 选取一个维度用 :
a[:,1:3,:] # 每个维度的切片方法与一维数组相同
a[:,:,::2] # 每个维度使用步长跳跃切片
数组与标量之间的运算作用与数组的每一个元素
numpy一元函数
函数 | 说明 |
---|---|
np.abs(x) np.fabs(x) | 计算数组各元素的绝对值 |
np.sqrt(x) | 计算数组各元素的平方根 |
np.square(x) | 计算数组各元素的平方 |
np.log(x) np.log10(x) np.log2(x) | 计算数组各元素的自然对数、10为底对数、2为底对数 |
np.ceil(x) np.floor(x) | 计算数组各元素的ceiling值或floor值 |
np.rint(x) | 计算数组各元素的四舍五入值 |
np.modf(x) | 将数组各元素的小数和整数部分以两个独立数组形式返回 |
np.cos(x) np.cosh(x)np.sin(x) np.sinh(x)np.tan(x) np.tanh(x) | 计算数组各元素的三角函数 |
np.exp(x) | 计算数组各元素的指数值 |
np.sign(x) | 计算数组各元素的符号值,1(+),0,-1(-) |
numpy二元函数
函数 | 说明 |
---|---|
+ - * / ** | 两个数组各元素进行对应运算 |
np.maximum(x,y) np.fmax()np.minimum(x,y) np.fmin() | 元素级的最大值/最小值计算 |
元素级的最大值/最小值计算 | 元素级的模运算 |
np.copysign(x,y) | 将数组y中各元素值的符号赋值给数组x对应元素 |
> < >= <= == != | 算数比较,产生布尔型数组 |
数据的csv文件存取
cav文件 使用’’,"逗号分隔值
# 保存csv文件
np.savetxt(frame,array,fmt='%.18e',delimiter=None)
a = np.arange(100).reshape(5,20)
np.savetxt('a.csv',a,fmt='%d',delimiter=',')
# 读入csv文件
np.loadtxt(frame,dtype=np.float,delimiter=None,unpack=False)
b = np.loadtxt('a.csv',dtype = np.int,delimeter=',')
csv只能有效存储一维和二维数组
np.savetxt()和np.loadtxt() 只能有效存储一维和二维数组
多维数据的存取
a.tofile(frame,sep='',format='%s')
a = np.arange(100).reshape(5,10,2)
a.tofile('b.dat',sep=',',format='%d')
c = np.fromfile('b.dat',dtype=np.int,sep=',').reshape(5,10,2)
numpy的便捷文件存取
np.save(fname,array)
np.savez(fname,array)
np.load(fname)
函数 | 说明 |
---|---|
rand(d0,d1,…dn) | 根据d0-dn创建随机数数组,浮点数,[0,1),均匀分布 |
randn(d0,d1,…dn) | 根据d0-dn创建随机数数组,标准正态分布 |
randint(low[,high,shape) | 根据shape创建随机整数或整数数组,范围是[low,high) |
seed(s) | 随机数种子,s是给定的种子值 |
shuffle(a) | 根据数组a的第一轴进行随机排列,改变数组x |
permutation(a) | 根据数组a的第一轴产生一个新的乱序数组,不改变数组x |
choice(a[,size,replace,p) | 从一维数组a中以概率p抽取元素,形成size形状新数组replace表示是否可以重用元素,默认为False |
uniform(low,high,size) | 产生具有均匀分布的数组,low起始值,high结束值,size形状 |
normal(loc,scale,size) | 产生具有正态分布的数组,loc均值,scale标准差,size形状 |
poisson(lam,size) | 产生具有泊松分布的数组,lam随机事件发生率,size形状 |
np.random的随机数函数
np.random.rand(3,4,5)
np.random.randn(3,4,5)
np.random.randint(100,200,(3,4))
np.random.seed(10)
函数 | 说明 |
---|---|
sum(a,axis=None) | 根据给定轴axis计算数组a相关元素之和,axis为整数或元组 |
mean(a,axis=None) | 根据给定轴axis计算数组a相关元素的期望,axis为整数或元组 |
average(a,axis=None,weights=None) | 根据给定轴axis计算数组a相关元素的加权平均值 |
std(a,axis=None) | 根据给定轴axis计算数组a相关元素的标准差 |
var(a,axis=None) | var(a,axis=None) |
min(a) max(a) | 最小值、最大值 |
argmin(a) argmax(a) | 最小值、最大值的降一维后的下标 |
unravel_index(index,shape) | 根据shape将一维下标index转换成多维下标 |
ptp(a) | 计算数组a中元素最大值和最小值的差 |
median(a) | 计算数组a中元素的中位数(中值) |
np.argmax(b)
0 # 扁平化后的下标
np.unravel_index(np.argmax(b),b.shape)
(0,0) # 重塑成多维下标
梯度:连续值之间的变化率,即斜率。
# 计算数组f中元素的梯度,当f为多维时,返回每个维度的梯度
np.gradient(f)