numpy库相关知识

文章目录

    • numpy库函数速查表
    • numpy库入门
      • 数据维度
      • numpy介绍
      • ndarray对象的属性
      • ndarray数组的创建和变换
      • ndarray数组的变换
      • ndarray数组的操作
      • ndarray数组的运算
      • numpy的随机数函数
      • numpy的统计函数
      • numpy的梯度函数

numpy库函数速查表

numpy库相关知识_第1张图片

numpy库入门

  • 数据的维度:一维、二维、多维、高维
  • ndarray类型 属性、创建和变换
  • 数组的索引和切片
  • 数组的运算:一元函数、二元函数

数据维度

一维数据

列表和数组的区别
列表:数据类型可以不同
数组:数据类型相同

二维数据
表格是典型的二维数据

多维数据
时间维度

高维数据
字典类型表示
通过键值对将数据组织起来的数据结构

numpy介绍

numpy的N维数组对象 :ndarray
数组对象可以去掉元素间运算所需要的循环,使一维向量更像单个数据

np.array() 输出成[]形式 ,元素由空格分割
轴(axis):保存数据的维度
秩(rank):轴的数量
import numpy as np
# 生成一个ndarray数组
a = np.array([[0,1,2,3,4],[9,8,7,6,5]])

ndarray对象的属性

属性 说明
.ndim 秩,即轴的数量或维度的数量
.shape ndarray对象的尺度,对于矩阵,n行m列
.size ndarray对象元素的个数,相当于.shape中n*m的值
.dtype ndarray对象元素的类型
.itemsize ndarray对象中每个元素的大小,以字节为单位

ndarray数组的创建和变换

  • 从python中的列表、元组等类型创建ndarray数组
x = np.array(list/tuple,dtype=np.float32)
  • 使用numpy中函数创建ndarray数组,如:arange,ones,zeros等
函数 说明
np.arange(n) 类似range()函数,返回ndarray类型,元素从0到n-1
np.ones(shape) 根据shape生成一个全1数组,shape是元组类型
np.zeros(shape) 根据shape生成一个全0数组,shape是元组类型
np.full(shape,val) 根据shape生成一个数组,每个元素都是val
np.eye(n) 创建一个正方的n*n单位矩阵,对角线为1,其余为0
np.ones_like(a) 根据数组a的形状生成一个全1数组
np.zeros_like(a) 根据数组a的形状生成一个全0数组
np.full_like(a,val) 根据数组a的形状生成一个数组,每个元素值都是val
np.linspace() 根据起止数据等间距地填充数据,形成数组
np.concatenate() 将两个或多个数组合并成一个新的数组
  • 从字节流(raw bytes)中创建ndarray数组
  • 从文件中读取特定格式,创建ndarray数组

ndarray数组的变换

# 维度变换和元素类型变换
a = np.ones((2,3,4),dtype=np.int32)
 # astype()方法会生成一个新的数组
new_a = a.astype(new_type) 
# ndarray数组向列表转换
ls = a.tolist()
方法 说明
.reshape(shape) 不改变数组元素,返回一个shape形状的数组,原数组不变
.resize(shape) 与.reshape()的功能一致,但是修改原数组
.swapaxes(ax1,ax2) 将数组n个维度中两个维度进行调换
.flatten() 对数组进行降维,返回折叠后的一维数组,原数组不变

ndarray数组的操作

数组的索引和切片
一维数组的索引和切片与列表类似

a = np.array([9,8,7,6,5])
a[2]
a[1:4:2]

多维数组的索引

a = np.arange(24).reshape((2,3,4))
a[1,2,3]
23

多维数组的切片

a[:,1,-3]  # 选取一个维度用 :
a[:,1:3,:]  # 每个维度的切片方法与一维数组相同
a[:,:,::2]  # 每个维度使用步长跳跃切片

ndarray数组的运算

数组与标量之间的运算作用与数组的每一个元素
numpy一元函数

函数 说明
np.abs(x) np.fabs(x) 计算数组各元素的绝对值
np.sqrt(x) 计算数组各元素的平方根
np.square(x) 计算数组各元素的平方
np.log(x) np.log10(x) np.log2(x) 计算数组各元素的自然对数、10为底对数、2为底对数
np.ceil(x) np.floor(x) 计算数组各元素的ceiling值或floor值
np.rint(x) 计算数组各元素的四舍五入值
np.modf(x) 将数组各元素的小数和整数部分以两个独立数组形式返回
np.cos(x) np.cosh(x)np.sin(x) np.sinh(x)np.tan(x) np.tanh(x) 计算数组各元素的三角函数
np.exp(x) 计算数组各元素的指数值
np.sign(x) 计算数组各元素的符号值,1(+),0,-1(-)

numpy二元函数

函数 说明
+ - * / ** 两个数组各元素进行对应运算
np.maximum(x,y) np.fmax()np.minimum(x,y) np.fmin() 元素级的最大值/最小值计算
元素级的最大值/最小值计算 元素级的模运算
np.copysign(x,y) 将数组y中各元素值的符号赋值给数组x对应元素
> < >= <= == != 算数比较,产生布尔型数组

数据的csv文件存取
cav文件 使用’’,"逗号分隔值

# 保存csv文件
np.savetxt(frame,array,fmt='%.18e',delimiter=None)

a = np.arange(100).reshape(5,20)
np.savetxt('a.csv',a,fmt='%d',delimiter=',')

# 读入csv文件
np.loadtxt(frame,dtype=np.float,delimiter=None,unpack=False)

b = np.loadtxt('a.csv',dtype = np.int,delimeter=',')

csv只能有效存储一维和二维数组
np.savetxt()和np.loadtxt() 只能有效存储一维和二维数组

多维数据的存取

a.tofile(frame,sep='',format='%s')

a = np.arange(100).reshape(5,10,2)
a.tofile('b.dat',sep=',',format='%d')

c = np.fromfile('b.dat',dtype=np.int,sep=',').reshape(5,10,2)

numpy的便捷文件存取

np.save(fname,array)
np.savez(fname,array)

np.load(fname)

numpy的随机数函数

函数 说明
rand(d0,d1,…dn) 根据d0-dn创建随机数数组,浮点数,[0,1),均匀分布
randn(d0,d1,…dn) 根据d0-dn创建随机数数组,标准正态分布
randint(low[,high,shape) 根据shape创建随机整数或整数数组,范围是[low,high)
seed(s) 随机数种子,s是给定的种子值
shuffle(a) 根据数组a的第一轴进行随机排列,改变数组x
permutation(a) 根据数组a的第一轴产生一个新的乱序数组,不改变数组x
choice(a[,size,replace,p) 从一维数组a中以概率p抽取元素,形成size形状新数组replace表示是否可以重用元素,默认为False
uniform(low,high,size) 产生具有均匀分布的数组,low起始值,high结束值,size形状
normal(loc,scale,size) 产生具有正态分布的数组,loc均值,scale标准差,size形状
poisson(lam,size) 产生具有泊松分布的数组,lam随机事件发生率,size形状
np.random的随机数函数
np.random.rand(3,4,5)
np.random.randn(3,4,5)
np.random.randint(100,200,(3,4))
np.random.seed(10)

numpy的统计函数

函数 说明
sum(a,axis=None) 根据给定轴axis计算数组a相关元素之和,axis为整数或元组
mean(a,axis=None) 根据给定轴axis计算数组a相关元素的期望,axis为整数或元组
average(a,axis=None,weights=None) 根据给定轴axis计算数组a相关元素的加权平均值
std(a,axis=None) 根据给定轴axis计算数组a相关元素的标准差
var(a,axis=None) var(a,axis=None)
min(a) max(a) 最小值、最大值
argmin(a) argmax(a) 最小值、最大值的降一维后的下标
unravel_index(index,shape) 根据shape将一维下标index转换成多维下标
ptp(a) 计算数组a中元素最大值和最小值的差
median(a) 计算数组a中元素的中位数(中值)
np.argmax(b)
0  # 扁平化后的下标
np.unravel_index(np.argmax(b),b.shape)
(0,0) # 重塑成多维下标

numpy的梯度函数

梯度:连续值之间的变化率,即斜率。

# 计算数组f中元素的梯度,当f为多维时,返回每个维度的梯度
np.gradient(f)  

你可能感兴趣的:(python数据分析,numpy,python,数据分析,数据维度,数组运算)