Numpy基础知识

#markdown常用使用
markdown常用使用

1.序列

引用

加粗

-无序列表


#Dtype
import numpy as np

a = np.array([1.1,2.2],dtype=np.float64)

a.astype(int).dtype 不同类型之间转换

#对象

-列表

-元组

-字典

##ndarray 多维数组对象

1.shepe 数组形状

2.dtype:数据类型

3.buffer 对象暴露缓冲区接口

4.offset 数据偏移量

5.strides 步长

6.order:{“C”,“F”} 行或列为主排列顺序

##创建数组
###arange
np.arange(start, stop, step, dtype=None)

np.arange(3) 默认起点0,步长为1 输出:[0 1 2]

np.arange(3,9) 默认步长为1 输出[3 4 5 6 7 8]左闭右开

numpy.ones(shape, dtype=None, order='C')
shape:用于指定数组形状,例如(1, 2)或 3。
dtype:数据类型。
order:{'C','F'},按行或列方式储存数组。
np.ones(3):
array([1., 1., 1.])

np.ones((3,5)):
array([[1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1.]])

np.zeros(3)
array([0., 0., 0.])

np.zeros((3,5))
array([[0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.]])

np.random.rand() #无参数,那么随机返回0-1之间一个小数
0.9842243049200786

np.random.rand(3,4) #带参数,那么随机返回0-1之间矩阵
array([[0.2616987 , 0.34785532, 0.64052877, 0.8283843 ],
       [0.6696717 , 0.36372492, 0.53100318, 0.69890008],
       [0.31332759, 0.98002585, 0.73734262, 0.39738664]])

numpy.eye(N, M=None, k=0, dtype=)
N:输出数组的行数。
M:输出数组的列数。
k:对角线索引:0(默认)是指主对角线,正值是指上对角线,负值是指下对角线。


###linspace

np.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)

1.start:序列的起始值

2.stop:序列的结束值。

3.num:生成的样本数。默认值为50。

4.endpoint:布尔值,如果为真,则最后一个样本包含在序列内。

5.retstep:布尔值,如果为真,返回间距。

6.dtype:数组的类型。

np.linspace(0,10,10,endpoint=True)
array([ 0.        ,  1.11111111,  2.22222222,  3.33333333,  4.44444444,
        5.55555556,  6.66666667,  7.77777778,  8.88888889, 10.        ])

np.linspace(0,10,10,False)
array([0., 1., 2., 3., 4., 5., 6., 7., 8., 9.])

###从已知数据创建
frombuffer(buffer):将缓冲区转换为 1 维数组。
fromfile(file,dtype,count,sep):从文本或二进制文件中构建多维数组。
fromfunction(function,shape):通过函数返回值来创建多维数组。
fromiter(iterable,dtype,count):从可迭代对象创建 1 维数组。
fromstring(string,dtype,count,sep):从字符串中创建 1 维数组。

np.fromfunction(lambda a,b:a+b,(5,2))
array([[0., 1.],
       [1., 2.],
       [2., 3.],
       [3., 4.],
       [4., 5.]])

##数组属性

1.转置
a.T或者a.transpose()都可以

2.数据类型
a.dtype

3.输出虚部
a.imag

3.输出虚部
a.imag

4.输出实部
a.real

5.元素总数
a.size

6.数组元素的字节数
a.itemsize

7.数组总字节数
a.nbytes

8.数组维度
a.ndim

9.数组形状
a.shape

10.用来遍历数组时,输出每个维度中步进的字节数组
a.strides

##数组操作

1.reshape: numpy.reshape(a, newshape)

np.arrange(10).reshape((5,2))
array([[0, 1],
       [2, 3],
       [4, 5],
       [6, 7],
       [8, 9]])
  1. ravel:numpy.ravel(a, order=‘C’),任意形状的数组变为 1 维数,不改变数组本身
np.ravel(a),默认按照行合并,order='F' 时,可以按列依次读取排序
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
np.ravel(a,order = "F")

3.轴移动

numpy.moveaxis(a, source, destination)

a:数组。
source:要移动的轴的原始位置。
destination:要移动的轴的目标位置

4.轴交换

numpy.swapaxes(a, axis1, axis2)

a:数组。
axis1:需要交换的轴 1 位置。
axis2:需要与轴 1 交换位置的轴 1 位置。

5.转置

numpy.transpose(a, axes=None)

6.维度改变

atleast_xd 支持将输入数据直接视为 x维。这里的 x 可以表示:1,2,3

numpy.atleast_1d()
numpy.atleast_2d()
numpy.atleast_3d()
[1 2 3]
[[4 5 6]]
[[[7]
  [8]
  [9]]]

7.类型转换:一系列以 as 开头的方法,它们可以将特定输入转换为数组,亦可将数组转换为矩阵、标量,ndarray

asarray(a,dtype,order):将特定输入转换为数组。

asanyarray(a,dtype,order):将特定输入转换为 ndarray。

asmatrix(data,dtype):将特定输入转换为矩阵。

asfarray(a,dtype):将特定输入转换为 float 类型的数组。

asarray_chkfinite(a,dtype,order):将特定输入转换为数组,检查 NaN 或 infs。

asscalar(a):将大小为 1 的数组转换为标量。

8.数组连接:all the input arrays must have same number of dimensions

numpy.concatenate((a1, a2, …), axis=0)

9.数组堆叠

NumPy 中,以下方法可用于数组的堆叠:

stack(arrays,axis):沿着新轴连接数组的序列。

column_stack():将 1 维数组作为列堆叠到 2 维数组中。

hstack():按水平方向堆叠数组。

vstack():按垂直方向堆叠数组。

dstack():按深度方向堆叠数组

a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
np.stack((a, b))

10.数组拆分

split 及与之相似的一系列方法主要是用于数组的拆分,列举如下:

split(ary,indices_or_sections,axis):将数组拆分为多个子数组。
dsplit(ary,indices_or_sections):按深度方向将数组拆分成多个子数组。
hsplit(ary,indices_or_sections):按水平方向将数组拆分成多个子数组。
vsplit(ary,indices_or_sections):按垂直方向将数组拆分成多个子数组。

a = np.arange(10)
a.np.split(a,5)

11.数组删除

delete(arr,obj,axis):沿特定轴删除数组中的子数组。

rray:需要处理的矩阵

obj:需要处理的位置,比如要删除的第一行或者第一行和第二行

axis:如果输入为None:array会先按行展开,然后按照obj,删除第obj-1(从0开始)位置的数,返回一个行矩阵。

如果输入为0:按行删除

如果输入为1:按列删除

a=array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])
np.delete(a,2,1) 删除第三列(索引号为2)
array([[ 0,  1,  3],
       [ 4,  5,  7],
       [ 8,  9, 11]])

12.数组插入
insert(arr,obj,values,axis):依据索引在特定轴之前插入值。

a = np.arange(12).reshape(3,4)
b = np.arange(4)
np.insert(a,2,b,0)

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 0,  1,  2,  3],
       [ 8,  9, 10, 11]])

13.附加

append(arr,values,axis):将值附加到数组的末尾,并返回 1 维数组,注意 append方法返回值,默认是展平状态下的 1 维数组

14.重设 尺寸

a= np.arange(10)
a.resize(2,5)

它们是有区别的,区别在于对原数组的影响。reshape 在改变形状时,不会影响原数组,相当于对原数组做了一份拷贝。而 resize 则是对原数组执行操作。

15.翻转数组

fliplr(m):左右翻转数组。

flipud(m):上下翻转数组。

a = np.arange(16).reshape(4, 4)
print(a)
print(np.fliplr(a))
print(np.flipud(a))

[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]
 [12 13 14 15]]
[[ 3  2  1  0]
 [ 7  6  5  4]
 [11 10  9  8]
 [15 14 13 12]]
[[12 13 14 15]
 [ 8  9 10 11]
 [ 4  5  6  7]
 [ 0  1  2  3]]

16.随机数

numpy.random.rand(d0, d1, …, dn) 方法的作用为:指定一个数组,并使用 [0, 1) 区间随机数据填充,这些数据均匀分布
numpy.random.randn(d0, d1, …, dn)从标准正态分布中返回一个或多个样本值

np.random.rand(2,5)
array([[0.34157782, 0.31413924, 0.84930507, 0.00266919, 0.07818762],
       [0.42474559, 0.76332032, 0.11988594, 0.25322415, 0.59028722]])

randint(low, high, size, dtype) 方法将会生成 [low, high) 的随机整数。注意这是一个半开半闭区间

random_sample(size) 方法将会在 [0, 1) 区间内生成指定 size 的随机浮点数

choice(a, size, replace, p) 方法将会给定的数组里随机抽取几个值,该方法类似于随机抽样,放回收取

概率密度分布

numpy.random.beta(a,b,size):从 Beta 分布中生成随机数。

numpy.random.binomial(n, p, size):从二项分布中生成随机数。

numpy.random.chisquare(df,size):从卡方分布中生成随机数。

numpy.random.dirichlet(alpha,size):从 Dirichlet 分布中生成随机数。

numpy.random.exponential(scale,size):从指数分布中生成随机数。

numpy.random.f(dfnum,dfden,size):从 F 分布中生成随机数。

numpy.random.gamma(shape,scale,size):从 Gamma 分布中生成随机数。

numpy.random.geometric(p,size):从几何分布中生成随机数。

numpy.random.gumbel(loc,scale,size):从 Gumbel 分布中生成随机数。

numpy.random.hypergeometric(ngood, nbad, nsample, size):从超几何分布中生成随机数。

numpy.random.laplace(loc,scale,size):从拉普拉斯双指数分布中生成随机数。

numpy.random.logistic(loc,scale,size):从逻辑分布中生成随机数。

numpy.random.lognormal(mean,sigma,size):从对数正态分布中生成随机数。

numpy.random.logseries(p,size):从对数系列分布中生成随机数。

numpy.random.multinomial(n,pvals,size):从多项分布中生成随机数。

numpy.random.multivariate_normal(mean, cov, size):从多变量正态分布绘制随机样本。

numpy.random.negative_binomial(n, p, size):从负二项分布中生成随机数。

numpy.random.noncentral_chisquare(df,nonc,size):从非中心卡方分布中生成随机数。
numpy.random.noncentral_f(dfnum, dfden, nonc, size):从非中心 F 分布中抽取样本。
numpy.random.normal(loc,scale,size):从正态分布绘制随机样本。

numpy.random.pareto(a,size):从具有指定形状的 Pareto II 或 Lomax 分布中生成随机数。

numpy.random.poisson(lam,size):从泊松分布中生成随机数。

numpy.random.power(a,size):从具有正指数 a-1 的功率分布中在 0,1 中生成随机数。

numpy.random.rayleigh(scale,size):从瑞利分布中生成随机数。

numpy.random.standard_cauchy(size):从标准 Cauchy 分布中生成随机数。

numpy.random.standard_exponential(size):从标准指数分布中生成随机数。

numpy.random.standard_gamma(shape,size):从标准 Gamma 分布中生成随机数。

numpy.random.standard_normal(size):从标准正态分布中生成随机数。

numpy.random.standard_t(df,size):从具有 df 自由度的标准学生 t 分布中生成随机数。

numpy.random.triangular(left,mode,right,size):从三角分布中生成随机数。

numpy.random.uniform(low,high,size):从均匀分布中生成随机数。

numpy.random.vonmises(mu,kappa,size):从 von Mises 分布中生成随机数。

numpy.random.wald(mean,scale,size):从 Wald 或反高斯分布中生成随机数。

numpy.random.weibull(a,size):从威布尔分布中生成随机数。

numpy.random.zipf(a,size):从 Zipf 分布中生成随机数。

##数学函数

numpy.sin(x):三角正弦。

numpy.cos(x):三角余弦。

numpy.tan(x):三角正切。

numpy.arcsin(x):三角反正弦。

numpy.arccos(x):三角反余弦。

numpy.arctan(x):三角反正切。

numpy.hypot(x1,x2):直角三角形求斜边。

numpy.degrees(x):弧度转换为度。

numpy.radians(x):度转换为弧度。

numpy.deg2rad(x):度转换为弧度。

numpy.rad2deg(x):弧度转换为度。

numpy.sinh(x):双曲正弦。

numpy.cosh(x):双曲余弦。

numpy.tanh(x):双曲正切。

numpy.arcsinh(x):反双曲正弦。

numpy.arccosh(x):反双曲余弦。

numpy.arctanh(x):反双曲正切。

numpy.around(a):平均到给定的小数位数。

numpy.round_(a):将数组舍入到给定的小数位数。四舍五入

numpy.rint(x):修约到最接近的整数。

numpy.fix(x, y):向 0 舍入到最接近的整数。

numpy.floor(x):返回输入的底部(标量 x 的底部是最大的整数 i)。

numpy.ceil(x):返回输入的上限(标量 x 的底部是最小的整数 i).

numpy.trunc(x):返回输入的截断值。

求和、求积、差分

numpy.prod(a, axis, dtype, keepdims):返回指定轴上的数组元素的乘积。

numpy.sum(a, axis, dtype, keepdims):返回指定轴上的数组元素的总和。

numpy.nanprod(a, axis, dtype, keepdims):返回指定轴上的数组元素的乘积, 将 NaN 视作 1。

numpy.nansum(a, axis, dtype, keepdims):返回指定轴上的数组元素的总和, 将 NaN 视作 0。

numpy.cumprod(a, axis, dtype):返回沿给定轴的元素的累积乘积。

numpy.cumsum(a, axis, dtype):返回沿给定轴的元素的累积总和。

numpy.nancumprod(a, axis, dtype):返回沿给定轴的元素的累积乘积, 将 NaN 视作 1。

numpy.nancumsum(a, axis, dtype):返回沿给定轴的元素的累积总和, 将 NaN 视作 0。

numpy.diff(a, n, axis):计算沿指定轴的第 n 个离散差分。

numpy.ediff1d(ary, to_end, to_begin):数组的连续元素之间的差异。

numpy.gradient(f):返回 N 维数组的梯度。

numpy.cross(a, b, axisa, axisb, axisc, axis):返回两个(数组)向量的叉积。

numpy.trapz(y, x, dx, axis):使用复合梯形规则沿给定轴积分。

指数和对数

numpy.exp(x):计算输入数组中所有元素的指数。

numpy.log(x):计算自然对数。

numpy.log10(x):计算常用对数。

numpy.log2(x):计算二进制对数

算术运算

numpy.add(x1, x2):对应元素相加。

numpy.reciprocal(x):求倒数 1/x。

numpy.negative(x):求对应负数。

numpy.multiply(x1, x2):求解乘法。

numpy.divide(x1, x2):相除 x1/x2。

numpy.power(x1, x2):类似于 x1^x2。

numpy.subtract(x1, x2):减法。

numpy.fmod(x1, x2):返回除法的元素余项。

numpy.mod(x1, x2):返回余项。

numpy.modf(x1):返回数组的小数和整数部分。

numpy.remainder(x1, x2):返回除法余数

矩阵和向量积

numpy.dot(a, b):求解两个数组的点积。

numpy.vdot(a, b):求解两个向量的点积。

numpy.inner(a, b):求解两个数组的内积。

numpy.outer(a, b):求解两个向量的外积。

numpy.matmul(a, b):求解两个数组的矩阵乘积。

numpy.tensordot(a, b):求解张量点积。

numpy.kron(a, b):计算 Kronecker 乘积。

numpy.angle(z, deg):返回复参数的角度。

numpy.real(val):返回数组元素的实部。

numpy.imag(val):返回数组元素的虚部。

numpy.conj(x):按元素方式返回共轭复数。

numpy.convolve(a, v, mode):返回线性卷积。

numpy.sqrt(x):平方根。

numpy.cbrt(x):立方根。

numpy.square(x):平方。

numpy.absolute(x):绝对值, 可求解复数。

numpy.fabs(x):绝对值。

numpy.sign(x):符号函数。

numpy.maximum(x1, x2):最大值。

numpy.minimum(x1, x2):最小值。

numpy.nan_to_num(x):用 0 替换 NaN。

numpy.interp(x, xp, fp, left, right, period):线性插值.

代数运算

numpy.linalg.cholesky(a):Cholesky 分解。

numpy.linalg.qr(a ,mode):计算矩阵的 QR 因式分解。

numpy.linalg.svd(a ,full_matrices,compute_uv):奇异值分解。

numpy.linalg.eig(a):计算正方形数组的特征值和右特征向量。

numpy.linalg.eigh(a, UPLO):返回 Hermitian 或对称矩阵的特征值和特征向量。

numpy.linalg.eigvals(a):计算矩阵的特征值。

numpy.linalg.eigvalsh(a, UPLO):计算 Hermitian 或真实对称矩阵的特征值。

numpy.linalg.norm(x ,ord,axis,keepdims):计算矩阵或向量范数。

numpy.linalg.cond(x ,p):计算矩阵的条件数。

numpy.linalg.det(a):计算数组的行列式。

numpy.linalg.matrix_rank(M ,tol):使用奇异值分解方法返回秩。

numpy.linalg.slogdet(a):计算数组的行列式的符号和自然对数。

numpy.trace(a ,offset,axis1,axis2,dtype,out):沿数组的对角线返回总和。

numpy.linalg.solve(a, b):求解线性矩阵方程或线性标量方程组。

numpy.linalg.tensorsolve(a, b ,axes):为 x 解出张量方程 a x = b

numpy.linalg.lstsq(a, b ,rcond):将最小二乘解返回到线性矩阵方程。

numpy.linalg.inv(a):计算逆矩阵。

numpy.linalg.pinv(a ,rcond):计算矩阵的(Moore-Penrose)伪逆。

numpy.linalg.tensorinv(a ,ind):计算 N 维数组的逆。

##数组索引和切片

1.a[1] 获取索引值为1的数据

2.a[[1,2,3]]获取索引值为1,2,3的数据

3.a[1,2] 获取第 2 行,第 3 列的数据

索引二维 Ndarray 中的多个元素值,使用逗号分割

a = np.arange(20).reshape(4,5)

a[[1,2],[3,4]]

这里需要注意索引的对应关系。我们实际获取的是 [1, 3],也就是第 2 行和第 4 列对于的值 。以及 [2, 4],也就是第 3 行和第 5 列对应的值 。

索引三维 Ndarray 中的多个元素值,使用逗号分割

np.arange(30).reshape(2,5,3)
array([[[ 0,  1,  2],
        [ 3,  4,  5],
        [ 6,  7,  8],
        [ 9, 10, 11],
        [12, 13, 14]],

       [[15, 16, 17],
        [18, 19, 20],
        [21, 22, 23],
        [24, 25, 26],
        [27, 28, 29]]])

a[[0, 1], [1, 2], [1, 2]]
array([ 4, 23])

数组切片

Ndarray[start:stop:step],左闭右开

对于多维数组,我们只需要用逗号 , 分割不同维度即可:

a= np.arange(20).reshape(4,5)
a[[0,3],[2,4]] 取第 3,4 列(第一个维度),再取第 1,2,3 行(第二个维度)
array([[ 2,  3],
       [ 7,  8],
       [12, 13]])

排序、搜索、计数

1.排序

numpy.sort(a, axis=-1, kind=‘quicksort’, order=None)

a:数组。

axis:要排序的轴。如果为None,则在排序之前将数组铺平。默认值为 -1,沿最后一个轴排序。

kind:{‘quicksort’,‘mergesort’,‘heapsort’},排序算法。默认值为 quicksort。

numpy.lexsort(keys ,axis):使用多个键进行间接排序。

numpy.argsort(a ,axis,kind,order):沿给定轴执行间接排序。

numpy.msort(a):沿第 1 个轴排序。

numpy.sort_complex(a):针对复数排序。

argmax(a ,axis,out):返回数组中指定轴的最大值的索引。

nanargmax(a ,axis):返回数组中指定轴的最大值的索引,忽略 NaN。

argmin(a ,axis,out):返回数组中指定轴的最小值的索引。

nanargmin(a ,axis):返回数组中指定轴的最小值的索引,忽略 NaN。

argwhere(a):返回数组中非 0 元素的索引,按元素分组。

nonzero(a):返回数组中非 0 元素的索引。

flatnonzero(a):返回数组中非 0 元素的索引,并铺平。

where(条件,x,y):根据指定条件,从指定行、列返回元素。

searchsorted(a,v ,side,sorter):查找要插入元素以维持顺序的索引。

extract(condition,arr):返回满足某些条件的数组的元素。

count_nonzero(a):计算数组中非 0 元素的数量。

你可能感兴趣的:(python,numpy)