NumPy可以做什么?

NumPy数组生成

  1. 使用numpy.array将列表或元组转换为ndarray数组
    numpy.array(object, dtype=None, copy=True, order=None, subok=False, ndmin=0)
    
  2. 使用numpy.arange()方法创建。arange() 的功能是在给定区间内创建一系列均匀间隔的值
    numpy.arange(start, stop, step, dtype=None)
    
  3. 使用numpy.linspace()方法创建数值有规律的数组。linspace 用于在指定的区间内返回间隔均匀的值
    numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)
    
  4. 使用numpy.ones()方法创建数值全部为1的多维数组
    numpy.ones(shape, dtype=None, order='C')
    
  5. 使用numpy.zeros()方法创建数值全部为0的多维数组
    numpy.zeros(shape, dtype=None, order='C')
    
  6. 使用numpy.eye()方法创建二维数组,其特点是k 对角线上的值为 1,其余值全部为0
    numpy.eye(N, M=None, k=0, dtype=<type 'float'>)
    
  7. 从已知数据文件、函数中创建 ndarray。NumPy 提供了下面 5 个方法:
    • frombuffer(buffer):将缓冲区转换为 1 维数组。
    • fromfile(file,dtype,count,sep):从文本或二进制文件中构建多维数组。
    • fromfunction(function,shape):通过函数返回值来创建多维数组。
    • fromiter(iterable,dtype,count):从可迭代对象创建 1 维数组。
    • fromstring(string,dtype,count,sep):从字符串中创建 1 维数组。

ndarray数组属性

  1. ndarray.T 用于数组的转置,与 .transpose() 相同
  2. ndarray.dtype 用来输出数组包含元素的数据类型
  3. ndarray.imag 用来输出数组包含元素的虚部
  4. ndarray.real用来输出数组包含元素的实部
  5. ndarray.size用来输出数组中的总包含元素数
  6. ndarray.itemsize输出一个数组元素的字节数
  7. ndarray.nbytes用来输出数组的元素总字节数
  8. ndarray.ndim用来输出数组维度
  9. ndarray.shape用来输出数组形状
    10.ndarray.strides用来遍历数组时,输出每个维度中步进的字节数组

数组维度和形状

python 标准类针对数组的处理局限于 1 维,并仅提供少量的功能。而 NumPy 最核心且最重要的一个特性就是 ndarray 多维数组(n dimension array)对象,n可以从1维依次递增。它区别于 Python 的标准类,拥有对高维数组的处理能力,这也是数值计算过程中缺一不可的重要特性。

数组的基本操作

  1. 重设形状。reshape 可以在不改变数组数据的同时,改变数组的形状。其中,numpy.reshape() 等效于 ndarray.reshape()
    numpy.reshape(a, newshape)
    
    a 表示原数组,newshape 用于指定新的形状(整数或者元组)。
  2. 数组展开。ravel 的目的是将任意形状的数组扁平化,变为 1 维数组
    numpy.ravel(a, order='C')
    
    a 表示需要处理的数组。order 表示变换时的读取顺序,默认是按照行依次读取,当 order='F' 时,可以按列依次读取排序
  3. 轴移动。moveaxis 可以将数组的轴移动到新的位置
    numpy.moveaxis(a, source, destination)
    
    a:数组。
    source:要移动的轴的原始位置。
    destination:要移动的轴的目标位置。
  4. 轴交换。swapaxes 可以用来交换数组的轴
    numpy.swapaxes(a, axis1, axis2)
    
    a:数组。
    axis1:需要交换的轴 1 位置。
    axis2:需要与轴 1 交换位置的轴 1 位置。
  5. 数组转置。transpose 类似于矩阵的转置,它可以将 2 维数组的横轴和纵轴交换
    numpy.transpose(a, axes=None)
    
    a:数组。
    axis:该值默认为 none,表示转置。如果有值,那么则按照值替换轴。
  6. 维度改变。 atleast_xd 支持将输入数据直接视为 x维。这里的 x 可以表示:1,2,3
    numpy.atleast_1d()
    numpy.atleast_2d()
    numpy.atleast_3d()
    
  7. 类型转换。在 NumPy 中,还有一系列以 as 开头的方法,它们可以将特定输入转换为数组,亦可将数组转换为矩阵、标量,ndarray 等。如下:
    asarray(a,dtype,order):将特定输入转换为数组。
    asanyarray(a,dtype,order):将特定输入转换为 ndarray
    asmatrix(data,dtype):将特定输入转换为矩阵。
    asfarray(a,dtype):将特定输入转换为 float 类型的数组。
    asarray_chkfinite(a,dtype,order):将特定输入转换为数组,检查 NaNinfs
    asscalar(a):将大小为 1 的数组转换为标量。
  8. 数组连接。concatenate 可以将多个数组沿指定轴连接在一起。
    numpy.concatenate((a1, a2, ...), axis=0)
    
    (a1, a2, ...):需要连接的数组。
    axis:指定连接轴。
  9. 数组堆叠。在NumPy中,以下方法可以用于数组的堆叠:stack(arrays,axis):沿着新轴连接数组的序列。
    column_stack():将 1 维数组作为列堆叠到 2 维数组中。
    hstack():按水平方向堆叠数组。
    vstack():按垂直方向堆叠数组。
    dstack():按深度方向堆叠数组。
  10. 拆分。split 及与之相似的一系列方法主要是用于数组的拆分,列举如下:
    split(ary,indices_or_sections,axis):将数组拆分为多个子数组。
    dsplit(ary,indices_or_sections):按深度方向将数组拆分成多个子数组。
    hsplit(ary,indices_or_sections):按水平方向将数组拆分成多个子数组。
    vsplit(ary,indices_or_sections):按垂直方向将数组拆分成多个子数组。
  11. 删除。delete(arr,obj,axis):沿特定轴删除数组中的子数组
    axis 0代表行,1代表列
    np.delete(a, 2, 0)代表沿着纵轴,将第 3 行(索引2)删除
    np.delete(a, 2, 1)代表沿着横轴,将第 3 列(索引 2)删除=
  12. 数组插入。insert(arr,obj,values,axis):依据索引在特定轴之前插入值。用法和 delete 很相似,只是需要在第三个参数位置设置需要插入的数组对象
    np.insert(a, 2, b, 0)将b沿着纵轴,插入在a的第3行(索引2)
  13. 附加。append 其实相当于只能在末尾插入的 insert,所以少了一个指定索引的参数。注意 append方法返回值,默认是展平状态下的 1 维数组
    append(arr,values,axis):将值附加到数组的末尾,并返回 1 维数组。
  14. 重设尺寸。 resize(a,new_shape):对数组尺寸进行重新设定。resizereshape是有区别的,区别在于对原数组的影响。reshape 在改变形状时,不会影响原数组,相当于对原数组做了一份拷贝。而 resize 则是对原数组执行操作。
  15. 翻转数组。
    fliplr(m):左右翻转数组。
    flipud(m):上下翻转数组。
  16. NumPy随机数。NumPy 的随机数功能非常强大,主要由 numpy.random 模块完成。
    numpy.random.rand(d0, d1, ..., dn) 方法的作用为:指定一个数组,并使用 [0, 1) 区间随机数据填充,这些数据均匀分布。
    numpy.random.randn(d0, d1, ..., dn)numpy.random.rand(d0, d1, ..., dn) 的区别在于,前者是从标准正态分布中返回一个或多个样本值。
    randint(low, high, size, dtype) 方法将会生成 [low, high) 的随机整数。注意这是一个半开半闭区间。
    random_sample(size) 方法将会在 [0, 1) 区间内生成指定 size 的随机浮点数。类似的方法还有:
    numpy.random.random([size])
    numpy.random.ranf([size])
    numpy.random.sample([size])
    他们4个的效果差不多。
    choice(a, size, replace, p) 方法将会给定的数组里随机抽取几个值,该方法类似于随机抽样。例如np.random.choice(2, 5)表示在np.arange(2)中随机抽取5个数
  17. 除了上面介绍的 6 种随机数生成方法,NumPy 还提供了大量的满足特定概率密度分布的样本生成方法。它们的使用方法和上面非常相似,这里就不再一一介绍了。列举如下:
  • numpy.random.beta(a,b,size):从 Beta 分布中生成随机数。
  • numpy.random.binomial(n, p, size):从二项分布中生成随机数。
  • numpy.random.chisquare(df,size):从卡方分布中生成随机数。
  • numpy.random.dirichlet(alpha,size):从 Dirichlet 分布中生成随机数。
  • numpy.random.exponential(scale,size):从指数分布中生成随机数。
  • numpy.random.f(dfnum,dfden,size):从 F 分布中生成随机数。
  • numpy.random.gamma(shape,scale,size):从 Gamma 分布中生成随机数。
  • numpy.random.geometric(p,size):从几何分布中生成随机数。
  • numpy.random.gumbel(loc,scale,size):从 Gumbel 分布中生成随机数。
  • numpy.random.hypergeometric(ngood, nbad, nsample, size):从超几何分布中生成随机数。
  • numpy.random.laplace(loc,scale,size):从拉普拉斯双指数分布中生成随机数。
  • numpy.random.logistic(loc,scale,size):从逻辑分布中生成随机数。
  • numpy.random.lognormal(mean,sigma,size):从对数正态分布中生成随机数。
  • numpy.random.logseries(p,size):从对数系列分布中生成随机数。
  • numpy.random.multinomial(n,pvals,size):从多项分布中生成随机数。
  • numpy.random.multivariate_normal(mean, cov, size):从多变量正态分布绘制随机样本。
  • numpy.random.negative_binomial(n, p, size):从负二项分布中生成随机数。
  • numpy.random.noncentral_chisquare(df,nonc,size):从非中心卡方分布中生成随机数。
  • numpy.random.noncentral_f(dfnum, dfden, nonc, size):从非中心 F 分布中抽取样本。
  • numpy.random.normal(loc,scale,size):从正态分布绘制随机样本。
  • numpy.random.pareto(a,size):从具有指定形状的 Pareto II 或 Lomax 分布中生成随机数。
  • numpy.random.poisson(lam,size):从泊松分布中生成随机数。
  • numpy.random.power(a,size):从具有正指数 a-1 的功率分布中在 0,1 中生成随机数。
  • numpy.random.rayleigh(scale,size):从瑞利分布中生成随机数。
  • numpy.random.standard_cauchy(size):从标准 Cauchy 分布中生成随机数。
  • numpy.random.standard_exponential(size):从标准指数分布中生成随机数。
  • numpy.random.standard_gamma(shape,size):从标准 Gamma 分布中生成随机数。
  • numpy.random.standard_normal(size):从标准正态分布中生成随机数。
  • numpy.random.standard_t(df,size):从具有 df 自由度的标准学生 t 分布中生成随机数。
  • numpy.random.triangular(left,mode,right,size):从三角分布中生成随机数。
  • numpy.random.uniform(low,high,size):从均匀分布中生成随机数。
  • numpy.random.vonmises(mu,kappa,size):从 von Mises 分布中生成随机数。
  • numpy.random.wald(mean,scale,size):从 Wald 或反高斯分布中生成随机数。
  • numpy.random.weibull(a,size):从威布尔分布中生成随机数。
  • numpy.random.zipf(a,size):从 Zipf 分布中生成随机数。

数学函数

Python 自带的运算符可以完成数学中的加减乘除,以及取余、取整,幂次计算等。导入自带的 math 模块之后,里面又包含绝对值、阶乘、开平方等一些常用的数学函数。不过,这些函数仍然相对基础。要完成更加复杂一些的数学计算,就会显得捉襟见肘了。NumPy 为我们提供了更多的数学函数,以帮助我们更好地完成一些数值计算。

三角函数

  • numpy.sin(x):三角正弦。
  • numpy.cos(x):三角余弦。
  • numpy.tan(x):三角正切。
  • numpy.arcsin(x):三角反正弦。
  • numpy.arccos(x):三角反余弦。
  • numpy.arctan(x):三角反正切。
  • numpy.hypot(x1,x2):直角三角形求斜边。
  • numpy.degrees(x):弧度转换为度。
  • numpy.radians(x):度转换为弧度。
  • numpy.deg2rad(x):度转换为弧度。
  • numpy.rad2deg(x):弧度转换为度。

双曲函数

双曲函数是一类与常见的三角函数类似的函数。双曲函数经常出现于某些重要的线性微分方程的解中,使用 NumPy 计算它们的方法为:

  • numpy.sinh(x):双曲正弦。
  • numpy.cosh(x):双曲余弦。
  • numpy.tanh(x):双曲正切。
  • numpy.arcsinh(x):反双曲正弦。
  • numpy.arccosh(x):反双曲余弦。
  • numpy.arctanh(x):反双曲正切。

数值修约

数值修约, 又称数字修约, 是指在进行具体的数字运算前, 按照一定的规则确定一致的位数, 然后舍去某些数字后面多余的尾数的过程。比如, 我们常听到的「4 舍 5 入」就属于数值修约中的一种。

  • numpy.around(a):平均到给定的小数位数。
  • numpy.round_(a):将数组舍入到给定的小数位数。
  • numpy.rint(x):修约到最接近的整数。
  • numpy.fix(x, y):向 0 舍入到最接近的整数。
  • numpy.floor(x):返回输入的底部(标量 x 的底部是最大的整数 i)。
  • numpy.ceil(x):返回输入的上限(标量 x 的底部是最小的整数 i).
  • numpy.trunc(x):返回输入的截断值。

求和、求积、差分

  • numpy.prod(a, axis, dtype, keepdims):返回指定轴上的数组元素的乘积。
  • numpy.sum(a, axis, dtype, keepdims):返回指定轴上的数组元素的总和。
  • numpy.nanprod(a, axis, dtype, keepdims):返回指定轴上的数组元素的乘积, 将 NaN 视作 1。
  • numpy.nansum(a, axis, dtype, keepdims):返回指定轴上的数组元素的总和, 将 NaN 视作 0。
  • numpy.cumprod(a, axis, dtype):返回沿给定轴的元素的累积乘积。
  • numpy.cumsum(a, axis, dtype):返回沿给定轴的元素的累积总和。
  • numpy.nancumprod(a, axis, dtype):返回沿给定轴的元素的累积乘积, 将 NaN 视作 1。
  • numpy.nancumsum(a, axis, dtype):返回沿给定轴的元素的累积总和, 将 NaN 视作 0。
  • numpy.diff(a, n, axis):计算沿指定轴的第 n 个离散差分。
  • numpy.ediff1d(ary, to_end, to_begin):数组的连续元素之间的差异。
  • numpy.gradient(f):返回 N 维数组的梯度。
  • numpy.cross(a, b, axisa, axisb, axisc, axis):返回两个(数组)向量的叉积。
  • numpy.trapz(y, x, dx, axis):使用复合梯形规则沿给定轴积分。

指数和对数

  • numpy.exp(x):计算输入数组中所有元素的指数。
  • numpy.log(x):计算自然对数。
  • numpy.log10(x):计算常用对数。
  • numpy.log2(x):计算二进制对数。

算术运算

当然,NumPy 也提供了一些用于算术运算的方法,使用起来会比 Python 提供的运算符灵活一些,主要是可以直接针对数组。

  • numpy.add(x1, x2):对应元素相加。
  • numpy.reciprocal(x):求倒数 1/x。
  • numpy.negative(x):求对应负数。
  • numpy.multiply(x1, x2):求解乘法。
  • numpy.divide(x1, x2):相除 x1/x2。
  • numpy.power(x1, x2):类似于 x1^x2。
  • numpy.subtract(x1, x2):减法。
  • numpy.fmod(x1, x2):返回除法的元素余项。
  • numpy.mod(x1, x2):返回余项。
  • numpy.modf(x1):返回数组的小数和整数部分。
  • numpy.remainder(x1, x2):返回除法余数。

矩阵和向量积

  • numpy.dot(a, b):求解两个数组的点积。
  • numpy.vdot(a, b):求解两个向量的点积。
  • numpy.inner(a, b):求解两个数组的内积。
  • numpy.outer(a, b):求解两个向量的外积。
  • numpy.matmul(a, b):求解两个数组的矩阵乘积。
  • numpy.tensordot(a, b):求解张量点积。
  • numpy.kron(a, b):计算 Kronecker 乘积。

代数运算

涉及到矩阵的计算方法,求解特征值、特征向量、逆矩阵等,非常方便。

  • numpy.linalg.cholesky(a):Cholesky 分解。
  • numpy.linalg.qr(a ,mode):计算矩阵的 QR 因式分解。
  • numpy.linalg.svd(a ,full_matrices,compute_uv):奇异值分解。
  • numpy.linalg.eig(a):计算正方形数组的特征值和右特征向量。
  • numpy.linalg.eigh(a, UPLO):返回 Hermitian 或对称矩阵的特征值和特征向量。
  • numpy.linalg.eigvals(a):计算矩阵的特征值。
  • numpy.linalg.eigvalsh(a, UPLO):计算 Hermitian 或真实对称矩阵的特征值。
  • numpy.linalg.norm(x ,ord,axis,keepdims):计算矩阵或向量范数。
  • numpy.linalg.cond(x ,p):计算矩阵的条件数。
  • numpy.linalg.det(a):计算数组的行列式。
  • numpy.linalg.matrix_rank(M ,tol):使用奇异值分解方法返回秩。
  • numpy.linalg.slogdet(a):计算数组的行列式的符号和自然对数。
  • numpy.trace(a ,offset,axis1,axis2,dtype,out):沿数组的对角线返回总和。
  • numpy.linalg.solve(a, b):求解线性矩阵方程或线性标量方程组。
  • numpy.linalg.tensorsolve(a, b ,axes):为 x 解出张量方程 a x = b
  • numpy.linalg.lstsq(a, b ,rcond):将最小二乘解返回到线性矩阵方程。
  • numpy.linalg.inv(a):计算逆矩阵。
  • numpy.linalg.pinv(a ,rcond):计算矩阵的(Moore-Penrose)伪逆。
  • numpy.linalg.tensorinv(a ,ind):计算 N 维数组的逆。

其他运算

  • numpy.angle(z, deg):返回复参数的角度。
  • numpy.real(val):返回数组元素的实部。
  • numpy.imag(val):返回数组元素的虚部。
  • numpy.conj(x):按元素方式返回共轭复数。
  • numpy.convolve(a, v, mode):返回线性卷积。
  • numpy.sqrt(x):平方根。
  • numpy.cbrt(x):立方根。
  • numpy.square(x):平方。
  • numpy.absolute(x):绝对值, 可求解复数。
  • numpy.fabs(x):绝对值。
  • numpy.sign(x):符号函数。
  • numpy.maximum(x1, x2):最大值。
  • numpy.minimum(x1, x2):最小值。
  • numpy.nan_to_num(x):用 0 替换 NaN。
  • numpy.interp(x, xp, fp, left, right, period):线性插值。

你可能感兴趣的:(Python3,numpy,python,数据分析)