大家好!我是初心,本期给大家带来的是【数据分析 - 基础入门之NumPy④】NumPy基本操作(广泛)。
作者的【 Python 数据分析】专栏正在火热更新中,如果本文对您有帮助,欢迎大家点赞 + 评论 + 收藏 !
每日金句分享:选择你所喜欢的,爱你所选择的。』—— 托尔斯泰「托尔斯泰。
NumPy(
Numerical Python
) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。
NumPy主要用于数组计算,包含 |
---|
一个强大的N维数组对象 ndarray |
广播功能函数 |
整合 C/C++/Fortran 代码的工具 |
线性代数、傅里叶变换、随机数生成等功能 |
导入 NumPy 库是我们的第一步准备工作。在此,还一并导入了以后会用到的 Pandas 库、 MatplotLib 库的 pyplot 模块。
# 导入数据分析 ‘三剑客’
import numpy as np
import pandas as pd
from matplotlib import pyplot as plt
# 注意左右都是双下划线 ~ ~
np.__version__
通过 pyplot 读取到的图片,返回的就是一个 NumPy 数组。
这是我事先准备好的一张图片 —— tangsan.jpg:
接下来通过 plt 对象读取:
n = plt.imread('pic\\tangsan.jpg')
n
输出过多,这里只展示首尾:
n.shape
再次显示图片:
plt.imshow(n)
array 函数用法:numpy.array(object, dtype=None),object 可以为单个值、元组、列表、多维可迭代对象等可迭代对象,作用是创建数组。
list_one = [1,2,3,4]
# 列表创建
n1 = np.array(list_one)
tuple_one = (1,3,2)
# 元组创建
n2 = np.array(tuple_one,dtype=np.int16)
display(n1,n2)
下面是运行结果:
full 函数用法:numpy.full(shape, fill_value, dtype=None),shape 是数组形状(可以理解为几维几列,一般以元组形式给出),fill_value 是填充的值,dtype 是类型,作用是创建一个值全为同一个的数组。
# 创建一个二维三列的数组
n2 = np.full(shape=(2,3),fill_value=1,dtype=np.int16)
n2
zeros 函数用法:zeros(shape, dtype=float, order=‘C’),返回一个给定形状和类型的用0填充的数组。
n3 = np.zeros((3,3))
n3
ones 函数用法:np.ones(shape, dtype=None, order=‘C’),返回一个指定形状和类型的用1填充的数组。
n4 = np.ones((3,2),dtype=np.float)
n4
randint 函数用法:randint(low, high=None, size=None, dtype=‘l’),low 为随机数最小值,high 为最大值(取不到),size 在这里等价于 shape ,返回一个指定维度且元素位于 low~high 之间的随机数组。
n5 = np.random.randint(1,10,(3,4))
n5
random 函数用法:random(size),size 等价于 shape ,为行列数,返回一个0~1之间指定形状的数组。
n6 = np.random.random((4,2))
n6
rand 函数用法:rand(d0, d1, …, dn),d0,d1,dn 分别表示1~n个维度的维数,返回一个0-1之间指定维度的数组,区别于 random 的是,这个函数传参不能传入带 ()的元组。
n7 = np.random.rand(3,3)
n7
randn() 函数用法:randn(d0, d1, …, dn),创建一个服从标准正态分布(X ~ N(0,1))的多维数组。也就是说,产生的数据大部分生成在0左右。
n8 = np.random.randn(2,3)
n8
normal()函数用法:normal(loc=0.0, scale=1.0, size=None),loc 表示均值,scale 表示标准差,size等价于 shape ,创建一个服从正态分布的多维数组。
n9 = np.random.normal(1,2,(2,3))
n9
eye()函数用法:np.eye(N, M=None, k=0, dtype=
, order=‘C’),N 是行数,M 是列数,K 是偏移量,创建一个单位矩阵数组。
n10 = np.eye(5,5)
n10
linspace()函数用法:np.linspace(start,stop,num),创建一个包含 num 个数的等差数列,公差 d 等于多少由系统计算。
n11 = np.linspace(1,20,3)
n11
arrange()函数用法:arange([start,] stop[, step,], dtype=None),start 为起始数,stop 为结束数,创建一个连续的一维数组。
n12 = np.arange(1,10,dtype=np.int16)
n12
维度:ndim ,直接返回维度数
形状:shape,数字有几个就表示几维数组
总长度:size,返回总数据量
元素类型:dtype
n1 = np.random.randint(1,10,(3,5))
display(n1)
print("维度:%d,形状:%s,总长度:%s,元素类型:%s"%(n1.ndim,n1.shape,n1.size,n1.dtype))
在 ndarray 数组中,索引的使用有两种等价方式,即 n [M,N] = n [M][N],M表示第一个维度,N表示第二个维度,若不止二维,以此类推,n[M,N,P,……]。
n1 = np.random.randint(1,10,(3,5))
print(n1)
print("n1[2,3]=%s,n1[2][3]=%s"%(n1[2,3],n1[2][3]))
切片包括行、列切片,可以实现取连续或不连续的行或列,也可以复制、翻转数组,如果是:, 的写法,表示第一个维度全取,并且,切片操作都是左闭右开。
左边从0开始可以省略,右边到结尾可以省略
,即 X[:e0,s1:e1] ,表示第1维从第1行开始到第 e0 行;X[s0:,s1:e1],表示从第 s0 行到最后一行。常用的切片操作如下所示(以二维数组为例,n1 数组就是4.1索引中创建的),具体运行结果,这里不再展示。
print(n1[1:]) # 行切片,取第二行到最后一行
print(n1[:,2:]) # 列切片,取第三列到最后一列
print(n1[:]) # 复制数组
print(n1[[0,2]]) # 取不连续的行,用两个括号
print(n1[:,[0,2]])# 取不连续的列
print(n1[::-1]) # 行翻转
print(n1[:,::-1]) # 列翻转
print(n1[::-1,::-1]) # 行列都翻转
如果对某些切片操作有疑问,欢迎大家联系我,文末附联系方式,我看到后一定会第一时间为大家解答的。
我们依旧采用 1.3 中的 tangsan.jpg 图片,通过对 ndarray 数据切片实现图片翻转效果,这里只展示上下翻转的效果,大家也可以换图片尝试。
# 读取图片
nd = plt.imread('pic/tangsan.jpg')
# 显示原图
plt.imshow(nd)
# 上下翻转,通过改变 nd 数组,将纵轴翻转,也就是横轴逆序实现
plt.imshow(nd[::-1])
plt.imshow(nd[:,::-1]) # 左右翻转
通过 reshape 函数,我们可以改变数组的形状,或者说维度,注意改变后需要重新赋值给数组。
首先创建好如下的数组:
n1 = np.array([
[3,5],
[4,2],
[2,3]
])
n1
然后改变形状:
n1.reshape((6,1))
让行或列自适应,通过维数写 - 1 实现:
n1.reshape((2,-1)) # 行数为2,列数自适应
n1.reshape(-1,2) # 列数为2,行数自适应
concatenate 函数用法:concatenate((a1, a2, …), axis=0, out=None),a1,a2 表示数组,axis 表示轴,值为0表示横向合并,值为1表示纵向合并。
n1 = n1.reshape((2,3))
n2 = np.random.randint(0,10,(2,3))
display(n1,n2)
n3 = np.concatenate((n1,n2),axis=0) # 行合并
n4 = np.concatenate((n1,n2),axis=1) # 列合并
display(n3,n4)
此外,还可以使用 hstack 函数和 vstack 函数单独实现水平合并和垂直合并。相比,concatenate 函数会更方便些。
n2 = np.random.randint(0,10,(2,3))
n1 = np.random.randint(0,10,(2,3))
display(n1,n2)
n3 = np.hstack((n1,n2)) # 水平合并
n4 = np.vstack((n1,n2)) # 垂直合并
display(n3,n4)
split 函数用法:np.split(ary, indices_or_sections, axis=0),ary:要切分的数组,indices_or_sections:填入一个整数或者一个可迭代对象,如果是整数,就切分为整数个子数组;如果是可迭代对象,就在该索引位置切分。
将数组进行拆分为多个数组,通过 axis (轴),可以控制水平或垂直拆分,具体请看下面的示例。
n3 = n3.reshape((6,2))
display(n3) # 1.查看 n3 数组
n5 = np.split(n3,2,axis=0) # 横向切分,均分为2部分
n6 = np.split(n3,1,axis=1) # 纵向切分,均分为1部分
print(n5)
print(n6)
n7 = np.split(n3,[1,3],axis=0) # 在索引为 0 和 3 处切分,切分为3部分
print(n7)
运行结果:
和合并一样,也有单独进行水平拆分和垂直拆分的方法,分别是:hsplit 和 vsplit ,函数用法参数都是 np.hsplit(ary, indices_or_sections) ,具体用法这里不再展示。
使用 copy 函数创建一个数组的副本。
n4 = np.copy(n3) # 数组拷贝
本期跟大家分享的 “芝士” 就到此结束了,关于 NumPy 的基本操作,你学会了吗?
好啦,这就是今天要分享给大家的全部内容了,我们下期再见! ✨
如果你喜欢的话,就不要吝惜你的一键三连了~
如果文中有些地方不清楚的话,欢迎联系我,我会给大家提供思路及解答。
文章直达 | 链接 |
---|---|
上期回顾 | 【数据分析 - 基础入门之NumPy③】- 日常难疑解决 |
下期预告 | 【数据分析 - 基础入门之NumPy⑤】- NumPy基本操作 - 二 |