【数据分析 - 基础入门之NumPy④】NumPy基本操作 - 一

知识目录

  • 前言
  • 一、NumPy介绍
    • 1.1 导入NumPy库
    • 1.2 查看NumPy版本
    • 1.3 读取图片返回NumPy数组
  • 二、创建NumPy数组的十二种方式
    • 2.1 array 和 full
    • 2.2 zeros 和 ones
    • 2.3 随机数数组
    • 2.4 服从正态分布的数组
    • 2.5 arrange 和 eye、linspace
  • 三、ndarray属性
  • 四、ndarray基本操作
    • 4.1 索引
    • 4.2 切片
        • 一维数组
        • 二维数组
  • 五、实例 - 图片翻转
  • 六、变形
  • 七、合并与拆分
    • 7.1 合并
    • 7.2 拆分
  • 八、数组拷贝
  • 结语
  • 相关导读

前言

大家好!我是初心,本期给大家带来的是【数据分析 - 基础入门之NumPy④】NumPy基本操作(广泛)。

作者的【 Python 数据分析】专栏正在火热更新中,如果本文对您有帮助,欢迎大家点赞 + 评论 + 收藏 !

每日金句分享:选择你所喜欢的,爱你所选择的。』—— 托尔斯泰「托尔斯泰

一、NumPy介绍

NumPy( Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。

NumPy主要用于数组计算,包含
一个强大的N维数组对象 ndarray
广播功能函数
整合 C/C++/Fortran 代码的工具
线性代数、傅里叶变换、随机数生成等功能

1.1 导入NumPy库

导入 NumPy 库是我们的第一步准备工作。在此,还一并导入了以后会用到的 Pandas 库、 MatplotLib 库的 pyplot 模块。

# 导入数据分析 ‘三剑客’
import numpy as np
import pandas as pd
from matplotlib import pyplot as plt

1.2 查看NumPy版本

# 注意左右都是双下划线 ~ ~
np.__version__

1.3 读取图片返回NumPy数组

通过 pyplot 读取到的图片,返回的就是一个 NumPy 数组。

这是我事先准备好的一张图片 —— tangsan.jpg:
【数据分析 - 基础入门之NumPy④】NumPy基本操作 - 一_第1张图片
接下来通过 plt 对象读取:

n = plt.imread('pic\\tangsan.jpg')
n

输出过多,这里只展示首尾:

【数据分析 - 基础入门之NumPy④】NumPy基本操作 - 一_第2张图片
【数据分析 - 基础入门之NumPy④】NumPy基本操作 - 一_第3张图片
查看数组形状:

n.shape

再次显示图片:

plt.imshow(n)

二、创建NumPy数组的十二种方式

2.1 array 和 full

array 函数用法:numpy.array(object, dtype=None),object 可以为单个值、元组、列表、多维可迭代对象等可迭代对象,作用是创建数组。

list_one = [1,2,3,4]
# 列表创建
n1 = np.array(list_one)
tuple_one = (1,3,2)
# 元组创建
n2 = np.array(tuple_one,dtype=np.int16)
display(n1,n2)

下面是运行结果:

【数据分析 - 基础入门之NumPy④】NumPy基本操作 - 一_第4张图片

full 函数用法:numpy.full(shape, fill_value, dtype=None),shape 是数组形状(可以理解为几维几列,一般以元组形式给出),fill_value 是填充的值,dtype 是类型,作用是创建一个值全为同一个的数组。

# 创建一个二维三列的数组
n2 = np.full(shape=(2,3),fill_value=1,dtype=np.int16)
n2

2.2 zeros 和 ones

zeros 函数用法:zeros(shape, dtype=float, order=‘C’),返回一个给定形状和类型的用0填充的数组。

n3 = np.zeros((3,3))
n3

【数据分析 - 基础入门之NumPy④】NumPy基本操作 - 一_第5张图片

ones 函数用法:np.ones(shape, dtype=None, order=‘C’),返回一个指定形状和类型的用1填充的数组。

n4 = np.ones((3,2),dtype=np.float)
n4

【数据分析 - 基础入门之NumPy④】NumPy基本操作 - 一_第6张图片

2.3 随机数数组

randint 函数用法:randint(low, high=None, size=None, dtype=‘l’),low 为随机数最小值,high 为最大值(取不到),size 在这里等价于 shape ,返回一个指定维度且元素位于 low~high 之间的随机数组。

n5 = np.random.randint(1,10,(3,4))
n5

【数据分析 - 基础入门之NumPy④】NumPy基本操作 - 一_第7张图片

random 函数用法:random(size),size 等价于 shape ,为行列数,返回一个0~1之间指定形状的数组。

n6 = np.random.random((4,2))
n6

【数据分析 - 基础入门之NumPy④】NumPy基本操作 - 一_第8张图片

rand 函数用法:rand(d0, d1, …, dn),d0,d1,dn 分别表示1~n个维度的维数,返回一个0-1之间指定维度的数组,区别于 random 的是,这个函数传参不能传入带 ()的元组。

n7 = np.random.rand(3,3)
n7

【数据分析 - 基础入门之NumPy④】NumPy基本操作 - 一_第9张图片

2.4 服从正态分布的数组

randn() 函数用法:randn(d0, d1, …, dn),创建一个服从标准正态分布(X ~ N(0,1))的多维数组。也就是说,产生的数据大部分生成在0左右。

n8 = np.random.randn(2,3)
n8

normal()函数用法:normal(loc=0.0, scale=1.0, size=None),loc 表示均值,scale 表示标准差,size等价于 shape ,创建一个服从正态分布的多维数组。

n9 = np.random.normal(1,2,(2,3))
n9

2.5 arrange 和 eye、linspace

eye()函数用法:np.eye(N, M=None, k=0, dtype=, order=‘C’),N 是行数,M 是列数,K 是偏移量,创建一个单位矩阵数组。

n10 = np.eye(5,5)
n10

【数据分析 - 基础入门之NumPy④】NumPy基本操作 - 一_第10张图片

linspace()函数用法:np.linspace(start,stop,num),创建一个包含 num 个数的等差数列,公差 d 等于多少由系统计算。

n11 = np.linspace(1,20,3)
n11

arrange()函数用法:arange([start,] stop[, step,], dtype=None),start 为起始数,stop 为结束数,创建一个连续的一维数组。

n12 = np.arange(1,10,dtype=np.int16)
n12

三、ndarray属性

维度:ndim ,直接返回维度数
形状:shape,数字有几个就表示几维数组
总长度:size,返回总数据量
元素类型:dtype

n1 = np.random.randint(1,10,(3,5))
display(n1)
print("维度:%d,形状:%s,总长度:%s,元素类型:%s"%(n1.ndim,n1.shape,n1.size,n1.dtype))

【数据分析 - 基础入门之NumPy④】NumPy基本操作 - 一_第11张图片

四、ndarray基本操作

4.1 索引

在 ndarray 数组中,索引的使用有两种等价方式,即 n [M,N] = n [M][N],M表示第一个维度,N表示第二个维度,若不止二维,以此类推,n[M,N,P,……]。

n1 = np.random.randint(1,10,(3,5))
print(n1)
print("n1[2,3]=%s,n1[2][3]=%s"%(n1[2,3],n1[2][3]))

【数据分析 - 基础入门之NumPy④】NumPy基本操作 - 一_第12张图片

4.2 切片

切片包括行、列切片,可以实现取连续或不连续的行或列,也可以复制、翻转数组,如果是:, 的写法,表示第一个维度全取,并且,切片操作都是左闭右开。

一维数组

  • <1> 一个参数:a[i],返回一个数
  • <2> 两个参数:a[start:stop],对数组进行切片
  • <3>三个参数:a[start,stop,step],对数组进行切片,step 为步长,当 step = -1 时表示翻转。

二维数组

  • <1> 取元素:a[i,j],返回第 i 行的第 j 个数
  • <2> 切片:a[xi:xj,yi:yj],返回第 xi ~ xj 行的第 yi ~ yj 列,两个维度都是左闭右开。
  • <3> 切片特殊情况:左边从0开始可以省略,右边到结尾可以省略,即 X[:e0,s1:e1] ,表示第1维从第1行开始到第 e0 行;X[s0:,s1:e1],表示从第 s0 行到最后一行。

常用的切片操作如下所示(以二维数组为例,n1 数组就是4.1索引中创建的),具体运行结果,这里不再展示。

print(n1[1:]) # 行切片,取第二行到最后一行
print(n1[:,2:]) # 列切片,取第三列到最后一列
print(n1[:]) # 复制数组
print(n1[[0,2]]) # 取不连续的行,用两个括号
print(n1[:,[0,2]])# 取不连续的列
print(n1[::-1]) # 行翻转
print(n1[:,::-1]) # 列翻转
print(n1[::-1,::-1]) # 行列都翻转

如果对某些切片操作有疑问,欢迎大家联系我,文末附联系方式,我看到后一定会第一时间为大家解答的。

五、实例 - 图片翻转

我们依旧采用 1.3 中的 tangsan.jpg 图片,通过对 ndarray 数据切片实现图片翻转效果,这里只展示上下翻转的效果,大家也可以换图片尝试。

# 读取图片
nd = plt.imread('pic/tangsan.jpg')
# 显示原图
plt.imshow(nd)
# 上下翻转,通过改变 nd 数组,将纵轴翻转,也就是横轴逆序实现
plt.imshow(nd[::-1])

【数据分析 - 基础入门之NumPy④】NumPy基本操作 - 一_第13张图片

plt.imshow(nd[:,::-1]) # 左右翻转

六、变形

通过 reshape 函数,我们可以改变数组的形状,或者说维度,注意改变后需要重新赋值给数组。

首先创建好如下的数组:

n1 = np.array([
    [3,5],
    [4,2],
    [2,3]
])
n1

然后改变形状:

n1.reshape((6,1))

让行或列自适应,通过维数写 - 1 实现:

n1.reshape((2,-1)) # 行数为2,列数自适应
n1.reshape(-1,2) # 列数为2,行数自适应

七、合并与拆分

7.1 合并

concatenate 函数用法:concatenate((a1, a2, …), axis=0, out=None),a1,a2 表示数组,axis 表示轴,值为0表示横向合并,值为1表示纵向合并。

n1 = n1.reshape((2,3))
n2 = np.random.randint(0,10,(2,3))
display(n1,n2)
n3 = np.concatenate((n1,n2),axis=0) # 行合并
n4 = np.concatenate((n1,n2),axis=1) # 列合并
display(n3,n4)

【数据分析 - 基础入门之NumPy④】NumPy基本操作 - 一_第14张图片

此外,还可以使用 hstack 函数和 vstack 函数单独实现水平合并和垂直合并。相比,concatenate 函数会更方便些。

n2 = np.random.randint(0,10,(2,3))
n1 = np.random.randint(0,10,(2,3))
display(n1,n2)
n3 = np.hstack((n1,n2)) # 水平合并
n4 = np.vstack((n1,n2)) # 垂直合并
display(n3,n4)

【数据分析 - 基础入门之NumPy④】NumPy基本操作 - 一_第15张图片

7.2 拆分

split 函数用法:np.split(ary, indices_or_sections, axis=0),ary:要切分的数组,indices_or_sections:填入一个整数或者一个可迭代对象,如果是整数,就切分为整数个子数组;如果是可迭代对象,就在该索引位置切分。

将数组进行拆分为多个数组,通过 axis (轴),可以控制水平或垂直拆分,具体请看下面的示例。

n3 = n3.reshape((6,2))
display(n3) # 1.查看 n3 数组
n5 = np.split(n3,2,axis=0) # 横向切分,均分为2部分
n6 = np.split(n3,1,axis=1) # 纵向切分,均分为1部分
print(n5)
print(n6)
n7 = np.split(n3,[1,3],axis=0) # 在索引为 0 和 3 处切分,切分为3部分
print(n7)

运行结果:

【数据分析 - 基础入门之NumPy④】NumPy基本操作 - 一_第16张图片

和合并一样,也有单独进行水平拆分和垂直拆分的方法,分别是:hsplit 和 vsplit ,函数用法参数都是 np.hsplit(ary, indices_or_sections) ,具体用法这里不再展示。

八、数组拷贝

使用 copy 函数创建一个数组的副本。

n4 = np.copy(n3) # 数组拷贝

结语

本期跟大家分享的 “芝士” 就到此结束了,关于 NumPy 的基本操作,你学会了吗?

好啦,这就是今天要分享给大家的全部内容了,我们下期再见! ✨
如果你喜欢的话,就不要吝惜你的一键三连了~

如果文中有些地方不清楚的话,欢迎联系我,我会给大家提供思路及解答。

相关导读

文章直达 链接
上期回顾 【数据分析 - 基础入门之NumPy③】- 日常难疑解决
下期预告 【数据分析 - 基础入门之NumPy⑤】- NumPy基本操作 - 二

你可能感兴趣的:(Python数据分析,数据分析,numpy,数据挖掘)