图解数据分析(11) | Numpy - 与高维数组操作(数据科学家入门·完结)

图解数据分析(11) | Numpy - 与高维数组操作(数据科学家入门·完结)_第1张图片

  • 作者:韩信子@ShowMeAI
  • 教程地址:http://www.showmeai.tech/tutorials/33
  • 本文地址:http://www.showmeai.tech/article-detail/144
  • 声明:版权所有,转载请联系平台与作者并注明出处
  • 收藏ShowMeAI查看更多精彩内容

图解数据分析(11) | Numpy - 与高维数组操作(数据科学家入门·完结)_第2张图片

n维数组是NumPy的核心概念,大部分数据的操作都是基于n维数组完成的。本系列内容覆盖到1维数组操作、2维数组操作、3维数组操作方法,本篇讲解Numpy与3维、更高维数组的操作。

有时候我们会使用到3维或者更高维的NumPy数组(比如计算机视觉的应用中),通过重塑1维向量或转换嵌套Python列表来创建3维数组时,索引分别对应(z,y,x)。索引z是平面编号,(y,x)坐标在该平面上移动,如下图所示:

图解数据分析(11) | Numpy - 与高维数组操作(数据科学家入门·完结)_第3张图片

通过上述索引顺序,可以方便的保留灰度图像,a[i]表示第i个图像。

但这样的索引顺序并不具有广泛性,例如在处理RGB图像时,通常使用(y,x,z)顺序:首先是两个像素坐标,然后才是颜色坐标(Matplotlib中的RGB,OpenCV中的BGR):

图解数据分析(11) | Numpy - 与高维数组操作(数据科学家入门·完结)_第4张图片

这样可以方便地定位特定像素,如a[i,j]给出像素(i,j)的RGB元组。

因此,几何形状的创建实际取决于你对域的约定:

图解数据分析(11) | Numpy - 与高维数组操作(数据科学家入门·完结)_第5张图片

显然,hstack,vstack或dstack之类的NumPy函数并不一定满足这些约定,其默认的索引顺序是(y,x,z),RGB图像顺序如下:

图解数据分析(11) | Numpy - 与高维数组操作(数据科学家入门·完结)_第6张图片

如果数据不是这样的布局,使用concatenate命令可以方便的堆叠图像,并通过axis参数提供索引号:

图解数据分析(11) | Numpy - 与高维数组操作(数据科学家入门·完结)_第7张图片

如果不考虑轴数,可以将数组转换hstack和相应形式:

图解数据分析(11) | Numpy - 与高维数组操作(数据科学家入门·完结)_第8张图片

这种转换非常方便,该过程只是混合索引的顺序重排,并没有实际的复制操作。

通过混合索引顺序可实现数组转置,掌握该方法将加深你对3维数据的了解。根据确定的轴顺序,转置数组平面的命令有所不同:对于通用数组,交换索引1和2,对于RGB图像交换0和1:

图解数据分析(11) | Numpy - 与高维数组操作(数据科学家入门·完结)_第9张图片

注意,transpose(a.T)的默认轴参数会颠倒索引顺序,这不同于上述述两种索引顺序。

广播机制同样适用多维数组,更多详细信息可参阅笔记“ NumPy中的广播”。

最后介绍einsum(Einstein summation)函数,这将使你在处理多维数组时避免很多Python循环,代码更为简洁:

图解数据分析(11) | Numpy - 与高维数组操作(数据科学家入门·完结)_第10张图片

该函数对重复索引的数组求和。在一般情况下,使用np.tensordot(a,b,axis=1)就可以,但在更复杂的情况下,einsum速度更快,读写更容易。

一键运行所有代码

图解数据分析系列 配套的所有代码,可前往ShowMeAI 官方 GitHub,下载后即可在本地 Python 环境中运行。能访问 Google 的宝宝也可以直接借助 Google Colab一键运行与交互学习!

下载数据分析速查表

Awesome cheatsheets | ShowMeAI速查表大全 系列包含『编程语言』『AI技能知识』『数据科学工具库』『AI垂直领域工具库』四个板块,追平到工具库当前最新版本,并跑通了所有代码。点击 官网GitHub 获取~

数据分析相关速查表(部分)

内容 速查表(部分) Github代码
Python 3速查表 图解数据分析(11) | Numpy - 与高维数组操作(数据科学家入门·完结)_第11张图片 一键运行速查表代码 - Python
Numpy 速查表 图解数据分析(11) | Numpy - 与高维数组操作(数据科学家入门·完结)_第12张图片 一键运行速查表代码 - Numpy
Pandas 速查表 图解数据分析(11) | Numpy - 与高维数组操作(数据科学家入门·完结)_第13张图片 一键运行速查表代码 - Pandas
Matplotlib 速查表 图解数据分析(11) | Numpy - 与高维数组操作(数据科学家入门·完结)_第14张图片 一键运行速查表代码 - Matplotlib
Seaborn 速查表 图解数据分析(11) | Numpy - 与高维数组操作(数据科学家入门·完结)_第15张图片 一键运行速查表代码 - Seaborn

拓展参考资料

  • 利用Python进行数据分析·第2版
  • w3schools pandas tutorial
  • Kaggle的Pandas入门教程
  • 十分钟入门 Pandas
  • Pandas可视化教程
  • Pandas官方教程
  • Seaborn官方教程

ShowMeAI图解数据分析系列推荐(数据科学家入门)

  • 图解数据分析(1) | 数据分析介绍
  • 图解数据分析(2) | 数据分析思维
  • 图解数据分析(3) | 数据分析的数学基础
  • 图解数据分析(4) | 核心步骤1 - 业务认知与数据初探
  • 图解数据分析(5) | 核心步骤2 - 数据清洗与预处理
  • 图解数据分析(6) | 核心步骤3 - 业务分析与数据挖掘
  • 图解数据分析(7) | 数据分析工具地图
  • 图解数据分析(8) | Numpy - 统计与数据科学计算工具库介绍
  • 图解数据分析(9) | Numpy - 与1维数组操作
  • 图解数据分析(10) | Numpy - 与2维数组操作
  • 图解数据分析(11) | Numpy - 与高维数组操作
  • 图解数据分析(12) | Pandas - 数据分析工具库介绍
  • 图解数据分析(13) | Pandas - 核心操作函数大全
  • 图解数据分析(14) | Pandas - 数据变换高级函数
  • 图解数据分析(15) | Pandas - 数据分组与操作
  • 图解数据分析(16) | 数据可视化原则与方法
  • 图解数据分析(17) | 基于Pandas的数据可视化
  • 图解数据分析(18) | 基于Seaborn的数据可视化

ShowMeAI系列教程精选推荐

  • 大厂技术实现:推荐与广告计算解决方案
  • 大厂技术实现:计算机视觉解决方案
  • 大厂技术实现:自然语言处理行业解决方案
  • 图解Python编程:从入门到精通系列教程
  • 图解数据分析:从入门到精通系列教程
  • 图解AI数学基础:从入门到精通系列教程
  • 图解大数据技术:从入门到精通系列教程
  • 图解机器学习算法:从入门到精通系列教程
  • 机器学习实战:手把手教你玩转机器学习系列
  • 深度学习教程:吴恩达专项课程 · 全套笔记解读
  • 自然语言处理教程:斯坦福CS224n课程 · 课程带学与全套笔记解读
  • 深度学习与计算机视觉教程:斯坦福CS231n · 全套笔记解读

你可能感兴趣的:(图解数据分析,从入门到精通系列,python,数据分析,开发语言,numpy,数组)