《Python和HDF 5大数据应用》——导读


《Python和HDF 5大数据应用》——导读_第1张图片

前 言

过去的几年里,Python已经和IDL或MATLAB一样,成为科学分析领域值得信赖的选择。它拥有稳健的核心模块,可用于处理数值数组(NumPy)、分析 SciPy)以及绘图(matplotlib),同时还拥有十分丰富的专用模块。它能帮助人们减少编写科学代码的工作量,同时还能提高计算结果的质量。

已经有越来越多的人将Python用于大型数值数据集处理,使用标准格式来进行数据的存储和通信也显得越来越重要。国家超级电脑应用中心(National Center for Supercomputing Applications,NCSA)开发的“层次性数据格式”(Hierarchical Data Format,HDF)的最新版本HDF5正迅速成为人们储存科学数据的选择。很多使用(或有意使用)HDF5的研究人员也被Python的易用性和快速开发能力吸引。

本书向所有有Python数据分析基本背景的人介绍如何在Python下使用HDF5。本书假定读者只熟悉Python和NumPy。本书将侧重于HDF5的本地功能集,而不是Python的高层抽象,以尽力确保在本书建议下创建的HDF文件可移植。

最后,本书将尽力同时支持Python 2和Python 3的用户。本书所有的示例都以Python 2写就,任何有可能导致误会的区别都将在文本中特别注明。

目 录

[第1章 简介
1.1 Python和HDF5](https://yq.aliyun.com/articles/93496/)
1.1.1 数据和元数据的组织
1.1.2 大数据复制
1.2 HDF5到底是什么
1.2.1 HDF5文件规格
1.2.2 HDF5标准库
1.2.3 HDF5生态系统
[第2章 开始使用
2.1 HDF基本原理](https://yq.aliyun.com/articles/93559/)
2.2 设置
2.2.1 Python2还是Python3
2.2.2 代码示例
2.2.3 NumPy
2.2.4 HDF5和h5py
2.2.5 IPython
2.2.6 时间和优化
2.3 HDF5工具
2.3.1 HDFView
2.3.2 ViTables
2.3.3 命令行工具
2.4 你的第一个HDF5文件
2.4.1 使用环境管理器
2.4.2 文件驱动
2.4.3 用户块
第3章 使用数据集
第4章 让分块和压缩来帮忙
第5章 组、链接和迭代:HDF5的层次性
第6章 用特征存储元数据
第7章 更多关于类型
第8章 通过引用、类型和维度标尺来组织数据
第9章 HDF5并发性:多线程和多进程
第10章 下一步
索引

你可能感兴趣的:(大数据,python,matlab)