h5文件详解||h5py模块详解||通过h5py模块读取h5文件的key

  • H5文件(官网)

H5文件是层次数据格式第5代的版本(Hierarchical Data Format,HDF5。不与 HDF 版本 4 及早期版本兼容),它是用于存储科学数据的一种文件格式和库文件。它是由美国超级计算与应用中心研发的文件格式,用以存储和组织大规模数据。目前由非营利组织HDF小组提供支持。

H5将文件结构简化成两个主要的对象类型:

  1. 数据集( dataset ),就是同一类型数据的多维数组。
  2. 组( group ),是一种容器结构,可以包含数据集和其他组。可以类比于字典,有键(key,组成员的名称)和值(value,组成员对象本身(组或者数据集))。group中可以存放dataset或者其他的group。

在Python中,主要使用h5py模块来操作相关格式。

  • h5py模块

# h5py模块读、写hdf5文件
# -*- coding: utf-8 -*-

import h5py
import numpy as np

#HDF5的写入:
imgData = np.zeros((2,4))
f = h5py.File('HDF5_FILE.h5','w')   #创建一个h5文件,文件指针是f
f['data'] = imgData                 #将数据写入文件的主键data下面
f['labels'] = np.array([1,2,3,4,5])            #将数据写入文件的主键labels下面
f.close()                           #关闭文件

#HDF5的读取:
f = h5py.File('HDF5_FILE.h5','r')   #打开h5文件
# 可以查看所有的主键
for key in f.keys():
    print(f[key].name)
    print(f[key].shape)
    print(f[key].value)
  • 参考

    1. 数据参考

    2. HDF官网

.
.
.
2019-02-27 19:50:00写于太阳花咖啡馆

你可能感兴趣的:(小白学Python)