hdf5文件的读写

hdf5文件的读写

  • 以字节(文件路径名)形式进行读写
    • 将数据以字节的形式进行写入h5文件
    • 将数据以字节的形式进行读取
  • 以数组的形式进行读写
    • 将数据以数组的形式进行写入
    • 将数据以数组的形式进行读取

以字节(文件路径名)形式进行读写

将数据以字节的形式进行写入h5文件

import torch.utils.data as data
import PIL.Image as Image

import os
import random
import numpy as np
from skimage.io import imread
import cv2
from glob import glob
import imageio
import h5py

import matplotlib.pyplot as plt

# 使用的数据是400张的liver数据
root=r'G:\liver\liver\train'

pics = []
masks = []
n = len(os.listdir(root)) // 2  # 因为数据集中一套训练数据包含有训练图和mask图,所以要除2

for i in range(n):
    img = os.path.join(root, "%03d.png" % i)  # liver is %03d
    mask = os.path.join(root, "%03d_mask.png" % i)
	
	# 是将图片的路径添加到列表中,以字节的形式进行存储
    pics.append(img)
    masks.append(mask)

# 保存的h5文件路径
f = h5py.File('G:/liver/train_hdf5_file.h5', 'w')
f['image'] = pics
f['labels'] = masks
f.close()

将数据以字节的形式进行读取

with h5py.File('G:/liver/train_hdf5_file.h5', 'r') as f:
    # List all groups
    print("Keys: %s" % f.keys())
    # 获取键属性,list(f.keys())[0]获取的是Keys: 第一个键'image',list(f.keys())[1]获取的是第二个键'labels'
    a_group_key = list(f.keys())[0]
    print(a_group_key)

   
     # 此时f['image'][0]为第一个图片的路径名,是以字节的形式进行存储的,因此,想要进行读取必须将字节转化为字符串的形式
    print(f['image'][0])
   # 获取某一个图像的绝对路径名(此时是字节形式的,需要进行转化)
    t=f['image'][0]
    # 将字节转化为字符串路径,然后进行读取,否则无法读取数据
    t1=bytes.decode(t)
    c=cv2.imread(t1)
    plt.imshow(c)
    plt.show()

以数组的形式进行读写

将数据以数组的形式进行写入

import torch.utils.data as data
import PIL.Image as Image

import os
import random
import numpy as np
from skimage.io import imread
import cv2
from glob import glob
import imageio
import h5py

import matplotlib.pyplot as plt


root=r'G:\liver\liver\train'

pics = []
masks = []
n = len(os.listdir(root)) // 2  # 因为数据集中一套训练数据包含有训练图和mask图,所以要除2

for i in range(n):
	# 经过cv2.imread读取后得到的数据是数组类型
    img = cv2.imread(os.path.join(root, "%03d.png" % i) ) # liver is %03d
    mask = cv2.imread(os.path.join(root, "%03d_mask.png" % i))
    
	# 以数组的形式进行存放
    pics.append(img)
    masks.append(mask)


# 转化为数组的形式
img_np = np.array(pics)
label_np = np.array(masks)

# 下面打印的图像的绝对路径
print('数据集中原始的标签顺序是:\n', img_np)
print('#######################################################################################')
print('数据集中原始的标签顺序是:\n', label_np)



f = h5py.File('G:/liver/train_hdf5_file.h5', 'w')
f['image'] = img_np
f['labels'] = label_np
f.close()

将数据以数组的形式进行读取

###################################按原始顺序进行读取h5文件,此时文件为数组形式#################
with h5py.File('G:/liver/train_hdf5_file.h5', 'r') as f:
    # List all groups
    print("Keys: %s" % f.keys())
    # 获取键属性,list(f.keys())[0]获取的是Keys: 第一个键'image',list(f.keys())[1]获取的是第二个键'labels'
    a_group_key = list(f.keys())[0]
    print(a_group_key)

    # Get the data
    data = list(f[a_group_key])
    print('data[0]的数据类型为:',type(data[0]))
    print('data[0].shape的大小为:',data[0].shape)
    l = len(f['image'])


    plt.imshow(data[0])
    plt.show()

    # for i in range(l):
    #     cv2.imwrite("F:/1/hou/s/%d_filename.png"%i, data[i])

你可能感兴趣的:(pycharm)