HWDB数据集gnt格式转为png格式

HWDB数据集下载地址:

http://www.nlpr.ia.ac.cn/databases/handwriting/Download.html

一、数据集

HWDB数据集是解压之后,是gnt格式的,不能可视化,如果需要显示的看到HWDB数据集,那么需要将gnt格式转换为png图片格式。

二、源码

import os
import numpy as np
import struct
from PIL import Image

    
data_dir = './data'
# train_data_dir = "../data/HWDB1.1trn_gnt"
train_data_dir = os.path.join(data_dir, 'HWDB1.1trn_gnt')
test_data_dir = os.path.join(data_dir, 'HWDB1.1tst_gnt')


def read_from_gnt_dir(gnt_dir=train_data_dir):
    def one_file(f):
        header_size = 10
        while True:
            header = np.fromfile(f, dtype='uint8', count=header_size)
            if not header.size: break
            sample_size = header[0] + (header[1]<<8) + (header[2]<<16) + (header[3]<<24)
            tagcode = header[5] + (header[4]<<8)
            width = header[6] 

你可能感兴趣的:(Deep,Learning)