将train_label.csv数据列表文件进行划分

OCR数据集标签文件:将train_label.csv数据列表文件进行划分,生成train.txt文件和val.txt文件

import pandas as pd
# 读取数据列表文件
data_label=pd.read_csv('./train_label.csv', encoding='gb2312')
data_label.head()
# 对数据列表文件进行划分
print(data_label.shape)
train=data_label[:45000]
val=data_label[45000:]
train.to_csv('train.txt',sep='\t',header=None,index=None)
val.to_csv('val.txt',sep='\t',header=None,index=None)

train_label.csv文件内容示例:

将train_label.csv数据列表文件进行划分_第1张图片

 生成train.txt文件示例:

将train_label.csv数据列表文件进行划分_第2张图片

  生成val.txt文件示例:

将train_label.csv数据列表文件进行划分_第3张图片

 

你可能感兴趣的:(OCR,paddleocr,paddleocr,OCR)