paddlex目标检测里数据预处理部分

它的 game.zip 里是 类似于

     paddlex目标检测里数据预处理部分_第1张图片     paddlex目标检测里数据预处理部分_第2张图片

两个文件夹,一个 lable 相当于 Annotations ,一个 train1 文件夹 相当于 JPEGImages

!unzip game.zip
!mv game data/

解压完之后移动到  data 文件夹

#根据PaddlexX格式的要求,生成三个数据集
import os
import zipfile
import xml.etree.ElementTree as ET
import re
import numpy as np

lables = os.listdir("data/game/lable")
print("lables:",len(lables))
trains = os.listdir("data/game/train1")
print("trains:",len(trains))
_lable = []
ratio = 0.8
offset = int(len(lables)*ratio)
np.random.shuffle(lables)
path = "data/game/"
with open(path + "train_list.txt","w") as f:
    for lable in lables[:offset]:
        if lable.split(".")[0] + ".jpg" in trains:
            f.w

你可能感兴趣的:(数据清洗,目标检测)