总体流程:
labellmg标记(.xml)-> split.py (生成四个集的txt)-> txt2yolo.py -> 各个图像的txt -> 按照标准规范文件夹 -> 制作yaml文件
第一步:使用labellmg进行标记
第二步:用split.py在新文件中生成四个txt,同时在四个txt中分配好了哪些图片是训练集哪些是验证集
split.py文件配置
--xml
C:\Users\zhaohaobing\PycharmProjects\python-yolov5-project\Data_set_processing\imagesplus
--txt
C:\Users\zhaohaobing\PycharmProjects\python-yolov5-project\Data_set_processing\imagespluss
第三步:xml2yolo.py
第四步:random1.py
随机将照片和标签分配到train和valid中
注意,这里不能命名random,因为python中有random函数,pycharm分不清是调函数还是调程序
第五步:标准化数据集文件夹格式
第六步:制作配置文件 data.yaml
配置文件里要写:数据都去哪读,nc类别数目
train: ../train/images
val: ../valid/images
nc: 2
names: ['锡纸', '塑料']