

      • 1. 数据标注规范
      • 2. 训练设置
      • 3. 数据增强
      • 4. Multi-GPU Training

1. 数据标注规范

  • 每个类的图像。≥ 建议每类1500张图片
  • 每个类的实例。≥ 建议每个类10000个实例(标记的对象)
  • 图像多样性。必须代表已部署的环境。对于真实世界的使用案例,我们推荐来自不同时间、不同季节、不同天气、不同照明、不同角度、不同来源(在线收集、本地收集、不同相机)的图像。
  • 标签一致性。必须标记所有图像中所有类的所有实例。部分标签将不起作用。
  • 标签准确性。标签必须紧紧围绕每个对象。对象与其边界框之间不应存在空间。任何对象都不应缺少标签。
  • 标签验证。在火车开始时查看train_batch*.jpg,以验证标签是否正确,即参见示例马赛克。
  • 背景图像。背景图像是没有添加到数据集以减少误报(FP)的对象的图像。我们建议大约0-10%的背景图像,以帮助减少FP(COCO有1000张背景图像供参考,占总数的1%)。背景图像不需要标签。

2. 训练设置

  • 训练轮次. 开始设置300轮,如果没有发生过拟合,则设置600、1200。
  • 图片尺寸 默认640.如果数据集中大量小对象,它可以从更高分辨率(如–img 1280)的训练中受益。训练和检测应该使用同样的image_size
  • Batch size. 使用硬件允许的最大批量。小批量产生较差的批量标准统计数据,应避免。
  • 超级参数. 默认超参数为hyp.cratch-low.yaml。我们建议您在考虑修改任何超参数之前先使用默认超参数进行训练。更多请参考:Hyperparameter Evolution Tutorial.
  • 超参数进化是一种使用遗传算法(GA)进行优化的超参数优化方法。2022年9月25日更新。

3. 数据增强

4. Multi-GPU Training

  • Single GPU
 python train.py  --batch 64 --data coco.yaml --weights yolov5s.pt --device 0
  • Multi-GPU DistributedDataParallel Mode (✅ recommended)
python -m torch.distributed.run --nproc_per_node 2 train.py --batch 64 --data coco.yaml --weights yolov5s.pt --device 0,1


  • 使用多台机器
# On master machine 0
$ python -m torch.distributed.run --nproc_per_node G --nnodes N --node_rank 0 --master_addr "" --master_port 1234 train.py --batch 64 --data coco.yaml --cfg yolov5s.yaml --weights ''

# On machine R
$ python -m torch.distributed.run --nproc_per_node G --nnodes N --node_rank R --master_addr "" --master_port 1234 train.py --batch 64 --data coco.yaml --cfg yolov5s.yaml --weights ''


参考:YOLOv5 Documentation
