我使用的是wider person数据集,给出的是images和txt标注文件,其中,txt文件的每一行是一张图片,第一个字段是图片名称,后面每4个字段是[x,y,w,h],跟我们大部分自有数据集的格式相同。
转为coco2017的样式,网上代码很多,暂时就不贴代码了,后面会把代码放github上,知识说一个注意点,也是我踩过的坑:
categories = {'person': 1, 'bicycle': 2, 'car': 3, 'motorcycle': 4, 'airplane': 5, 'bus': 6, 'train': 7, 'truck': 8, 'boat': 9, 'traffic light': 10, 'fire hydrant': 11, 'stop sign': 13, 'parking meter': 14, 'bench': 15, 'bird': 16, 'cat': 17, 'dog': 18, 'horse': 19, 'sheep': 20, 'cow': 21, 'elephant': 22, 'bear': 23, 'zebra': 24, 'giraffe': 25, 'backpack': 27, 'umbrella': 28, 'handbag': 31, 'tie': 32, 'suitcase': 33, 'frisbee': 34, 'skis': 35, 'snowboard': 36, 'sports ball': 37, 'kite': 38, 'baseball bat': 39, 'baseball glove': 40, 'skateboard': 41, 'surfboard': 42, 'tennis racket': 43, 'bottle': 44, 'wine glass': 46, 'cup': 47, 'fork': 48, 'knife': 49, 'spoon': 50, 'bowl': 51, 'banana': 52, 'apple': 53, 'sandwich': 54, 'orange': 55, 'broccoli': 56, 'carrot': 57, 'hot dog': 58, 'pizza': 59, 'donut': 60, 'cake': 61, 'chair': 62, 'couch': 63, 'potted plant': 64, 'bed': 65, 'dining table': 67, 'toilet': 70, 'tv': 72, 'laptop': 73, 'mouse': 74, 'remote': 75, 'keyboard': 76, 'cell phone': 77, 'microwave': 78, 'oven': 79, 'toaster': 80, 'sink': 81, 'refrigerator': 82, 'book': 84, 'clock': 85, 'vase': 86, 'scissors': 87, 'teddy bear': 88, 'hair drier': 89, 'toothbrush': 90}
序号别错了,不然会抓狂。
python tools/train_net.py --num-gpus 4 --config-file configs/COCO-Detection/retinanet_R_50_FPN_3x.yaml SOLVER.IMS_PER_BATCH 4 SOLVER.BASE_LR 0.00085
--num-gpus
#GPU个数
SOLVER.IMS_PER_BATCH
#batch数
SOLVER.BASE_LR
#学习率
python tools/train_net.py --resume --num-gpus 8 --config-file output/config.yaml SOLVER.IMS_PER_BATCH 8 SOLVER.BASE_LR 0.0025 MODEL.WEIGHTS output/model_0009999.pth
--resume
#设置checkpoint训练,就是接着上次训练
MODEL.WEIGHTS
#上一次保存的模型