

  • PaddleDetection知识蒸馏
  • 分类模型蒸馏:
    • one-stage检测模型蒸馏:
  • 关于作者
  • 实验环境:
  • 划分数据集
    • 正常训练:
    • L2蒸馏损失训练
    • Fine-gained蒸馏损失训练
    • 注:
原来我们需要让新模型的softmax分布与真实标签匹配,现在只需要让新模型与原模型在给定输入下的softmax分布匹配了。但是由于softmax函数是一个约等于arg max的近似,它所能描述的知识(对输出的概率描述)非常有限,一种常用的解决方法是直接让新旧模型匹配logits输出,即使用teacher model的logits输出作为student model的回归目标,并使用L2损失作为loss。



One-stage目标检测任务的训练目标难度更大,因为teacher网络会预测出更多的背景bbox,如果直接用teacher的预测输出作为student学习的soft label会有严重的类别不均衡问题。解决这个问题需要引入新的方法。

主要是《Object detection at 200 Frames Per Second》这篇文章中提出了针对该问题的解决方案,即针对YOLOv3中分类、回归、objectness三个不同的head适配不同的蒸馏损失函数,并对分类和回归的损失函数用objectness分值进行抑制,以解决前景背景类别不均衡问题。





Batch Size:8


!rm -rf PaddleDetection/
!unzip -oq data/data85000/PaddleDetection-master.zip -d ./
%cd PaddleDetection-master/
!pip install -r requirements.txt
!pip install paddleslim
!mkdir /home/aistudio/PaddleDetection-master/dataset/voc/VOCdevkit
!unzip -oq ../data/data39480/VOC2012.zip -d dataset/voc/VOCdevkit/


import os
from tqdm import tqdm
from random import shuffle

base = 'dataset/voc/'
img_base = 'VOCdevkit/VOC2012/JPEGImages/'
xml_base = 'VOCdevkit/VOC2012/Annotations/'

images_list = os.listdir(os.path.join(base, img_base))

split_num = int(0.9 * len(images_list))

with open(os.path.join(base, 'trainval.txt'), 'w') as f:
    for im in tqdm(images_list[:split_num]):
        img_id = im[:-4]
        line = '{}{}.jpg {}{}.xml\n'.format(img_base, img_id, xml_base, img_id)

with open(os.path.join(base, 'test.txt'), 'w') as f:
    for im in tqdm(images_list[split_num:]):
        img_id = im[:-4]
        line = '{}{}.jpg {}{}.xml\n'.format(img_base, img_id, xml_base, img_id)
!python tools/train.py \
    -c configs/yolov3_mobilenet_v1_voc.yml --eval
2021-04-30 13:02:48,341 - INFO - iter: 29200, lr: 0.001000, 'loss': '19.766043', eta: 2:01:38, batch_cost: 0.17888 sec, ips: 44.72353 images/sec


Best test box ap: 55.303840240819966, in step: 69999

!python slim/distillation/distill.py \
    -c configs/yolov3_mobilenet_v1_voc.yml \
    -t configs/yolov3_r34_voc.yml \
    --teacher_pretrained https://paddlemodels.bj.bcebos.com/object_detection/yolov3_r34_voc.tar
2021-04-29 15:55:52,595 - INFO - Save model to output/yolov3_mobilenet_v1_voc/model_final.
!mkdir L2distill
!mv output/yolov3_mobilenet_v1_voc/model_final.* L2distill


《Object detection at 200 Frames Per Second》

Best test box ap: 44.40395830547559, in step: 66000



!python slim/distillation/distill.py \
    -c configs/yolov3_mobilenet_v1_voc.yml -o use_fine_grained_loss=true\
    -t configs/yolov3_r34_voc.yml \
    --teacher_pretrained https://paddlemodels.bj.bcebos.com/object_detection/yolov3_r34_voc.tar \
    -r output/yolov3_mobilenet_v1_voc/38000
2021-04-30 11:24:32,141 - INFO - Save model to output/yolov3_mobilenet_v1_voc/model_final.
!mkdir FineGaineddistill
!mv output/yolov3_mobilenet_v1_voc/model_final.* FineGaineddistill
!rm -rf output/


