全球人工智能技术创新大赛【赛道二】第三周初赛top-2分享

全球人工智能技术创新大赛【赛道二】第三周初赛top-2分享

  • 本文禁止转载!
  • 比赛地址:
  • 排名截图:
  • 使用GPU平台:
    • AI Studio简介:
    • 特点:
  • 使用深度学习框架:
    • PaddleDetection简介:
    • 使用算法:
  • 数据预处理:
    • 图像分割:
    • 有重叠的滑窗:
    • 多模型预测:
  • 数据增强:
  • 预训练模型:
  • 后续思路:
  • 联系作者:
  • 我的公众号:

本文禁止转载!

作者的其他主页:

B站:https://space.bilibili.com/470550823

CSDN:https://blog.csdn.net/weixin_44936889

AI Studio:https://aistudio.baidu.com/aistudio/personalcenter/thirdview/67156

Github:https://github.com/Sharpiless

比赛地址:

比赛地址:https://tianchi.aliyun.com/competition/entrance/531855/rankingList

排名截图:

全球人工智能技术创新大赛【赛道二】第三周初赛top-2分享_第1张图片
周周星就是:在每个赛道的初赛阶段,设立周周星奖励:从初赛第三周开始,以每周一中午12点的排行榜为准,取前两名参赛队伍发放周周星纪念礼物;对于前面已经获得周周星的队伍,不重复发放,名额按名次顺延。

白嫖了一个耳机和一个手环:

全球人工智能技术创新大赛【赛道二】第三周初赛top-2分享_第2张图片全球人工智能技术创新大赛【赛道二】第三周初赛top-2分享_第3张图片

使用GPU平台:

AI Studio:https://aistudio.baidu.com/aistudio/index

AI Studio简介:

AI Studio 是一个基于 PaddlePaddle 的集成了大量数据集、经典样例项目及比赛项目的云计算建模平台,也是一个机器学习、深度学习的交流社区。

AI Studio 最大限度地解放了数据科学家需要环境配置的烦恼,在云端集成计算资源、项目管理、代码管理、比赛等多种功能,形成一站式兼顾学习和工作的建模平台。而且 AI Studio 提供计算资源、空间资源、视频公开课全部免费开放。

特点:

    1. 支持后台任务,离线训练模型;
    1. 每天赠送10h V100 GPU算力;
    1. 有较好的开源社区氛围和文档;

使用深度学习框架:

PaddleDetection:https://github.com/PaddlePaddle/PaddleDetection/tree/master

PaddleDetection简介:

PaddleDetection飞桨目标检测开发套件,旨在帮助开发者更快更好地完成检测模型的组建、训练、优化及部署等全开发流程。

PaddleDetection模块化地实现了多种主流目标检测算法,提供了丰富的数据增强策略、网络模块组件(如骨干网络)、损失函数等,并集成了模型压缩和跨平台高性能部署能力。

经过长时间产业实践打磨,PaddleDetection已拥有顺畅、卓越的使用体验,被工业质检、遥感图像检测、无人巡检、新零售、互联网、科研等十多个行业的开发者广泛应用。
全球人工智能技术创新大赛【赛道二】第三周初赛top-2分享_第4张图片

使用算法:

这里我使用PaddleDetection的 Cascade-RCNN 算法:

全球人工智能技术创新大赛【赛道二】第三周初赛top-2分享_第5张图片
RPN提出的proposals大部分质量不高,导致没办法直接使用高阈值的detector,Cascade R-CNN使用cascade回归作为一种重采样的机制,逐stage提高proposal的IoU值,从而使得前一个stage重新采样过的proposals能够适应下一个有更高阈值的stage。

Backbone 使用 ResNet200,并加入可变性卷积网络v2(DCNv2):
全球人工智能技术创新大赛【赛道二】第三周初赛top-2分享_第6张图片

数据预处理:

图像分割:

由于原图很大,我们首先对数据集进行分割,按照两个比例:1/4和1/16切割原图,并过滤掉较小的目标(实际过滤掉长或者宽<5像素的目标)。

注意到 full body 切割后应修正为 visible body 对提高分数有很大的帮助。

有重叠的滑窗:

由于直接切割会导致很多目标被分离,因此我们使用overlap为0.2的滑窗采样:
全球人工智能技术创新大赛【赛道二】第三周初赛top-2分享_第7张图片
全球人工智能技术创新大赛【赛道二】第三周初赛top-2分享_第8张图片
全球人工智能技术创新大赛【赛道二】第三周初赛top-2分享_第9张图片
全球人工智能技术创新大赛【赛道二】第三周初赛top-2分享_第10张图片

多模型预测:

由于visible body跟full body在大多数情况下是重合的,他们的IOU也很大,导致一个模型检测效果较差,因此我们训练了两个模型,一个用于检测vehicle+visible body,一个用于检测full body+head:
全球人工智能技术创新大赛【赛道二】第三周初赛top-2分享_第11张图片
全球人工智能技术创新大赛【赛道二】第三周初赛top-2分享_第12张图片

数据增强:

数据增强我们主要使用了 imgaug 这个库:
全球人工智能技术创新大赛【赛道二】第三周初赛top-2分享_第13张图片

预训练模型:

我们使用了在COCO目标检测训练的权重作为预训练模型。

后续思路:

    1. 可以尝试知识蒸馏的方法,并可以通过模型量化剪枝等操作加快推理速度,融合更多模型。
    1. 可以将滑窗预测改成批处理,加快推理速度。

联系作者:

微信号:Sharpiless(请备注“阿里天池”),缺卡,招募队友中。

我的公众号:

你可能感兴趣的:(深度学习-目标检测,网络,机器学习,深度学习,人工智能,计算机视觉)