基于transformer模型的车辆行人识别

背景:

一位在读研究生通过我一个大学同学找我,让我花点时间帮他研究一下基于transformer模型的车辆行人识别,要求代码能够训练、加载模型测试、并要有适当的讲解解答。

思路:

具体思路很简答,需要搜集以下相关资料并研读,这花费了我不少时间:

1.标注好的行人车辆数据集

2.基于transformer模型的算法调试及相关文献研读

3.相关的服务器环境搭建

数据集:

目前目标检测领域,大多数是以coco数据集或者VOC数据集为参考,这里最终选取了coco数据集。需要说明的是,coco数据集本身比较庞大,而且要划分的类别也比较多,需要对其进行筛选,达到自己的需求才可以。

数据集下载网址如下:链接:https://pan.baidu.com/s/1OsO7b88_abuyaPn8frkzTw 
提取码:ojyq

数据集标注使用参考:https://www.jianshu.com/p/4a015f0b6fcf

解压缩后目录如下:data-->coco---->

基于transformer模型的车辆行人识别_第1张图片

data-->coco---->annotations:

图片目录如下:

基于transformer模型的车辆行人识别_第2张图片

 该数据集中,训练集train2017图片2101张,验证集val2017图片450张,测试集test2017图片449张。

算法:

算法重点参考DETR和DAB-DETR。

环境:

ubuntu20.04+python3.8+cuda

测试效果:

 

 

你可能感兴趣的:(深度学习,transformer,深度学习,机器学习)