在自己的数据集上训练CrowdDet过程记录

论文链接:https://readpaper.com/pdf-annotate/note?noteId=656650387498369024&pdfId=542662939605901312

github链接:https://github.com/Purkialo/CrowdDet

一:在CrowdDet上训练CrowdHuman数据集:

      1.CrowdHuman数据集

        ①下载链接:CrowdHuman Dataset。

        ②数据集介绍:

        在自己的数据集上训练CrowdDet过程记录_第1张图片

        其中训练集分为3部分,名字分别为CrowdHuman_train01.zip,CrowdHuman_train01.zip,CrowdHuman_train01.zip,数量都是5k张;测试集为CrowdHuman_test.zip,数量为5k,验证集为CrowdHuman_val.zip,数量是4370张。odgt文件则是标签,里面有全身标注,行人可见部分标注以及head部分标注。

2.训练CrowdHuman数据集

     在自己的数据集上训练CrowdDet过程记录_第2张图片 ①:在config.py中,图上所标注的路径都是需要修改成自己项目中的路径,例如:我的"annotation_train.odgt"存放路径为"/home/mobu/CrowdHuman/annotation_train.odgt",则train_source的路径需要改成这个,另外附上预训练模型链接:https://drive.google.com/file/d/1lfYQHC63oM2Dynbfj6uD7XnpDIaA5kNr/view?usp=sharing。

在自己的数据集上训练CrowdDet过程记录_第3张图片

②:image_folder表示CrowdHuman图片存放的地方,前面下载的zip文件会解压到一个叫‘Images’的文件夹,所以上图标示部分应该是大写的‘Images’,另外路径也需要修改,参考第一点。

在自己的数据集上训练CrowdDet过程记录_第4张图片

③:解压出来的图片后缀名都是'.jpg',所以需要将'.png'修改为'.jpg'

一般来说,这几个地方修改之后就可以在CrowdHuman数据集上训练CrowdDet了。

二:自定义数据集训练

①我的数据集格式

在自己的数据集上训练CrowdDet过程记录_第5张图片

         如图所示,前面是图片路径,后面是一个列表中套字典的格式,每个字典中有左上角和右下角的标注以及目标类别。

②CrowdDet中的dataset

        CrowdDet的dataset在lib/data/CrowdHuman.py,根据我的数据格式对相关地方做修改即可。

首先修改对数据的解析方式,返回一个标签列表:

在自己的数据集上训练CrowdDet过程记录_第6张图片 

 parse_lines函数如下:

在自己的数据集上训练CrowdDet过程记录_第7张图片

接下来修改图片路径以及对标签的解析方式 :在自己的数据集上训练CrowdDet过程记录_第8张图片

 parse_record函数如下:

在自己的数据集上训练CrowdDet过程记录_第9张图片

         需要注意的是,CrowdHuman数据中box列表中4个值的格式是[x0, y0, w, h],即左上角的点和宽高,所以我们处理的时候也需要做转换。

在自己的数据集上训练CrowdDet过程记录_第10张图片

 最后再把验证阶段也修改一下就大功告成了!

你可能感兴趣的:(人工智能项目实战,深度学习,pytorch,视觉检测)