【SWIN-Transformer环境配置及个人VOC数据集的训练】

  本文对在Windows系统下配置mmdetection环境并通过SWIN+MASK R-CNN网络对个人的VOC格式的数据集过程中遇到的问题进行总结,偏向于是对一些问题解答博客的汇总。

环境配置

  环境配置我参考了下文博客: https://blog.csdn.net/CSDN_X_W/article/details

1.安装pytorch

  使用annaconda安装,pytorch安装的版本是1.8.0,cuda安装的是11.1
   需要注意:一定不要在半夜下载,因为会很慢,不管是镜像源还是官网的下载命令。

2.安装mmcv

  因为mmdetection需要依赖于mmcv,所以需要先安装mmcv。mmcv要访问如下网址进行下载(cuda11.0+torch1.7.0的下载网址)
  https://download.openmmlab.com/mmcv/dist/cu110/torch1.7.0/index.html
【SWIN-Transformer环境配置及个人VOC数据集的训练】_第1张图片

  可以看到这清一色的linux,所以win用不了。看到有人说有些高版本的支持Windows了,所以下载了高版本的mmcv(cuda11.1+torch1.8.0)https://download.openmmlab.com/mmcv/dist/cu111/torch1.8.0/index.html
【SWIN-Transformer环境配置及个人VOC数据集的训练】_第2张图片
  但是我下的win版本的mmcv最后没测试成功,所以就还是按照使用VS2019编译的方法进行了。大家可以尝试下载一下新版本的,可能是我操作有问题。

  • 安装VS2019没什么问题,设置好环境变量就行了。
  • mmcv下载好之后解压到annconda创建的新环境中
  • Anaconda Powershell Prompt进入到 mmcv 目录下,执行 pip install -r requirements.txt安装所需的包
  • 配置环境变量:
    • $env:TORCH_CUDA_ARCH_LIST=“8.6” // >3060显卡算力8.6
    • $env:MMCV_WITH_OPS = 1
    • $env:MAX_JOBS = 8 根据CPU核心数设置
  • 运行:python setup.py build_ext(这步包括下面的一步就会用到之前VS中的cl工具)
  • 运行:python setup.py develop
  • 验证:codna list 会看到 mmcv-full
  • 正常流程如上,但是我在执行python setup.py build_ext的时候报错了,报错信息为:
 fatal error LNK1181: 无法打开输入文件“...\mmcv_1.3.17\build\temp.win-amd64-cpython-38\Release\.\mmcv\ops\csrc\pytorch\cuda\assign_score_withk_cuda.obj

  也就是VS没有编译成功,这个问题困扰了好久。后来关机后,第二天起来就成功了,可能安装完VS配置好环境变量后没有重启的原因?

3.安装mmdetection以及apex

  第二步成功后,直接按照上面博客进行操作即可安装成功,最终mmdet被更新到了2.11.0版本。

4.下载权重并进行测试

测试代码:python demo/image_demo.py demo/demo.jpg configs/swin/mask_rcnn_swin_tiny_patch4_window7_mstrain_480-800_adamw_3x_coco.py mask_rcnn_swin_tiny_patch4_window7.pth

   写的代码是那种需要传参的类型的,每次都要终端执行语句,应该可以在传参函数处把default值改成需要的值

结果如下图:
【SWIN-Transformer环境配置及个人VOC数据集的训练】_第3张图片

训练个人VOC数据集

  下面这篇博客介绍了训练个人数据集需要修改的相关操作
https://blog.csdn.net/CSDN_X_W/article/details/123664693?spm=1001.2014.3001.5502
  但是他讲的是COCO数据集,VOC数据集的话有一个分割的文件夹,因为MASK R-CNN的也是进行实例分割,所以VOC是十分适合这个网络的。但是!如果我们自己的VOC数据集没有分割的那部分,用MASK训练会报错。所以需要把MASK操作给屏蔽掉,具体步骤参考下方博客:
https://blog.csdn.net/qq_36622589/article/details/124355564
如果没有屏蔽会报错:TypeError: 'NoneType' object is not iterable
  训练过程中很慢,建议多GPU训练,不然真的会很慢。一直出现损失为Nan的情况,不知道是不是因为屏蔽了MASK的原因啊,很烦…

你可能感兴趣的:(目标检测,transformer,深度学习,人工智能)