华为Ascend众智计划项目--3DMPPE_ROOTNET--Pytorch模型迁移至NPU(一)

系列文章目录

项目信息、本地GPU单卡复现:
华为Ascend众智计划项目–3DMPPE_ROOTNET–Pytorch模型迁移至NPU(一)

模型迁移——本地代码添加:
华为Ascend众智计划项目–3DMPPE_ROOTNET–Pytorch模型迁移至NPU(二)

模型迁移——服务器GPU-2P调试和NPU单卡调试:
华为Ascend众智计划项目–3DMPPE_ROOTNET–Pytorch模型迁移至NPU(三)

模型迁移——NPU单P性能和精度调优:
华为Ascend众智计划项目–3DMPPE_ROOTNET–Pytorch模型迁移至NPU(四)

模型迁移——NPU-8P调试:
华为Ascend众智计划项目–3DMPPE_ROOTNET–Pytorch模型迁移至NPU(五)

文章目录

  • 系列文章目录
  • 前言
  • 一、项目信息
    • 1.项目简介
    • 2.环境信息
    • 3.训练阶段里程碑
    • 4.相关参考网站和文档
  • 二、本地GPU单卡复现
    • 1.下载数据集
    • 2.本地运行
  • 总结
  • 参考文献


前言

  本系列文章记录笔者在完成华为昇腾众智项目的主要过程、遇到的问题及解决方案等。Ascend 众智计划是华为围绕 Ascend 基础软件平台推出的一项生态合作计划,旨在汇聚高校、科研院所、企业等组织和机构的开发团队,通过项目合作方式,基于 Ascend 基础软硬件平台开发算子、网络模型及行业参考设计,不断丰富 Ascend 计算产业生态,为加速千行百业智能化升级贡献智慧与力量。笔者负责的是姿态识别模型3DMPPE_ROOTNET的训练任务,该模型是基于Pytorch框架实现的。



一、项目信息

1.项目简介

模型名:3DMPPE_ROOT NET
算法场景:3D 姿态估计
论文链接:https://arxiv.org/abs/1907.11346
代码链接:https://github.com/mks0601/3DMPPE_ROOTNET_RELEASE
目标配置:RootNet
参考精度 :MRPE120.0   MuCo
目标数据集:Human3.6M  AP_25(percentage)31.0
因为Human3.6M数据集过大,经过讨论后最终将训练数据集换为MuCo(3D数据集)和MPII(2D数据集),测试数据集为MuPoTS,参考精度也改为MuCo数据集的参考精度。作者提供了多个可供训练和测试的数据集,每次训练需要至少一个3D数据集和一个2D数据集,测试数据集也需要与训练数据集对应。具体可参阅代码中的md文件。

2.环境信息

Python 3.6.5
Pytorch 1.5.0(华为NPU所使用的Pytorch版本)
其余GPU环境复现时安装对应版本的Pytorch、CUDA、cuDNN,可以跑通即可。
pytorch + cuda + cudnn 配置完整教程

3.训练阶段里程碑

  • Step 0: 本地模型调试
  • Step 1: 1 卡 GPU 精度和性能复现
  • Step 2: 8 卡 GPU 精度和性能复现
  • Step 3: 1 卡 NPU 精度和性能对齐
  • Step 4: 8 卡 NPU 精度和性能对齐

4.相关参考网站和文档

昇腾社区
Ascend:昇腾万里,让智能无所不及
Pytorch训练指导 - Wiki - Gitee.com
深度学习框架:Pytorch3 (基于 Pytorch 1.5.0)
PyTorch&ONNX众智一站式导航

二、本地GPU单卡复现

1.下载数据集

训练数据集选用的是MuCo和MPII,测试数据集为MuPoTS。参考代码中的MD文件下载所需数据集和JSON文件。

2.本地运行

  • 本地运行相对来说较为简单,只要能跑通作者所提供的的代码,并且达到论文中的精度即可。

  • 本地运行时主要遇到的还是环境方面的问题,如缺少提示缺少“cv2”,解决方案:
    pip install opencv-python

  • 另外在安装pycocotools时,遇到了C++环境编译的问题,尝试安装Visual Studio后仍然无法解决,报错如下:
    command ‘ cl.exe‘ failed: No such file or directory
    最后的解决方案可以看这篇博客。
    command ‘ cl.exe‘ failed: No such file or directory 问题的另一种解决办法

  • GPU单卡的运行环境是:
    Pytorch 1.7.0
    CUDA 10.1
    cuDNN 8.0.5(.h文件的版本显示好像存在问题,具体可以可以跑通即可)
    本地运行的GPU为2080S,一次训练需要20个epoch,原文作者使用两张1080ti花费了两天时间。


总结

本文介绍了项目信息和本地复现论文代码的情况。


参考文献

https://www.hiascend.com/ecosystem/all-wisdom

你可能感兴趣的:(华为-Ascend,pytorch,华为,深度学习,python)