基于MindStudio的MindX SDK应用开发全流程
相关课程:昇腾全流程开发工具链(MindStudio)
本课程主要介绍MindStudio在昇腾AI开发中的使用,作为昇腾AI全栈中的全流程开发工具链,提供覆盖训练模型、推理应用和自定义算子开发三个场景下端到端工具,极大提高开发效率。
建议开发前,学习该课程的第1章和第3章,可以少走很多弯路!!!
MindStudio提供您在AI开发所需的一站式开发环境,支持模型开发、算子开发以及应用开发三个主流程中的开发任务。依靠模型可视化、算力测试、IDE本地仿真调试等功能,MindStudio能够帮助您在一个工具上就能高效便捷地完成AI应用开发。MindStudio采用了插件化扩展机制,开发者可以通过开发插件来扩展已有功能。
MindStudio功能框架如图1-1所示,目前含有的工具链包括:模型转换工具、模型训练工具、自定义算子开发工具、应用开发工具、工程管理工具、编译工具、流程编排工具、精度比对工具、日志管理工具、性能分析工具、设备管理工具等多种工具。
图1-1 工具链功能架构
MindStudio工具中的主要几个功能特性如下:
具体安装操作请参考:MindStudio安装指南 MindStudio环境搭建指导视频
MindX SDK提供昇腾AI处理器加速的各类AI软件开发套件(SDK),提供极简易用的API,加速AI应用的开发。
应用开发旨在使用华为提供的SDK和应用案例快速开发并部署人工智能应用,是基于现有模型、使用pyACL提供的Python语言API库开发深度神经网络应用,用于实现目标识别、图像分类等功能。
图2-1 MindX SDK总体结构
通过MindStudio实现SDK应用开发分为基础开发与深入开发,通常情况下用户关注基础开发即可,基础开发主要包含如何通过现有的插件构建业务流并实现业务数据对接,采用模块化的设计理念,将业务流程中的各个功能单元封装成独立的插件,通过插件的串接快速构建推理业务。
mxManufacture & mxVision关键特性:
步骤1 Windows场景下基于MindStuido的SDK应用开发,请先确保远端环境上MindX SDK软件包已安装完成,安装方式请参见《mxManufacture 用户指南》 和《mxVision 用户指南》 的“使用命令行方式开发”>“安装MindX SDK开发套件”章节。
步骤2 在Windows本地进入工程创建页面,工具栏点击File > Settings > Appearance & Behavior > System Settings > MindX SDK进入MindX SDK管理界面。界面中MindX SDK Location为软件包的默认安装路径,默认安装路径为“C:\Users\用户名\Ascend\mindx_sdk”。单击Install SDK进入Installation settings界面,如图2-2。
图2-2 MindX SDK管理界面
如图2-3所示,为MindX SDK的安装界面,各参数选择如下:
图2-3 MindX SDK安装界面
图2-4 安装完成后的MindX SDK管理界面
步骤3 单击OK结束,返回SDK管理界面,可查看安装后的SDK的信息,如图2-4所示,可单击OK结束安装流程。
通过stream(业务流)配置文件,Stream manager(业务流管理模块)可识别需要构建的element(功能元件)以及element之间的连接关系,并启动业务流程。Stream manager对外提供接口,用于向stream发送数据和获取结果,帮助用户实现业务对接。
Plugin(功能插件)表示业务流程中的基础模块,通过element的串接构建成一个stream。Buffer(插件缓存)用于内部挂载解码前后的视频、图像数据,是element之间传递的数据结构,同时也允许用户挂载Metadata(插件元数据),用于存放结构化数据(如目标检测结果)或过程数据(如缩放后的图像)。
图4-1 SDK业务流程相关基础单元
MindX SDK实现功能的最小粒度是插件,每一个插件实现特定的功能,如图片解码、图片缩放等。流程编排是将这些插件按照合理的顺序编排,实现负责的功能。可视化流程编排是以可视化的方式,开发数据流图,生成pipeline文件供应用框架使用。图 4-2 为推理业务流Stream配置文件pipeline样例。配置文件以json格式编写,用户必须指定业务流名称、元件名称和插件名称,并根据需要,补充元件属性和下游元件名称信息。
步骤1 进入工程创建页面,用户可通过以下方式开始流程编排。在顶部菜单栏中选择Ascend>MindX SDK Pipeline,打开空白的pipeline绘制界面绘制,也可打开用户自行绘制好的pipeline文件,如图4-3。
绘制界面分为左侧插件库、中间编辑区、右侧插件属性展示区,具体参考pipeline绘制 。
步骤2 在左侧编辑框选择插件,拖动至中间编辑框,按照用户的业务流程进行连接。如果拖动错误插件或者错误连线,选中错误插件或者错误连线单击键盘Del键删除。用户自定义的流水线绘制完成后,选中流水线中的所有插件,右键选择Set Stream Name设置Stream名称,如果有多条流水线则需要对每一条流水线设置Stream名称。绘制完成单击Save保存。
图4-2 Detection and Classification配置pipeline样例
图4-3 pipeline绘制界面
超分辨率生成对抗网络(SRGAN)是一项能够在单幅超分辨率图像中生成逼真纹理的开创性工作。 然而,产生幻觉的细节往往伴随着令人不快的伪影。 为了进一步提高视觉质量,我们深入研究了SRGAN的三个关键组成部分——网络结构、对抗损失和感知损失,并对它们进行改进,得到了一个增强的SRGAN (ESRGAN)。 特别地,ESRGAN引入了没有批处理规格化的残差-残差密集块(RRDB)作为基本网络构建单元。 此外,ESRGAN借鉴了GAN的思想,让鉴别器预测相对真实而不是绝对值。最后,ESRGAN利用激活前的特征来改善知觉损失,为亮度一致性和纹理恢复提供更强的监督。得益于这些改进,ESRGAN实现了比SRGAN更好的视觉质量和更真实和自然的纹理,并赢得了PIRM2018-SR挑战赛的第一名。如图所示,ESRGAN网络结构,如图4-1所示:
图4-1 ESRGAN网络结构
代码地址:
models: Models of MindSpore - Gitee.com
SDK相关工程目录结构,如图4-2所示:
图4-2 SDK相关工程目录结构
代码地址:
models: Models of MindSpore - Gitee.com
下载代码存放到本地,在本项目中只使用MindX SDK功能,所以只用到infer/sdk中的代码。
数据集使用的是Set5,在infer/sdk/目录下先创建两个文件夹“./Set5/HR/”, “./Set5/LR/”,将以“…HR.png”命名的图片保存到“./Set5/HR/”文件夹中, 以“…LR.png”命名的图片保存到“./Set5/LR/”文件夹中。
https://download.mindspore.cn/model_zoo/r1.3/esrgan_ascend_v130_div2k_research_cv_bs16_set5psnr32.5_set14psnr26.34/esrgan_ascend_v130_div2k_research_cv_bs16_set5psnr32.5_set14psnr26.34.ckpt
先在910上导出air模型文件,保存到infer/sdk目录下。
步骤1在顶部菜单栏中选择File > open,选择如图所示,sdk这一级的目录,
步骤2 在顶部菜单栏中选择Ascend > Convert To Ascend Projec,进入如图6-1所示页面,各参数选择如图所示,点击OK,将该项目转换为Ascend MindX SDK App。
图6-1 转换为Ascend MindX SDK App
用户使用Caffe/TensorFlow等框架训练好的第三方模型,可通过ATC工具将其转换为昇腾AI处理器支持的离线模型(*.om文件),模型转换过程中可以实现算子调度的优化、权重数据重排、内存使用优化等,可以脱离设备完成模型的预处理,详细架构如图7-1所示。
图7-1 ATC工具功能架构
在本项目中,要将mindspore框架下训练好的模型(*.air文件),转换为昇腾AI处理器支持的离线模型(*.om文件),具体步骤如下:
步骤1 点击Ascend > Model Converter,进入模型转换界面,参数配置如图7-2所示,若没有CANN Machine,请参见第八章第一节CANN安装。
图7-2 模型转换界面1
各参数解释如下表所示:
CANN Machine |
CANN的远程服务器 |
Model File |
*.air文件的路径(可以在本地,也可以在服务器上) |
Model Name |
生成的om模型名字 |
Output Path |
生成的om模型保存在本地的路径 |
图7-3 模型转换界面2
图7-4 模型转换界面3
步骤2 点击Next进入图7-3界面,该项目数据不需要预处理,直接点击Next,进入图7-4界面,再点击Finish开始模型转换。
步骤3 等待出现如图7-5所示的提示,模型转换成功
图7-5 模型转换成功
步骤4 双击转换成功的om模型文件,可以查看网络结构。如图7-6所示
图7-6 查看模型网络结构
步骤1 修改“sdk/config/esrgan.pipeline”中的参数,具体操作如图8-1所示;
图8-1 修改pipeline中*.om文件路径
步骤2 在MindStudio工程界面,依次选择“Run > Edit Configurations...”,进入运行配置页面。选择“Ascend App > 工程名”配置应用工程运行参数,图8-2为配置示例。配置完成后,单击“Apply”保存运行配置,单击“OK”,关闭运行配置窗口。
图8-2 工程推理工程运行参数配置
Deployment |
远程服务器 |
Executable |
运行文件 |
Command Arguments |
运行参数 |
在本工程中,推理时运行文件选择main.py,运行参数为
--img_path [LR_path] --pipeline_path [pipeline_path] --infer_result_dir [result_path]
参数解释如下表:
参数 |
解释 |
我的设置 |
img_path |
推理图片路径 |
./Set5/LR/ |
pipeline_path |
Pipeline文件路径 |
./config/esrgan.pipeline |
infer_result_dir |
推理结果保存路径 |
./infer_result/ |
步骤3 点击运行,出现如图8-3所示提示,即为运行成功,infer_result文件夹中即为推理结果,保存为二进制形式。
图8-3 推理操作过程
步骤4 配置后处理运行程序,在MindStudio工程界面,依次选择“Run > Edit Configurations...”,进入运行配置页面,如图8-4所示,点击“+”,后选择Python(后处理可以直接在本地运行),如图8-5所示。
图8-4 运行配置界面
图8-5 选择本地Python解释器
图8-6 运行后处理相关配置
Script path |
运行文件路径 |
Parameters |
运行时的参数 |
如图8-6所示,运行文件为postprocess.py,运行参数为:
--HR_path [HR_image_path] --predict_result [infer_result] --result_path [save_image_path]
相关参数解释及设置
参数 |
解释 |
我的设置 |
HR_path |
数据集中高分辨率图片 |
./Set5/HR/ |
predict_result |
步骤3中的推理结果 |
./infer_result/ |
result_path |
最终结果保存的目录 |
./sdk_result_img/ |
步骤5 点击运行,出现如图8-7所示提示,即为运行成功,sdk_result_img文件夹中即为最终结果,PSNR为推理生成的图片与原图片对比的指标。
图8-7 运行后处理程序
步骤6 结果分析,如图8-8所示,为ESRGAN生成的高分辨率图像与原图像对比,可以看到,在一些细节上生成的图像在细节和纹理上已经很清晰。
图8-8 ESRGAN生成的高分辨率图像与原图像对比
在使用MindStudio时,遇到问题,可以登陆MindStudio昇腾论坛进行互动,提出问题,会有专家老师为你解答。
图9-1 CANN管理界面
解决方案:按以下步骤,重新安装CANN Machine
步骤1 点击File>Settings>Appearance & Behavior > System Settings > CANN,进入CANN管理界面,如图9-1所示:
步骤2 点击Change CANN,进入Remote CANN Setting界面,如图9-2所示重新安装CANN,点击Finish,安装CANN。
9-2 Remote CANN Setting界面
图9-3 安装CANN完成
参数解释如下表:
Remote Connection |
远程服务器IP |
Remote CANN location |
远程服务器中CANN路径 |
步骤3 完成CANN安装,点击OK,重启MindStudio,如图9-3所示。
解决方案:
步骤1 在顶部菜单栏中选择File > Project Structure,在Project Structure窗口中,点击Platform Settings > SDKs,点击上方的“+”添加Python SDK,从本地环境中导入Python,如图9-4所示。
图9-4 导入Python SDK
步骤2 点击Project Settings > Project,选择上一步添加的Python SDK,如图9-5所示。
图9-5 设置Project SDK
步骤3 点击Project Settings > Modules,选中“MyApp”,点击“+”后选择Python,为Python Interpreter选择上述添加的Python SDK。点击OK完成应用工程Python SDK配置,如图9-6所示。
图9-6 选择Python SDK