摘要:在高浩看来,大量的数字蓝领人才和AI应用开发人员构成了当前AI行业发展人才之基,这也为高校学生就业初期从事的工作指明了方向,而华为ModelArts平台在教育领域有着天然的数据、算法优势,非常适合AI教学。
高浩,华为云MVP,南京航空航天大学硕士毕业,曾就职于某研究所集团公司。先后从事大数据开发与数据挖掘工作,擅长机器学习和数据分析。现任江苏知途教育科技有限公司人工智能课程研发负责人,“1+X” 计算机视觉应用开发认证(初级,中级)副主编,高级认证讲师。
从人工智能被写入政府工作报告,到如今高校遍地开花的人工智能专业,AI作为下一阶段科学变革浪潮的新引擎,正在渗透到各行各业,当行业进入高速发展期,市场对高端人才的需求和依赖性也随之攀升。
高浩一直从事大数据开发与数据挖掘工作,擅长机器学习和数据分析,现在担任江苏某教育科技公司的人工智能课程研发负责人。
在他看来,大量的数字蓝领人才和AI应用开发人员构成了当前AI行业发展人才之基,这也为高校学生就业初期从事的工作指明了方向,而华为ModelArts平台在教育领域有着天然的数据、算法优势,非常适合AI教学。
为什么选择ModelArts?
AI应用的开发非常复杂,主要体现在开发流程冗长、烦琐,包括数据准备、算法开发、模型开发、应用生成、部署和维护等多个环节,链路很长,每个环节都需要大量人力和计算资源的投入。
AI开发需要的实验环境或者平台资源昂贵,传统的实践教学体系与市场岗位、企业项目脱、产业发展、以及个人职业发展脱节。
除此之外,AI的三个关键要素:算法、算力和数据,一方面推动了AI技术的应用落地,但也提高了学习上手的门槛。
考虑到这些难题,高浩在调研了多家厂商的开发平台后,最终选择了一站式AI开发平台ModelArts。“算法可以采用平台中已有的通用算法,缩短建立时间,降低技术人员的入门门槛。算力可以根据按需方式租用GPU服务器,降低研究的前期投入。”
高浩表示,ModelArts的教学指南非常完整,它系统地介绍了AI应用开发全流程及其子流程,包括数据准备、算法选择和开发、模型训练、评估和调优等,以及人工智能应用开发场景化实践。
通过一整套工具链和方法传递,每个开发者都可以借助ModelArts在具体业务场景下更快、更高效、更低成本地开发AI应用,从而更好地解决实际问题。高浩认为,这样从教学实施角度上也更有普适指导意义。
为了进一步阐释ModelArts的易用性,高浩详细演示了一个基于ModelArts和HiLens的云、边、端协同的AI应用开发案例。
快速上手ModelArts
ModelArts 的“一站式”体现在它囊括了AI开发的各个环节,包括数据处理、算法开发、模型训练、模型部署等等,而且面向不同经验的开发者,提供相匹配的使用流程。
内容方面,ModelArts支持图像分类、图像检测、视频分析、语音识别、产品推荐、异常检测等多种AI应用场景。功能方面,它支持从数据处理到算法开发、训练、部署、开发流程管理等多种功能。如下图所示:
其中,核心部分主要包括数据处理和模型的管理。
1、数据的处理
在ModelArts中,我们都是以数据集为数据基础,进行模型开发或训练等操作的。创建数据集前需要获取访问OBS的权限。
目前,ModelArts支持如下9种类型的数据集,包含图片、音频、文本和其他类别:
• 图像分类
• 物体检测
• 声音分类
• 语音内容
• 语音分割
• 文本分类
• 命名实体
• 文本三元组
• 自由格式
针对创建好的数据集,可以执行标注数据、发布、版本管理、修改、导入和删除等操作。
以图像分类为例,只需要给图片添加相应的标签即完成标注。物理检测的话,则需要在图片中使用标注框来框出标注对象,并打上标签,其余与图像分类相似。
此处强调一下命名实体数据集,命名实体场景是针对文本中的实体片段进行标注,如“时间”、“地点”等。与文本分类不同的是,它需对片段进行标注,而不是全文。
文本三元组标注则适用于标注语句当中形如(主语/Subject,谓词/Predicate,宾语/Object)结构化知识的场景,标注时不但可以标注出语句当中的实体,还可以标注出实体之间的关系,其在依存句法分析、信息抽取等自然语言处理任务中经常用到。
声音方面,主要是根据播放内容,在 “语音内容”文本框中填写音频内容,完成标注。
2、模型训练管理
数据处理完成后,接下来就是模型的训练。ModelArts可以基于不同的数据选择不同规格的资源池(CPU或GPU),根据用户选择的数据量和资源不同,模型训练通常耗时几分钟到几十分钟不等。
同时,ModelArts也支持查看模型训练的情况并及时调整模型参数。
除支持用户自己开发的模型外,ModelArts还提供了AI市场算法,开发者能直接使用已有的算法,再通过简单的调参得到一个满意的模型。
模型训练之后,ModelArts模型管理可导入所有训练版本生成的模型,统一管理迭代和调试的模型,同时它还支持从模板、容器镜像以及OBS等场景导入模型,方便模型的部署上线。
另外,ModelArts提供了模型转换功能,可以将已有的模型转换成所需格式,以便应用于算力和性能更高的芯片上。举个例子,用Tensorflow框架训练的模型,使用转换功能可转换成om格式,即可在昇腾芯片上部署运行。
端侧看HiLens,让AI应用快速落地
学会用ModelArts做好模型训练后,端侧的开发平台HiLens可以让AI应用落地更简单,高浩也谈了谈他使用HiLens的感受。
HiLens是端云协同多模态AI开发应用平台,它提供简单易用的开发框架、开箱即用的开发环境、丰富的AI技能市场和云上管理平台,对接多种端侧计算设备如HiLens Kit,支持视觉及听觉AI应用开发、AI应用在线部署、海量设备管理等。
高浩表示,购买HiLens Kit的普通用户如果需要快速安装技能到设备,使其具备AI能力,可以到技能市场购买技能,基本流程如下:
对于具备编程能力的用户,也可以选择自己创建技能。
购买或者创建好技能后,就是对其进行部署,具体可以前往数据管理查看技能效果。
基于HiLens,高浩准备开发了一个检测施工现场作业人员是否佩戴安全帽的应用。
他在创建好相对应的技能后,使用HDMI视频线连接HiLens Kit视频输出端口和显示器,然后点击后台管理中的启动技能,当状态变为“运行中”,表明技能成功运行在端侧设备上。
最后应用的结果如下:
总的来说,开发这样一个检测工地施工安全的应用其实很简单,先用云端的ModelArts进行数据处理和模型训练,然后再借助HiLens将模型部署到端侧,最后就能得到一个可以落地的AI应用。
本文分享自华为云社区《【智能时代,AI无处不在】华为云MVP高浩:打破AI开发瓶颈,解决数据、算法、算力三大难题》,原文作者:我们都是云专家。