英特尔开源计算机视觉数据标签工具CVAT,加速数据注释

\n

训练深度神经网络需要大量数据。另外,如果数据没有标签,那这些数据就没有多大用处,AI架构也无用武之地,但处理包含数十万、数百万对象的语料库非常耗时。

\n
\n
\n

为了减轻数据注释器和数据科学家的负担,英特尔开源了一个新源程序——计算机视觉注释工具(CVAT),以加速用来训练计算机视觉算法的视频和图像样本注释。

\n
\n

GitHub开源地址奉上,感兴趣的同学可以试一试:
\nhttps://github.com/opencv/cvat

\n

“为了加速计算机视觉领域的这一过程,[我们]开发了一个名为[CVAT]的程序,”英特尔在一篇博文中写道。 “通常,有很多方法可以注释数据,但使用特殊工具[如CVAT]可能有助于加快这一过程。”

\n

正如Santa Clara公司所解释的那样,CVAT通过Docker进行部署,并通过基于浏览器的界面(或者可选地嵌入到Onepanel等平台中)进行访问,并具有针对协同工作优化的基于任务的管理系统。(用户创建公共任务以将工作分开。)它支持与对象检测、图像分类和图像分割相关的监督机器学习任务,以及具有四种类型之一的注释:框、多边形、折线和点。

\n

\n
使用CVAT注释汽车和障碍物。\n

在CVAT中,注释器可以使用大量工具来复制和传播对象、应用过滤器、调整视觉设置,以及通过谷歌的TensorFlow框架中的对象检测API执行自动注释等。CVAT会自动执行一些检查(但不是所有检查,有些检查需要手动进行),且可与英特尔的OpenVino、英伟达的Cuda和ELK(Elasticsearch、Logstash和Kibana)分析系统等工具包很好地配合使用。

\n

但是,CVAT仍在继续完善,英特尔表示,目前仅在Chrome上进行了广泛测试,在其他浏览器上可能会不好用,并表示Chrome 中的沙盒功能Sandbox限制了流程周围的环境,包括使用RAM,这会对工具包的性能产生负面影响。但英特尔承诺将会改进这一点。

\n

“CVAT是在专业注释和算法团队的支持下开发的,我们想要为这些团队提供最有价值的功能…用户的反馈有助于英特尔确定CVAT未来的发展方向,”该公司表示。“我们希望改进工具的用户体验、功能集、稳定性、自动化功能以及与其他服务集成的能力,并鼓励社区成员积极参与CVAT的开发。”

\n

在CVAT发布几周前,Uber开源了自动可视化系统(一个基于网络的车辆数据平台),之后,Scale和Hive等样本标签初创公司也筹集了大量的风险投资,并吸引了优步和通用汽车等大厂的关注。

\n

参考链接:https://venturebeat.com/2019/03/05/intel-open-sources-cvat-a-toolkit-for-data-labeling/

\n

\n

你可能感兴趣的:(英特尔开源计算机视觉数据标签工具CVAT,加速数据注释)