中国团队助力 OpenCV 4.3.0 发布,深度学习模块 DNN 在 ARM 上性能显著提升

技术编辑:鸣飞 发自北京
SegmentFault 思否报道丨公众号:SegmentFault


OpenCV 4.3.0 正式发布了!这个版本的一个大看点是:OpenCV 的深度学习模块 DNN 在 ARM 上性能显著提升。这一提升是由 OpenCV 中国团队携手 OPEN AI LAB(开放智能)共同完成

中国团队助力 OpenCV 4.3.0 发布,深度学习模块 DNN 在 ARM 上性能显著提升_第1张图片

OpenCV 中国团队于 2019 年 9 月由深圳市人工智能与机器人研究院支持成立,是一个非营利目的团队,致力于 OpenCV 的开发、维护和推广工作。

下图展示了 ARM 上提速情况,可以看出速度最快可以翻倍!在 ARM 上开发产品的工程师,可以降低产品的硬件成本了,你的老板肯定很开心。

中国团队助力 OpenCV 4.3.0 发布,深度学习模块 DNN 在 ARM 上性能显著提升_第2张图片

这个提速是由 OPEN AI LAB 的 CNN 引擎 Tengine 实现的。OpenCV 可无缝调用 Tengine。Tengine 是 OPEN AI LAB(开放智能)自主知识产权的商用级 AIoT 智能开发平台,针对于嵌入式终端平台以及终端 AI 应用场景特点,采用模块化设计为终端人工智能量身打造的高效、简洁、高性能的前端推理计算框架。Tengine 今年主推的点是:自主知识产权的商用级 AIoT 智能开发平台。Tengine 是 ARM CPU 上运行深度学习的最佳选择。

OpenCV 中国团队还有一项新贡献:Hough 圆形检测的算法重写了,由OpenCV 中国团队技术负责人 Vadim Pisarevsky 亲自操刀完成,提升非常大!具体效果可以看下面右图。

中国团队助力 OpenCV 4.3.0 发布,深度学习模块 DNN 在 ARM 上性能显著提升_第3张图片

OpenCV 4.3.0还带来了哪些新功能和提升

  • DNN对很多网络层进行了提升,如ONNS中的LSTM, Broadcasting, Algebra over constants, Slice with multiple inputs;DarkNet中的grouped convolutions, sigmoid, swish, scale_channels;MobileNet-SSD v3
  • 更多OpenVINO后端特性:可通过nGraph添加自定义层
  • 优化CUDA后端,并杀掉一些BUG
  • 可以使用最新的IPP-CV 2020.0.0Gold版本进行CPU优化
  • 使用SIMD指令优化了integral、resize和RLOF实现
  • 更多演示和例子
  • opencv_contrib:增加了Alpha Matting算法
  • calib3d:findChessboardCornersSB算法提升
  • core:getNumberOfCPUs()函数提升
  • imgcodecs:支持OpenJPEG库
  • highgui(Qt):增加到剪切板的复制功能

详情可以参考ChangeLog

源代码下载

https://github.com/opencv/opencv/archive/4.3.0.zip

Windows预编译版下载

https://sourceforge.net/projects/opencvlibrary/files/4.3.0/opencv-4.3.0-vc14_vc15.exe/download

文档页面

https://docs.opencv.org/4.3.0/

GitHub分支

https://github.com/opencv/opencv/tree/4.3.0

ChangeLog

https://github.com/opencv/opencv/wiki/ChangeLog

原文链接:中国团队助力,OpenCV 4.3.0发布了

你可能感兴趣的:(opencv,arm,ai-tengine,open-ai-lab)