第一章 关于Mask R-CNN及课程初衷

文章目录

      • 1.写在前面
      • 2.从0开始
      • 3. 一发不可收拾

1.写在前面

  近一年左右的时间,由于某产品研发过程中涉及到物体分割算法,具体是在一副图像中提取100~200个不同大小、形状各异、有堆叠且密集排列等情况的物体面积。这款产品是升级换代产品,之前一直使用图像处理技术来实现物体的分割,如:动态阈值等。

   图像处理技术在一般工况下,可以完成分割提取,但是对于一些特殊情况分割效果就差强人意了,如混有泥土、物体大小差别较大、物体分布稀疏等情况。由于一直在做机器视觉相关产品的开发,主要使用图像处理技术,对AI视觉了解不多。但是这款产品在很长一段时间都没有突破,在无路可走的情况下,走上了AI视觉的不归路。

  这一路有惊喜、有挫折,可能有很多表达上差强人意的行文,请读者朋友莫怪,我们可以充分交流。写此系列的主要目的是想尽量从产品研发到落地过程中所涉及到的环节一一阐述出来,目前各大网站并没有此种思路完成的博文或教程,鄙人不才,想来试试,从小的方面是对于技术研发的记述,从大的方面也想为AI技术的落地应用尽自己绵薄之力。研发是那些大神多的事情,我感性兴趣的是这东西能不能落地应用。

2.从0开始

  最开始进行目标检测使用的是yoloV3,把图像中的物体检测出来,通过锚框画出来,沾沾自喜之后,总感觉不是那么回事,矩形面积和不规则物体的面积差别属实有点大。在这个过程中完成yoloV3的环境搭建、模型训练、模型部署(基于serving、docker等多种方式),也算是初步了解了AI视觉基础算法环境的搭建到模型部署应用的整个流程,确实收益匪浅。

  在经过一系列的神操作之后Mask R-CNN进入到了我的视线,这要感谢那段茫然的时间在B站闲逛的经历,发现了很多深度学习相关的资源,那个阶段有种求知若渴的尽头,晚上看视频找资料,白天搭环境、跑模型。关注Mask R-CNN是因为在github上它的tensorflow实现源码里面有以下图片,和我做的事情有相似之处(链接:https://github.com/matterport/Mask_RCNN),如果想利用Mask R-CNN进行实例分割的同学,可以下套源码尝试这了解下。

第一章 关于Mask R-CNN及课程初衷_第1张图片

3. 一发不可收拾

  在接触了Mask R-CNN之后, 跑过比较老的tensorflow1.5源码、也搭建了detectron2-AdelaiDet跑过maskrcnn、还有B导的mask-rcnn-keras、mask-rcnn-tf2、以及mmdetetion中的mask_rcnn_r101_fpn_2x_coco、PaddleDetection-release-2.3中的mask_rcnn_r50_vd_fpn_2x_coco等等,只要有maskrcnn的身影,基本上都搭建过环境、跑过模型,分析过源码,搞过部署应用,我会在之后的课程中尽量把这些内容为各位同学介绍一下,尤其在部署应用过程中,由于一些框架平台的不完善,即使算法实现的非常优秀,也只能含泪往后放一放了,所以对于企业来说,一个算法一项技术再牛,最后一公里没打通,啥都不是。

  下一章节开始,我们按着国际惯例先介绍下Mask R-CNN的基本原理、实现流程、相关技术,各种图肯定让你眼花缭乱,恺明大神在算法的细节处理上绝对牛X,我们一起准备好迎接狂风暴雨吧。

  本教程适合那些想在项目中快速掌握应用实例分割,又不想付出太多学习成本的IT老师傅们,同样适合AI视觉相关专业研究生对深度学习实例分割的理解和上手运用。

  

后续会推出配套视频哦!

你可能感兴趣的:(#,计算机视觉,人工智能)