如何学习open CV

如何学习opencv_视觉一只白的博客-CSDN博客_opencv学习

本文授权转载自贾老师的微信公众号"OpenCV学堂"。更多信息可扫描文末二维码关注公众号(知乎已将二维码转换成链接,可自动跳转到微信)。


一:学习OpenCV三个阶段

人工智能带火了计算机视觉的人才需求,作为计算机视觉应用开发框架OpenCV也越来越受到欢迎,市场需求大增,很多人听说了之后就迫不及待的想加入这波大军,这其中很多人他可能懂应用编程,但是计算机视觉零基础,一般都是我要识别个什么,而且还有时间限制,一般都是一个月左右时间,急功近利的心态可见一斑。

学了几个API之后看到了点效果就觉得OpenCV也没什么嘛,感觉跟我搞应用开发一样啊,很快上手啦,就在这个时候发现应用场景稍微有点改变,之前那一点点的效果也没有了,什么都识别不了,然后又发现还有这么多东西要学,才发现这个算法没听说过、那个算法不知道,甚至连他自己调用的算法API那些参数是什么意思也没搞懂怎么调,于是他们就会抱怨OpenCV做的也太差了,压根不行啊,才发现做计算机视觉好难,其实是他们学习OpenCV的打开方式不对。

正确的打开方式应该是这样:首先学习基础,如何知道自己的图像处理与计算机视觉的基础如何呢,很简单,如果你能正确回答下面的十个问题,那说明你还是有点图像处理基础的。

1.图像常见的格式有

  • A.jpg
  • B.tiff
  • C.png
  • D.webp

2.常见的图像通道数可能是:

  • A. 单通道
  • B.双通道
  • C. 三通道
  • D.四通道

3.数字图像中最小数据单元是什么

  • A. 像素
  • B.亚像素
  • C.超像素
  • D.颜色

4.常说的图像滤波是什么数学原理

  • A. 傅立叶变换,
  • B.离散余弦变换
  • C.卷积
  • D.距离变换

5.常见的图像插值算法有

  • A. 最近邻
  • B. 双立方
  • C. lanczos插值
  • D.双线性

6.常见的RGB图像每个像素点颜色值范围

  • A. 0~1
  • B. 0~256
  • C.0~255
  • D.0~180

7.关于RGB色彩的描述下面正确的是:

  • A.RGB(255,255,255)表示黑色
  • B.RGB(0,0,255)表示蓝色
  • C.RGB(255,0,0)表示绿色
  • D.RGB(0,0,0)表示白色

8.常见的图像色彩空间有:

  • A. HSL
  • B. HSV
  • C. RGB
  • D. YCrCb

9.常见的图形绘制时候像素渲染方法有

  • A.四邻域渲染
  • B.八邻域渲染
  • C.透明通道混合反锯齿渲染
  • D.游戏渲染

10.下面关于RGB图像亮度与对比度说法正确的是

  • A.颜色值越高,亮度越高
  • B.降低图像亮度会影响图像对比度
  • C.亮度就是图像对比度
  • D.图像对比度就是图像直方图

上面10道题是图像处理基础知识考察,其考察目的是检验是否拥有学习OpenCV一些必备的基础知识,如果你一半都没有做对(关注公众号,发送 【答案】两个字,即可查看答案),我觉得暂时你应该先放下你的那些识别、检测的目标,而是老老实实的看视频课程或者图书、博客文章等,厘清这些基本概念,本人根据自己学习图像处理、计算机视觉与OpenCV亲身经历,总结一个学习路线图,仅供大家参考:

大致分为三个阶段,第一个阶段应该是基础,第二个阶段是提升、第三个阶段是应用,而很多初学者一般都看重的是第三部分,素不知前面还有N多东西没学,正所谓“千里之行,始于足下”。只有走好学习OpenCV的第一步我们才能走好剩下的999步。否则就会出现“欲速则不达”的尴尬局面,貌似懂,一做应用什么都不行,调用哪个OpenCV算法函数都无法解决问题的进退维谷之中。

二:做内外兼修的OpenCV开发者

OpenCV3.x中集成了超过1000个算法模块,这些算法如何组合使用,他们的参数意义,算法的原理与适用场景条件等各不相同,要成为一个真正的OpenCV开发高手,必须精通常见的算法原理,各个参数意义,参数使用等。

就拿我们最常见的OpenCV中HAAR人脸检测来说吧,整个代码演示我可以做到20行以内实现,但是具体到应用场景,我就听到有人跟我说HAAR级联人脸检测速度太慢了这样的抱怨,原因是他连最基本的各个参数是什么意思都没搞清楚,更谈不上调参数优化啦HAAR级联检测器API调用如下:

 
  1. void cv::CascadeClassifier::detectMultiScale

  2. (

  3. InputArray image,

  4. std::vector & objects,

  5. double scaleFactor = 1.1,

  6. int minNeighbors = 3,

  7. int flags = 0,

  8. Size minSize = Size(),

  9. Size maxSize = Size()

  10. )

  • 第一个参数image是输入图像 第二个参数objects检测到的人脸BOX位置信息
  • 第三个参数是放缩比率,这个参数是用来构建HAAR多尺度用的
  • 第四个参数是计算人脸BOX的最小相邻个数 第五个参数是标志,在OpenCV3.0以后的版本中已经不再使用,没有任意意义
  • 第六个参数是检测人脸时,可以检出BOX的最小宽高
  • 第七个参数是检测人脸时,可以检出BOX的最大宽高

上述的七个参数,对检测速度与检测结果影响比较大的分别是第三、第四、第六、第七个参数,第六与第七个参数是设置大小,这个很容易理解,比较难理解的是第四个,最小相邻个数,假设最小相邻数目取3、则有下图:

表示在最终红色BOX人脸检测结果是基于HAAR级联检测砖红色、青色、蓝色框的求得平均值得到红色BOX框,理论上3表示至少有三个候选,这个参数值越大,检测结果输出人脸的准确率越高,同样耗时也会越长、还会导致漏检率增加。

而很多初学者没有仔细了解该参数的意义,更无从谈起如何优化参数,另外三个参数,如果考虑速度的话,最好设置最大与最小可检测人脸BOX范围,这里有利于减少计算时间,提升实时性能。这里只是通过这个例子来说明OpenCV中的各个算法API参数重要性,要成为OpenCV开发高手,个人认为要做到内外兼修,这里内是指相关数学、算法论文都认真读、仔细的研究,不断加深对相关算法的理解与领悟;外是指要加强动手能力,编程能力,做为OpenCV开发者我们首要职责就是负责让视觉相关应用落地,没有很强悍的工程能力与解决问题能力很难做到这点。结合本人的亲身实践和学习路径,建议在学习OpenCV 编程时搞清楚几点对学习更加有帮助

  • 学习API函数时查找相关论文,尝试阅读论文
  • 搞清楚学到的每个算法相关数学基础,尝试理解相关参数意义
  • 学会看OpenCV官方的文档与代码示例
  • 古语云“独学而无有、孤陋则寡闻”,所以多认识一些OpenCV学习者与开发者
  • 从最新版本开始学习,OpenCV已经发布了OpenCV3.4.1最新版本,建议学习从OpenCV3.4开始学习,避免学习一些过期的API给自己带来不必要的烦恼与负担。
  • C++还是Python,当前OpenCV SDK支持C++与Python SDK,所以无论选择哪一种语言都可以学习OpenCV。

三:关注业界动态、紧跟技术潮流

如果你成功了经历了前面几个阶段,应该恭喜你是一个真正的OpenCV开发者啦,但是这个时候还有清醒的意识到你只是一个知道和熟悉常见OpenCV中算法、使用它们解决实际问题的开发者而已,要学会关注业界动态,关注OpenCV框架的新发展与新动向、特别是新算法在OpenCV框架中的实现与SDK发布。

举例来说DNN模块发布已经快一年了,本人一直跟踪OpenCV的每个Release、深刻感受到它的功能越来越完善与强大,个人观点以后OpenCV的大部分对象检测与识别都可能基于DNN模块实现,这样的好处是对开发者显而易见,即降低了学习门槛,有提高了检测准确性与精度,对于DNN这样的新模块,作为OpenCV开发者的你是否一直在不断跟踪它,另外注意学术界的动态,OpenCV社区会很快把一些最新CVPR上面的论文变成想法算法模块的,所以对一些影响比较大的CVPR的论文有条件要及时跟进阅读与理解。
很多人想学习人工智能相关的热门技术,我觉得OpenCV就是很接地气,也很好的方向选择,也不需要太过深奥的数学知识,即使零基础也可以学会、学好。正如古人所说“假舆马者,非利足也,而致千里;假舟楫者,非能水也,而绝江河。君子生非异也,善假于物也”,借助OpenCV这个神兵利器,开发者也会从检测到识别无所不能。


后记
也许不适合所有人,但是如果能对初学者有一点帮助,也算值得我写下上面几百字的肺腑之言了!

千里之行、始于足下。

你可能感兴趣的:(深度学习理论,深度学习)