Computer Vision: Algorithms and Applications(学习笔记一)--introduction

计算机视觉起源

早在1966年,MIT的Marvin Minsky让他的本科生Gerald Jay Sussman在暑假期间将摄像机连接到计算机上,让计算机来描述它所看到的东西(Boden 2006)。这个例子完全描述了计算机视觉所要干的事情,以我的理解就是让计算机去理解看到的图像,即给计算机赋视觉。显然这个问题远远没有当时Marvin Minsky教授所想象的那么简单。

如果从1966年起算,计算机视觉已经发展近60年了,计算机解释图像的能力还不如两岁大的孩子。为什么实现计算机视觉如此困难,部分原因是因为它是一个逆问题(inverse problem),是在信息不足的情况下,我们通过恢复一些未知量来给出完整的解答。

逆问题不同于一般的问题,一般的问题是由因求果,而逆问题就是执果索因,即已知结果去探求原因。在一些学科中,根据测量结果构建经验模型就属于逆问题的求解。比如在地理学中,一般来说,海拔越高,气温越低,因为对流层大气的主要直接热源是地面,离地面越远,得到的地面辐射越少,气温也就越低。每上升100米,气温下降0.6摄氏度,那么“100米”和“0.6摄氏度”这些参数的测定,就是根据实际测量不同高度的不同温度,然后将所有测量结果汇总分析,用线性模型拟合得到的。

计算机视觉的模型往往不会这么简单,视觉世界的建模十分的复杂。有些会涉及到基于概率的模型。比如猫狗识别中,我们需要给计算机看猫的照片,然后告诉它这是猫,再给它看狗的照片,告诉它这是狗。然后选择贝叶斯作为概率模型,求解出参数后得到一个可以简单的贝叶斯分类器。这也是一种通过测定结果去求解模型的方法,随着大数据的到来,人们更希望去求解变量中的相关关系而非因果关系(大数据时代),使得我们不需要通过数学推论解算出变量之间的因果关系,而是直接通过概率模型来求解变量之间的相关关系,这种统计学习方法广泛地应用于计算机视觉、自然语言处理和机器学习等方面。

计算机视觉应用

经过多年的发展,计算机视觉已经可以应用于实际的生活中(偏机器视觉)。

Computer Vision: Algorithms and Applications(学习笔记一)--introduction_第1张图片

  • 光学字符识别(Optical Character Recognition OCR):阅读信上的邮政编码和自动号码牌识别(Automatic Number Plate Recognition ANPR)。
  • 机器检验(machine inspection):保证质量快速检验部件,使用立体视觉在专门的光照下测量飞机机翼或汽车车身配件的容差,或使用X光视觉检查钢铸件的欠缺。
  • 零售(retail):针对自动结账通道的物体识别。
  • 3D建模(3D model building):使用航空照片完全自动地构建3D模型。
  • 医学成像(medical imaging):对比手术前和手术中的成像,或者观察人老化过程中大脑形态的长期研究。
  • 汽车安全(automotive safety):监测意外的障碍物,比如街道上的行人,甚至实现汽车的自动驾驶。
  • 匹配运动(match move):根据跟踪源视频中的特征点来将计算机生成的影像(Computer-Generated Imagery CGI)与实景真人动作脚本融合。常应用于电影拍摄。
  • 运动捕捉(motion capture):使用从多台摄像机拍摄的反光材料标记或者其他视觉方法来捕捉演员的动作。常应用于计算机动画。
  • 监视(surveillance):监控入侵者,分析高速公路的交通状况,监控游泳池以防溺水事件的发生。
  • 指纹识别(fingerprint recognition):用于自动准入身份验证以及司法应用。

计算机视觉简史

我的理解就是如果把计算机视觉看作图像处理+视觉模型。那么计算机视觉的发展重心从图像处理偏向视觉模型。

Computer Vision: Algorithms and Applications(学习笔记一)--introduction_第2张图片

21世纪计算机视觉的发展趋势:

  • 计算机视觉与图形学的相互影响加深(计算摄影学)。
  • 物体识别中基于特征的方法显现(基于纹理特征的模式识别)。
  • 更高效求解复杂全局优化问题的算法(全局最优)。
  • 复杂的机器学习方法在计算机视觉问题中的应用(统计学习方法)。

计算机视觉结构

计算机视觉:算法与应用(Computer Vision: Algorithms and Applications)章节结构:

Computer Vision: Algorithms and Applications(学习笔记一)--introduction_第3张图片

计算机视觉:算法与应用(Computer Vision: Algorithms and Applications)章节内容:

Computer Vision: Algorithms and Applications(学习笔记一)--introduction_第4张图片

1 Boden, M. A. (2006). Mind As Machine: A History of Cognitive Science. Oxford University Press, Oxford, England.
2 大数据时代 http://book.douban.com/subject/20429677/

你可能感兴趣的:(学习笔记)