计算机视觉基础入门_01_introduction

文章目录

  • 前言
    • 机器视觉系统的目标:
    • 人类视觉特点:
    • 计算机视觉学科起源
    • 计算机视觉传奇人物——大卫·马尔(David Marr)
    • 图像中包含的信息 => 计算机视觉的主要工作

前言

        因为毕业设计设计到机器视觉部分,所以在寒假的时候看了北邮鲁鹏老师的计算机视觉(本科)的公开课程,观看之后不由大为震撼,即使初次接触也令我如痴如醉,越看越上头。还是比较庆幸本科选择了CS专业,我发现其实自己挺喜欢学计算机,因为它让我看到了可以改变自己生活方式、真正去拥抱生活的希望。我真的再过几年的时间,我可以真的实现我的目标,至于目标是什么,等我真正达到了,再回来划伤句号。



机器视觉系统的目标:

为了跨越"语义鸿沟",使得机器能够提取出图像中的内容


人类视觉特点:

  1. 运动致盲
    在识别图像时为了加快理解物体、快速反应物体,人类可能会只关注主体,而去忽略其他细节,
  2. 能够利用上下文背景信息去理解图像
    如:在初次接触陌生信息时,会用个人常识去先入为主理解自己所接收到的信息
  3. 人类视觉系统有时可能会对图像进行增强加工,有时候我们看到的并不是真的图像表现。
    这也是人类进化的结果,为了让我们能够去更好理解世界;而如果让机器来识别就永远都看不出来不同
  4. 视觉系统会脑补物体运动,及时图像本身是静态的

计算机视觉学科起源

从1966年MIT的人工智能研究组夏令营开始,明斯基教授在做符号推理时遇到了机器识别图像的相关问题,发现无法从现有的知识体系出发解决问题,没有一个指导思想或者一套工具来解决这个问题,问题是什么都没描述不清楚,遇到了什么难点也都描述不清楚,于是从图像处理中分割出来了计算机视觉领域。


计算机视觉传奇人物——大卫·马尔(David Marr)

大卫马尔给出了计算机视觉系统的框架,给其分为三层:

  1. 计算理论(Computational theory)
    计算机视觉的目标、任务是什么,以及在干的过程中到底有哪些约束
  2. 表达和算法(Representations and algorithms)
    如何表示输入、输出以及中间的计算过程如何表示;输入和输出之间的过程如何实现
  3. 硬件实现(Hardware implementation)
    通过硬件来实现算法,从而加速;用硬件的约束来去指导算法简化模型

为了纪念David Marr,为此在计算机视觉领域上计算机视觉国际大会(ICCV)设立了最高奖马尔奖(Marr Price)


图像中包含的信息 => 计算机视觉的主要工作

  1. 3D场景信息. => 从图像中恢复3D结构信息,3D重建
  2. 语义信息. => 从图像中恢复语义信息,用来理解图像是什么



最后第一节课堂上老师的话:
速成只能解决别人已经解决过的问题,把别人思路再复现一次,不能解决新的问题;
更重要是培养专业的思维方法和踏实的知识储备

你可能感兴趣的:(计算机视觉基础,计算机视觉,人工智能)