数字图像处理——引言

一:从数字媒体到数字图像处理

数字图像处理(Digital Image Processing, DIP)又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。

  • 数字媒体概论:颜色空间、量化、属性、格式、编码
  • 图形:图形学、3D Max、游戏设计…
  • 以图像/视频对象为例——数字图像处理

数字图像处理是人工智能、计算机视觉、模式识别、多媒体技术等学科的基础,是一门涉及多领域的交叉学科

数字图像处理相关获奖事件

  • 伦琴因发现X射线获得首届诺贝尔物理学奖
  • Hounsfield和Cormack因发明CT获得1979年诺贝尔医学和生理学奖
  • Ernst因发明MRI中Fourier重建方法获得1991年诺贝尔化学奖
  • Lauterbur和Mansfield因发明MRI方法获得2003年诺贝尔医学和生理学奖。

在AI时代,数字图像处理仍然是重要方向

  • 计算机视觉
  • 图像识别
  • 机器学习
  • 机器人
  • 语音识别
  • 自然语言处理

数字图像处理——引言_第1张图片

经典图像处理:

  • 灰度变换
  • 空域滤波
  • 频域处理
  • 图像复原
  • 图像压缩
  • 图像分割

二:数字图像处理的起源

数字图像处理的历史可追溯至二十世纪二十年代。最早应用之一是在报纸业,当时的巴特兰Bartlane电缆图片传输系统,第一次通过海底电缆横跨大西洋从伦敦送往纽约传送新闻图片。为了用电缆传输图片,首先进行编码,然后在接收端用特殊的打印设备重现该图片。

数字图像处理——引言_第2张图片

数字图像处理的历史与数字计算机的发展密切相关,它必须依靠数字计算机及数据存储、显示和传输等相关技术的发展。

  • 在太空计划的推动下, 第一台功能强大到足以执行有意义的图像处理任务的大型计算机出现在20世纪60年代初,此时这些机器被应用于空间项目开发。
  • 重要标志是1964年美国喷气推进实验室(JPL)正式使用数字计算机对“徘徊者7号”太空船送回的四千多张月球照片进行了处理

进行太空应用的同时,数字图像处理技术在20世纪60年代末和70年代初开始用于医学图像、地球遥感监测和天文学等领域。

  • 1895年伦琴发现X射线,获1901年诺贝尔物理学奖。
  • 1975 年 Godfrey N. Hounsfield 和 Allan M.Cormack发明了计算机断层技术(CT),获1979年诺贝尔医学奖

三:数字图像处理的三个层次

  • 底层视觉处理:图像处理
  • 中层视觉处理:图像分析
  • 高层视觉处理:图像理解

数字图像处理——引言_第3张图片

3.1:底层处理

底层处理(Low Level Processing):

  • 图像处理:对图像进行各种加工,以改善图像的视觉效果,强调图像之间进行的变换;是一个图像到图像的过程。
  • Denoising(降噪), Enhancement(增强), Compression(压缩), Registration(注册),…

研究对象:对图像数据进行处理,形成类视觉皮层局部表征,如几何特征、区域边界、物体轮廓和运动信息等
数字图像处理——引言_第4张图片

3.2:中层处理

中层处理(Mid Level Processing)

  • 图像分析:对图像中感兴趣的目标进行提取和分割,获得目标的客观信息(特点或性质),建立对图像的描述;是一个图像到数据的过程
  • Detection(检测),Classification(分类),Segmentation(细分),Semantic Segmentation(图像分割), …

研究目标:在底层特征上引入几何结构、时域对应等信息,搭建起底层视觉和高层视觉之间的桥梁。例如:显著性检测、目标分割、目标跟踪
数字图像处理——引言_第5张图片

3.3:高层处理

高层处理(High Level Processing)

  • 图像理解:研究图像中各目标的性质和他们之间的相互联系;得出对图像内容含义的理解及原来客观场景的解释;借助知识、经验来推理、认知客观世界,属于高层操作。
  • Auto Drive(自动驾驶),Scene Understanding(场景理解),Face Recognition(人脸识别),…

研究目标:获取能够直接被接受且理解的语义知识。近年来的研究方法以深度学习为主线,物体识别和场景分类、人脸识别等视觉任务的算法性能有极大提升。
数字图像处理——引言_第6张图片

3.4:总结

  • 图像处理、图像分析和图像理解是处在三个抽象程度和数据量各有特点的不同层次上。
  • 图像处理是比较底层的操作,它主要在图像像素级上进行处理,处理的数据量非常大。
  • 图像分析则进入了中层,分割和特征提取把原来以像素描述的图像转变成比较简洁的非图像形式的描述。
  • 图像理解主要是高层操作, 基本上是对从描述抽象出来的符号进行运算,其处理过程和方法与人类的思维推理有许多类似之处

四:数字图像成像

图像源:

  • 最主要的图像源是电磁能谱
    • 光也是一种电磁波
    • 使用传感器来检测由一种电磁波谱发射的能量,就可以在该波段上进行成像
    • 可见光成像应用领域远远超过其他波段。如光显微镜、遥感、天文,工业等方面应用。
    • 红外波段也常与可见光相结合成像,例如天文多光谱成像。
  • 其他主要的图像源包括声波、超声波和电子(用于电子显微镜)。

数字图像处理的主要研究内容:

  • 图像变换:采用各种图像变换方法对图像进行间接处理。有利于减少计算量并进一步获得更有效的处理。例如:傅立叶变换,沃尔什变换,离散余弦变换,小波变换
  • 图像压缩编码:可以减少描述图像的数据量,以便节约图像存储的空间,减少图像的传输和处理时间。图像压缩有无损压缩和有损压缩两种方式,编码是压缩技术中最重要的方法,在图像处理技术中是发展最早和应用最成熟的技术。主要方法:熵编码,预测编码,变换编码,二值图像编码、分形编码…
  • 图像增强和复原:目的是为了改善图像的视觉效果,如去除图像噪声,提高图像的清晰度等。图像增强不考虑图像降质的原因,突出图像中感兴趣的部分。图像复原要求对图像降质的原因有所了解,根据图像降质过程建立“退化模型”,然后采用滤波的方法重建或恢复原来的图像。主要方法:灰度修正、平滑、几何校正、图像锐化、滤波增强、维纳滤波等
  • 图像分割:将图像中有意义的特征提取出来(如物体的边缘、区域),它是进行进一步图像识别、分析和图像理解的基础。虽然目前已研究出了不少分割方法,但还没有一种普遍适用于各种图像的有效方法。对图像分割的研究还在不断的深入中,是目前图像处理研究的热点方向之一。主要方法:图像边缘检测、灰度阈值分割、基于纹理分割、区域增长等
  • 图像描述是图像分析和理解的必要前提。图像描述是用一组数量或符号(描述子)来表征图像中被描述物体的某些特征。主要方法:二值图像的几何特征、简单描述子、形状数、傅立叶描述子,纹理描述等
  • 图像识别是人工智能的一个重要领域,是高级视觉处理。一副图像经预处理、分割和描述提取有效特征之后,进而由计算机系统对图像加以判决分类。

数字图像处理应用:

  • 智慧城市、智慧工地、智慧园区
  • 安防监控、公共安全
  • 智慧交通、智慧水务、智慧工业、智慧农业、智慧物流
  • 智慧营销、智慧运营

如果有兴趣了解更多相关内容,欢迎来我的个人网站看看:瞳孔空间

你可能感兴趣的:(游戏开发,人工智能,计算机视觉)