数字图像处理——第一课

前言

为何要学习数字图像处理呢?学习之后要达到什么目的?学习过程中有哪些评价标准来检验是否准确掌握知识?

我觉得回答这三个问题是我写这篇博客的主要目的。

数字图像处理

作为一个图像处理方向的学习者和研究者,如果对图像最常规、基本的处理方法都没有一个系统、全面的认识,那肯定是不会做出好的研究的。

同时,对于传统、经典方法的学习理解,有助于我们对新问题的解答提供思路和指导。比如现在流行的深度学习中的卷积操作、何凯明大神MaskRCNN中的线性插值法和deeplab中的空洞卷积,其实都是从经典方法中的思想延伸借鉴过来的。

所以,我觉得系统的学习《数字图像处理》这本书还是十分有必要的。
作用有三:重温经典,夯实基础、借鉴思路,触类旁通、了解发展,梳理脉络

目的

学习这本书不是为了理解每一个知识点和公式推导,重点在于掌握其处理图像的经典方法和核心思想。

所以,在系列文章中,没有太多的公式推理,更多的是我个人的理解,尽量用通俗化的语言来表达,也尽量把排版做的清晰简洁、直观易懂。

如何检验

阅读和理解只是学习的一个环节,要确认自己是否真的理解,必须要有检查验证,就如同学校的考试。

但没人来拷问我,这里用到费曼学习法,将所学的东西简单、易懂的表达出来,遇到自己表述不清或者模棱两可时说明这部分知识点掌握并不牢固,回顾学习巩固并重复这个过程,知道掌握明白。

第一课内容

数字图像处理范围

数字图像处理不单单是RGB彩色图像处理。

只要是使用数字设备记录的光学能量信号,都可以称作数字图像,比如X射线照射的骨骼成像图,比如卫星空间站拍摄的宇宙射线成像图,均为数字图像的范围,只不过我们日常接触最多的是彩色图像。
数字图像处理——第一课_第1张图片
比如今天七夕节这张图片,就是一个rgb图像,通过各种色彩搭配得到一个让人赏心悦目的效果,但它更多起到宣传作用,用数字图像处理技术来处理就显得有些多余。

数字图像处理简介

数字图像的处理主要包括三部分:图像获取(问题域),图像增强(主观)和图像属性提取。

图像获取:主要是通过数字传感设备将实际光线能量或者反射能量捕获并转化为数字信号,呈现在成像设备如显示屏上。(就如人眼中眼睛就是捕获光线能量的传感器,光线传递到眼球内部的视网膜上,信号通过大脑内部的处理形成图像)

图像增强:首先要强调,图像增强并不是绝对的,而是视需要决定的。也就是对图像进行某种方式的处理而使得图像在特定应用比原始图像更易处理。
常用的图像增强技术有:图像滤波与增强,小波分析,形态学处理等。

图像属性提取:对于图像中关键属性的提取,以满足我们分析的需要。比如热门的深度学习方向有物体识别、人体骨骼点标注、图像语义分割等,比如传统的图像ROI区域、目标识别区域、图形描述表示等,均为提取图像属性的方法。

数字图像处理基础

组成:数字图像成像原理,类比于人眼成像原理,一般以像素级来指示图像的清晰度,成像效果一般也有黑白图、灰度图和RGB彩色图的分别。

取值量化:数字图像一般使用传感器接受外界能量信号,将连续变化的模拟信号转化为数字信号,呈现在屏幕中。而将模拟信号转化为稳定、准确的数字信号也是非常关键的一环,将决定着成像效果。

其实数字信号处理也是一门单独的学科,对于数字信号处理中的各种知识点和问题当时在上学期间也被折磨的够惨的,有兴趣的同学可以深入了解下,毕竟以后还是绕不开这些知识的!

基本关系

  • 像素之间存在着不同的表示方法和关系,以便于统一专业术语和避免二义性。
  • 一张图一般会以(m行×n列×k通道)组成,描述坐标的原点一般在左上角,可以看成一个三维的矩阵
  • 像素之间的位置关系有相邻4像素(上下左右)和相邻8像素(周围一圈)
  • 像素之间的距离度量可以是像素坐标的欧氏距离,也可以是相邻通道的距离(但通道距离易产生二义性,需注意)

基本操作:

  • 阵列和矩形操作:阵列操作类似于把矩阵中某一维度看做一个整体,进行乘法操作时与矩阵操作不一样
  • 一般都有线性操作和非线性操作几种方式,线性操作如简单的线性变换,非线性操作如取最值,或者求梯度变换等
  • 算数操作:一般把图像矩阵中的值进行数学统计方式的处理,如取平均值、取加权平均、图像增强相减等
  • 其他骚操作:几何空间变化、变换域图像、概率统计方法等

总结

学习本章,让我印象最深刻的是,图像增强不是绝对的,而是主观需要。或者说图像处理的结果是便于人们进行下一步更深入的研究,所以学习数字图像处理不是目的,学习各类图像处理的手段以及提出这些方法的依据和常常使用的范围时非常重要的。

图像处理主观的需要是我们选择这种方法的前提,只有牢牢掌握问题的本质,我们才能瞄准正确的方向行进。

  • 数字图像处理的组成:图像源(获取图像)——图像增强(各种处理方法)——图像属性(图像中的子属性提取)

    图像的获取原理类似于人眼成像,人类眼部是一个极其精密的机器,成像的过程看做光线能量进入晶状体,投入视网膜,神经传递电信号给大脑,大脑根据常识知识成像并赋予各种意义,这样就构成精彩的一副图像(电脑或者其他传感设备原理类比)

    图像增强类似于人类在眼睛上带上近视眼镜、墨镜或者老花镜等等,关键在于主观的需要,而不是哪一种处理方式绝对比另一种好。图像增强的作用原理和使用范围、场合是我们接下来学习的重点,里面涉及到许多目前前沿领域用到的基本概念,深入理解,有助于对前沿发展方向有更深刻的理解

    图像属性提取类似于我们看的有些电影会打上马赛克,关键兴趣区域ROI做了适当的处理(当然这样说有些狭隘,实际的属性提取范围很广),或者是目前大部分的智能摄像头都带有人脸识别或者行人识别跟踪的功能,就是将图像或者视频中的关键属性提取,以供人类进一步研究

  • 图像处理基础:量化——关系——变换处理——计算方法

    对于任何一门科学学科,少不了的科学方法就是量化比较,图像一般的量化方法就是像素灰度值或者rgb值,以及其区域和面积;

    关系:有时要表示或者描述像素操作关系或者评价他们关系,就像让你评价你和你父母的关系,你不能说你们很亲,这样很难让人有准确的概念,而如果说是父子或者母子关系,就没有歧义性。这就是关系描述的重要性,像素之间关系其实还有很多,就和你有很多亲戚关系一样,不需要你每个人就牢牢记住,你只需在遇到的时候记住,下次自然就能记得住。

    变化处理:图像的线性操作和非线性操作,可以将图像转换为适合我们处理的数据。类比于一棵大树不能直接盖房子,我们需要将其先锯断、切割、组合和固定等很多步骤的操作才能将其搭建成一个牢固的房子。后面有很大一部分篇幅就在写如何将大树做成我们需要的房子。

    计算方法:数字图像说白了就是多维矩阵,对矩阵进行变换操作少不了线性代数思想,同是也需要我们更加高效、准确的实现操作,降低运行时间和占用空间,对于数学基础的要求不可或缺。

好的,今天第一课的学习先到这里,下一步就是经典的灰度变换和空间滤波知识,敬请期待!

你可能感兴趣的:(数字图像处理,数字图像处理,连载)