【传统图像处理】1 数字图像基础

文章目录

    • 前言
      • 1 视觉感知要素
      • 2 光和电磁波谱
      • 3 获取一张数字图像
      • 4 数字图像处理
    • 总结


前言

     为保证《数字图像处理》知识体系的完整性,做本章总结如下。本章全部为基础基本知识,无繁杂公式。


1 视觉感知要素

     人的眼睛形状近似为一个球体,平均直径约为20mm。有三薄膜包围着眼睛:角膜与巩膜外壳、脉络膜和视网膜。
     角膜是一种硬而透明的组织,覆盖着眼睛的前表面。与角膜相连的巩膜是一层包围着眼球其余部分的不透明的的膜。
     脉络膜的最前面分为睫状体和虹膜。
【传统图像处理】1 数字图像基础_第1张图片

     虹膜的收缩和扩张控制着进入眼睛的光亮。虹膜中间的开口(瞳孔)的直径是可变的,范围大概在2-8mm。
晶状体由同心的纤维细胞层组成,并由附在睫状体上的纤维悬挂着。晶状体包含60%~70%的水、6%的脂肪和比眼睛中其他组织都多的蛋白质。晶状体吸收8%的可见光谱,对短波长的光有较高的吸收率。在晶状体结构中,蛋白质吸收红外光和紫外光,吸收过量时会伤害眼睛。白内障疾病即是晶状体受损。
     眼睛里最里面的膜是视网膜。来自眼睛外部物体的光在视网膜上成像。由视网膜表面分布的不连续的光,感受器提供了图案视觉。有两类光感受器:锥状体和杆状体。

  • 每只眼睛中的锥状体数量在600-700万之间,他们主要位于视网膜的中间部分,称之为中央凹,且对颜色高度敏感。每个锥状体都连接到自身的神经末梢,肌肉控制眼球转动,知道感兴趣的物体图像落到中央凹上。锥状体视觉称为白昼视觉或亮视觉;
  • 约有7500-15000万个杆状体分布在视网膜表面,它用来给出视野内的一般的总体图像,没有彩色感觉,而对低照明度敏感。例如在白天呈现鲜明色彩的物体,在月光下都没有颜色,因为此时只有杆状体受刺激。这种现象称为暗视觉或微光视觉。
  • 感受器的分布是关于中央凹对称的。
  • 中央凹本身是视网膜中直径约为1.5mm的圆形凹坑。

     在获取一张图片时,人眼与相机是恰恰相反的。对于相机,镜头有固定的焦距,各种距离的聚焦是通过改变镜头与成像平面间的距离实现;在人眼中,晶状体和成像区域(视网膜)之间是固定的,实现正确聚焦的焦距是通过改变晶状体的形状来得到的。人眼晶状体中心和视网膜沿视轴的距离大约是17mm,焦距约为14-17mm,在眼睛放松且聚焦距离大于3m时,焦距约为17mm。

     实验数据指出,主观亮度(即由人的视觉系统感知的亮度)是进入人眼的光强的对数函数。在低照明水平下,视觉由杆状体执行,在高照明水平下,视觉由锥状体执行。

     人眼的视觉系统往往会在不同强度区域的边界处出现"下冲"或"上冲"现象。下图中,虽然条带的强度恒定,但在靠近边界处实际感知到了带有毛边的亮度模式,这些看起来带有毛边的带称为马赫带

【传统图像处理】1 数字图像基础_第2张图片


2 光和电磁波谱

     人眼可见光的彩色范围只占电磁波的一小部分,在波谱的一端是无线电波,其波长是可见光波长的几十亿倍。波谱的另一端是伽马射线,其波长比可见光小几百万倍。
【传统图像处理】1 数字图像基础_第3张图片

电磁波谱可用波长、频率或能量来描述:
     波长λ和频率v的关系为:λ=c/v
     其中c是光速(2.998×1e8 m/s)
电磁波谱的各个分量的能量公式为:E=hλ
     其中h是普朗克常数。

     光是一种特殊的电磁辐射,电磁波谱的可见光波段的跨越范围约为0.43μm(紫色)~0.79μm(红色)。人感受一个物体的颜色由物体反射光的性质决定,比如绿色物体反射波范围为500-570nm的光,而吸收其他波长的大部分能量。
     关于光的能量,本人做过飞秒近视手术,已经了解过电磁波的强大威力

     写到这里,想到关于防蓝光眼镜的问题。首先查到的一段话:

因为蓝光是自然可见光的一部分,电脑、手机等电子屏幕也会发出蓝光。因为蓝光的波长比较短,能量也比较高。如果过多的蓝光进入到视网膜,特别是到达眼底黄斑区时可以导致黄斑病变。晶状体如果吸收有害的蓝光,也会导致混浊而得白内障。

     对于个人理解,如果是因为蓝光的能量较高的原因,那么也可以由防紫光眼镜,毕竟紫光的能量是可见光中能量最高的;其次人眼成像改变焦距的功劳大大归功于晶状体,眼球中的睫状肌通过改变晶状体的形状才可以对远处物体进行对角,近视也是因为晶状体受到伤害而导致。(但是师兄说他看过中科院的实验报告讲到,防蓝光眼镜是不不会起到作用的,咱也不懂。。。☹️)

还有通常讲到的远眺,也是为了缓解晶状体形状,促进睫状肌的"锻炼"!

  • 没有颜色的光称为单色光或无色光,单色光的唯一属性是它的强度或大小,灰度级一词常用来表示单色光的强度。

  • 有三个基本量用于描绘彩色光源的质量:发光强度、光通量和亮度。发光强度是从光源流出能量的总量,通常用瓦特(W)来度量。光通量给出观察者从光源感受到的能量,通常用流明数(lm)来度量。亮度是光感知的主观描绘子,它实际上不能度量。


3 获取一张数字图像

     成像传感器是将照射能量变换为数字图像的一种装置。成像传感器中的传感材料接收外界的光能能量,并输出电压波形。传感器的响应正比于投射到传感器表面的光能总量,即生成图像的亮度值正比于物理源(如电磁波)所辐射的能量。

     为了产生一幅数字图像,需要把连续的感知数据转换为数字形式,这种转换包括:取样和量化。如下图为一幅传感器采集到的图像。
【传统图像处理】1 数字图像基础_第4张图片

     对坐标轴进行数字化称为取样,对幅值进行数字化称为量化。下图左为取样结果,下图右为量化结果。这样便得到了一幅数字图像。数字图像的质量在很大程度上取决于取样和量化所用的样本数和灰度级。

【传统图像处理】1 数字图像基础_第5张图片

     数字化过程要求针对图像的大小M×N和离散灰度级数L做出判定。对于M和N必须取正整数外没有其他限制,而出于存储和量化硬件的考虑,灰度级数典型地取为2的整数次幂,即L=2k

  • 将图像系统的动态范围定义为系统中最大可度量灰度与最小可检测灰度之比,其上限取决于饱和度,下限取决于噪声。
  • 饱和度是指超过某个灰度值的像素均被设置为最高阈值,即整个饱和区域具有恒定的高灰度级。
  • 定义一幅图像中最高和最低灰度级间的灰度差为对比度。

     空间分辨率是图像中可辨别的最小细节的度量。每单位距离点数(像素数)是通用的度量,使用每英寸点数(dpi,dots per inch)来表示。

空间分辨率关系到冲印照片的大小、打印图片的精度,举个例子:

对于200万像素的数码相机,有效像素192万,最大输出1600×1200的相片:
     宽:1600 Pixels/300 dpi=5.3"
     高:1200 Pixels/300 dpi=4"
也就是说如果用300dpi输出分辨率冲印,最多能冲印5.3×4英寸的照片,而通常照片的尺寸是:
     5寸:5×3.5
     6寸:6×4
很明显的看出,200万像素能以300dpi的效果冲印最大5寸的照片。

     (注:人眼能分辨出的最大分辨率是300dpi,超过这个分辨率,人的眼睛是无法看出差别的,也就是说300dpi600dpi在人眼看来是没有差别的,所以现在的冲印设备最大的设计输出分辨率,就是300dpi,当然每个人对于清晰度的要求是不一样的,一般来说能达到200dpi就能让大部分人满意。)


4 数字图像处理

     一幅数字图像可表示为一个矩阵,其中的每个像素对应于矩阵中的一个值,可以对矩阵中的每个值进行算术操作来处理图像,即对矩阵中的每一个灰度值进行操作 ,包括降噪、增强、矫正阴影等;也可以对矩阵进行空间变换以完成图像的尺度变换、旋转、平移、偏移等;此外还可以将图像首先转移到变换域中执行指定任务,最后再用反变换返回到空间域。

关于图像的resize问题:
     日常总会对图像进行放大、收缩、旋转和几何校正等工作,这是基于图像内插方法完成的。有三种基本的内插方式:

  • 最近邻内插法:把原图像中最近邻的灰度赋给每个新位置;
  • 双线性差值:使用像素点的四邻域像素进行计算,令v(x, y)表示灰度值,则双线性差值公式满足在这里插入图片描述
  • 双三次内插:使用像素点的16个最近邻点进行计算。双线性内插在保持细节方面比双线性内插相对要好。经常使用的PS就是使用的双三次内插方法。

关于图像中边缘和边界的区别:
     边缘是具有某些超过预先设定的阈值的导数值的像素形成的,边缘的概念是基于在进行灰度级度量时不连续点的"局部"概念;而一个有限区域的边界形成一条闭合通路,并且是"整体"概念。边缘和边界吻合的一个例外是二值图像的情况,把边缘考虑为灰度不连续和边界是闭合通路是有帮助的。


总结

《数字图像处理》2020年前刷完。

你可能感兴趣的:(传统图像处理,计算机视觉,图像处理)