[数字图像处理] 数字图像基础 -- 基于Digital Image Processing

一、引言

        数字图像处理的基础是基于数字图像获取。这里主要介绍的是图像的一些基本概念,包括图像格式、图像成像、图像的数学特征和图像的基本数学处理

二、图像感知要素

        主要是两部分:颜色和亮度

人眼成像:

[数字图像处理] 数字图像基础 -- 基于Digital Image Processing_第1张图片

        虹膜:控制着瞳孔的直径,相当于光圈,控制进光量;

        晶状体:相当于透镜,理论上来说,人眼成像的像距可以认为是定制,晶状体的变形是的焦距可变,从而实现不同物距的成像;

        视网膜:有两种光感受器:锥状体和杆状体。其中锥状体位于视网膜中央凹,既位于光轴上,当眼睛转动斜视的时候,这里也会转动。每个锥状体链接一个神经末梢,对颜色敏感,人眼聚焦的地方成像既是此处。杆状体大范围的分布在视网膜上,几个杆状体链接一个神经末梢,没有彩色感觉,对低照明度敏感,例如月光下的视野,主要是杆状体受到刺激(猜测原因,由于低亮度下瞳孔直径更大,因此进入晶状体的光范围更大,更多的光会透射到视网膜的更大范围上,此时锥状体接受的光少,杆状体接受的光多)。      
        视锥细胞:锥状体分为三种视锥细胞,分为为S-视锥、M-视锥、L-视锥,三种视锥细胞感受不同波长的光时激活程度不一样,因此才产生了颜色的生物感觉。而对于可见光,其分布为

[数字图像处理] 数字图像基础 -- 基于Digital Image Processing_第2张图片

可知,L-视锥对红色反应比较敏感,M-视锥对绿色反应比较敏感,S-视锥对蓝色、紫色反应比较敏感。对于太阳光,是多种可见光的混合,所以人眼才会认为太阳光是白色光,这也是RBG三原色的原理的基础。白色并不是物理颜色,并不存在白光,白色只是生物的概念。 

亮度和灰度:

        亮度实际物理意义上来说,指的是光照强度;,而灰度指的是对亮度从最小到最大进行一个离散分区间,灰度是相对的,相对变化的,由最大亮度和离散区间间隔来决定。而人眼实际上对亮度的感知是一个动态范围,理论上来说,人眼感知到的是灰度值。关于亮度饱和度,因为灰度值取的是最大的亮度作为最大灰度,超过这个亮度的最终都是此最大灰度,因此会丢失信息。

颜色:

[数字图像处理] 数字图像基础 -- 基于Digital Image Processing_第3张图片

 

        RGB:根据前面对人眼成像的分析,可知以红绿蓝作为三种基准颜色,可以合成白色,同时两两组合有可以合成黄色青色和紫色

        反射RGB:人眼看到的光分为两种,一种是直射光(包括透明物体透射的光),另一种是反射光既物体本身不发光反射其光。对于直射光物体,我们看到颜色就是其发出的光,颜色的合成就是RNG的合成;对于反射光物理,看到的颜色就是其反射的光,其颜色的合成就是反射RGB,既相对于白光的补光。例如,蓝色的补光就是黄色。此时存在补光三角。

        还有其他基于不同基元色的颜色空间。

三、图像取样和量化

        图像经过光学传感器取值之后可以获得传感图像,处理之后转换为数字图像。数字图像由二维函数来定义其数据:y=f(x,y)。其中y表示(x,y)处的灰度值。x,y表示的是其二维图像平面离散划分的区间。

        图像的分辨率:分为空间分辨率和亮度分辨率。空间分辨率指的是图像平面的离散划分的程度,例如10um*10um表示一个像素,这就是空间分辨率,分辨尺寸为10um,如果划分的更加精细,像素尺寸越小。亮度分辨率指的是灰度值的划分,如果是256的话,就表示将最亮和最暗这个区域划分为256阶,如果是128那么就相对不那么精细。灰度分辨率越大,则其亮度表示越精细。

        图像的数字存储灰度值一般为:L=2^{k}。基于二进制的表示法,每个像素用一个字节表示,那么k就为8,能表示的灰度范围为0-255;如果是用两个字节表示,那么k为16,能表示0-65535的范围。如果图像的尺寸为M*N,那么对于存储的大小为 M*N*k bit,既 m*N*k/8 字节。

        dpi:每英寸像素数目,dpi越大,图像精度越高

四、图像格式

bmp(BitMap)格式 :

        采用位映射存储格式;除了色彩分辨率可选之外不采用任何压缩;扫描顺序从左到右、从上到下

JEPG(joint photographic experts Group)

        采用有损压缩去除冗余信息,压缩比较高但是任能保存比较好的图像质量

Png(Portable Network Graphics)

        便携式网格存储格式,存储量比较小,压缩比比较高

tig(Tag Image File Format)

        图像格式比较复杂,见的比较少,用于出版扫描测绘等

五、数学工具

        会使用到一些基本的数学工具:概率统计、线性代数、微积分等知识。

                        

你可能感兴趣的:(图像处理,人工智能,图像处理)