数字图像基础

“图”是客观世界物体反射或透射光的分布,是客观世界的反映;而“像”则是人类视觉系统对图的响应,是人的大脑对图的印象或认识,是人的一种感觉。图像(image)是图和像的有机结合,既反映物体的客观存在,又体现人的感知因素。

一幅图像可表示成一个范围有限二维空间内幅值有限的函数,其数学表达为:[插图]其中x,y表示图像中的空间坐标,I=f(x,y)表示图像某个位置的响应值,xstart和xend表示图像在水平方向上的边界,ystart和yend表示图像在垂直方向上的边界,Imin和Imax分别表示响应幅值的最小值和最大值。如果图像空间坐标x,y连续,且响应值f(x,y)连续,则图像为模拟图像。数字图像指的是空间坐标及响应值均不连续的图像。针对数字图像所进行的图像优化或信息抽取称为数字图像处理。

图像的数据是基于像素的位置来提供的

图像采样是将一幅在空间上连续分布的模拟图像分割成M×N的网格,每个网格称为一个像素,M×N称为图像的空间分辨率。根据香农采样定理,只要采样的频率大于被采样信号最高频率的2倍,就可以由采样信号对原始信号的形态进行完整恢复。图像采样可以看作是对原始图像信号的一种数字化逼近。

连续的成本太高了,我们的研究都是要剥离无关的因素,通过离散的数据来研究这个世界。

数字图像由二维元素组成,每个元素包含一个坐标(x,y)和一个响应值f(x,y),每个元素也称为数字图像的一个像素。数字图像是由像素组成的二维排列,如图1-1所示,其可以用像素构成的二维矩阵表示。对于灰度图像而言,每个像素可用一个整数值来表示,其范围通常为0~255,其中0表示最低亮度(黑),255表示最高亮度(白),其他值表示中间灰度。彩色图像则由红、绿、蓝三元组矩阵来表示,三元组的每个数值的范围通常也是0~255。

每个像素点可以有不同的颜色构成,而每种颜色是通过一个字节来表征的;

物理层的任何一个信道,它所能承受的信号频率(或者说是信道带宽)是有限的,就像任何一条河流只能承受一定峰值的水流量一样。在信道中,超出限定的频率范围的信号都将被直接滤出,不能通过信道,就像河流中任何超出它流速限制的水流量最终不能形成实际速率的水流量一样。

信号不能产生的太快,否则传输线处理不及就会被丢弃掉;

在数据通信中有数字信号传输和模拟信号传输之分(对应也就有数字信道和模拟信道之分了),但数字信号的传输要求与模拟信号的要求不同:模拟信号的传输要求接收端无波形失真,而数字信号的传输则要求接收端无差错地恢复成原来的二进数码(可以允许接收波形失真,只要不影响正确恢复信号编码即可)。在模拟信号传输中,为了达到不失真的效果,就需要对由模拟信号转换成数字信号过程中的采样频率进行限制;而在数字信号传输中,就需要对信号传输速率进行限制。

模拟信号和数字信号可以彼此的转换,自然也可以使用不同的信道来传输;但是为了保证信号或者说数据的无损转换,还是有一些要求的;

模拟信号通过数字信道传输需要保证数字信号的采样频率才能完整的恢复模拟信号;

数字信号通过模拟信道传输,需要对信号的传输速率进行限制,以便使它跟模拟信道相匹配;

图像采样是对图像空间位置的数字化,采样需要确定水平和垂直方向上分割出像素的数量,该数量又称为图像的分辨率。一般而言,采样间隔越大,所得图像像素数越少,空间分辨率低,图像质量差,严重时出现马赛克效应;采样间隔越小,所得图像像素数越多,空间分辨率高,图像质量好,但数据量较大。

数字化的采样频率决定了对连续性信号的还原程度;

按照采样方式,可以将采样分为均匀采样与不均匀采样两类。均匀采样是现在最常用的采样方式。均匀采样根据所需分辨率M×N,将图像均匀地分为M×N个块,然后对每个图像块Δij,使用采样函数S,求得其采样结果值S(Δij)。比较常用的采样函数是求区域平均值。不均匀采样则是在需要体现细节的位置增加采样频率,而在图像变化较小的区域,相应减小采样频率。

从统计学上来说,平均值是相对实现简单并且可以一定程度的消除偶然误差;

模拟图像经过采样后,在空间上实现了离散化,并形成像素。但采样所得的像素值(即灰度值)依旧是连续量。采样后所得的各像素的灰度值从连续量到离散量的转换称为图像灰度的量化。图像的像素值(响应值)I(x,y)的数字化被称为图像的量化,即将图像响应值I(x,y)从Imin到Imax的实数域映射为有限级别的离散数值。图像采样将图像的空间域限定为有限的离散坐标,而图像量化则将图像的响应值限定为有限的离散数值。与图像量化相关的度量为灰度级。灰度级(灰度层次)是表示像素明暗程度的整数量。

图像的数字化形成的是一个3D的数据;

在空间的任何一点都有可能是不同的色彩;人生在不同的空间和时间来说也是不同的;任何的事情都不是永恒不变的,我们要利用这些周围的资源来进行自我的成长;

图像的量化比率决定了图像的颜色精细程度。目前的一般做法是从图像响应最大值到响应最小值进行均匀量化,划分为若干量化层级。目前常见的量化级数一般为2n,如256或者65536。最小的量化级数为2,即灰度图像转变为二值图像,量化后的图像仅有0和1两种灰度取值。除均匀量化方法外,也存在非均匀量化。非均匀量化即在灰度级变化剧烈的区域用细粒度量化,而在灰度级比较平滑的区域用粗粒度量化。

很多时候通过简单的折中的方式就能解决我们面对的问题,没有必要追全昂贵的十全十美;

图像分辨率是指组成一幅图像的像素密度。对同样大小的一幅图,组成该图的图像像素数目越多,说明图像的分辨率越高,看起来越逼真。相反,像素越少,图像越粗糙。图像分辨率包括空间分辨率和灰度级(响应幅度)分辨率。空间分辨率是图像中可辨别的最小空间细节,取样值多少是决定图像空间分辨率的主要参数。灰度级分辨率是指在灰度级别中可分辨的最小变化。灰度级数通常是2的整数次幂。通常把大小为M×N、灰度为L级的数字图像称为空间分辨率为M×N像素、灰度级分辨率为L级的数字图像。

更多的数据才能有更详细的信息细节,那就需要更多的空间点和对每个点的描述信息;
数字图像有两个分辨率,即图像分辨率与输出分辨率。
输出分辨率(Dots Per Inch,DPI)是指设备输出图像时每英寸可产生的点数。

硬件也就是dpi对图像的显示限制更多,所以一些行业更关注dpi;

相同像素的图片,在高dpi的设备上更小,像素越高,电脑的字体越小;

不同像素的图片,在相同的dpi设备上,像素小的图片更模糊。

二值图像也称单色图像或1位图像,即颜色深度为1的图像。颜色深度为1表示每个像素点仅占1位,一般用0表示黑,1表示白。灰度图像是包含灰度级(亮度)的图像,每个像素由8位组成,其值的范围为0~255,表示256种不同的灰度级。彩色图像每个像素由3个8位灰度值组成,分别对应红、绿、蓝3个颜色通道。

图像在计算机内以文件的形式进行存储,图像文件内除图像数据本身外,一般还有对图像的描述信息,以方便读取、显示图像。文件内图像表示一般分为矢量表示和栅格表示两类。矢量表示中,图像用一系列线段或线段的组合体表示。矢量文件类似程序文件,里面有一系列命令和数据,执行这些命令可根据数据画出图案。常用的工程绘图软件如AutoCAD、Visio都属于矢量图应用。栅格图像又称为位图图像或像素图像,使用矩阵或离散的像素点表示图像,栅格图像进行放大后会出现方块效应,常见的图像格式BMP是栅格图像的典型代表。

图像文件不仅要包含图像本身的数据,还需要包含每种图像格式的特有数据;

你可能感兴趣的:(深度学习,数字图像)