图像增强的目标在于生产一个比原图更"合适"的的图片。“合适”这个词在不同的应用中有不同的含义。
图像捕获过程不可避免地会引入失真,从而降低图像质量。
视觉质量评估不足以用于计算机视觉应用。
图像质量应基于定量特征,这最终会影响对象识别和参数测量。
所有失真可以分为两类:
清晰度决定图像可以清晰再现的细节量。
清晰度取决于几个因素:镜头质量,聚焦精度,传感器分辨率(传感器尺寸以像素为单位), CFA插值算法, 由于手抖导致的模糊。
相机制造商通常只宣传传感器分辨率。
清晰度的可测量参数是在垂直或水平方向上可以看到多少条黑白线。
某些图像分析和对象识别操作不需要高分辨率图像。
图像尺寸可以通过下采样(sub-sampling)来减小。
对图像进行直接下采样(去掉每第二个样本)很可能会违反采样定理(sampling theorem)而引入混叠。
采样定理 (the sampling theorem) : delta <= 1 / (2 * Fmax)
delta : 样本之间的间隔
下采样:通过将每一个其他行和列丢弃从而创建一个相对原图1/2大小的图片。
混叠: 是指由于数字采样率不足而导致的信号频率测量错误。如果未使用足够的数据点对信号进行采样,则其真实频率将被低估。该错误估计的信号将与具有该真实较低频率的另一个信号无法区分。
如果Fmax = Fmax / 2,则下采样(sub-sampling)不会引起混叠。
以N倍进行图像缩放的过程分为两个阶段
1.使用适当的频带限制滤波器将最大频率限制为Fmax / N
2.通过在N中仅保留一个样本来抽取图像
带限滤波器通常实现为线性运算,该线性运算使用输入样本的加权总和生成输出样本。
如图所示,这是个具有三个权重的带限低通滤波器(band limited low-pass filter)。滤波器对输入中的每三个数都进行运算并得出结果,该结果就是新输出的值。
由于某些样本将被丢弃,因此可以将过滤和下采样过程结合起来以跳过不需要的位置
由于使用了下采样,因此滤波器的步长增加了。
由于图像是样本的二维数组,因此会被二维滤波器过滤。二维滤波器是权重(滤波器系数)的二维数组。二维滤波器在图像上逐列逐行移动并生成处理后的输出图像。
步骤(循环执行):
具有Bayer模式的图像传感器的RGB分量以不同的速率采样。
而相机制造商通常会匹配G速率,即使这会导致R和B出现混叠。
颜色混叠无法消除,但可以通过CFA插值降低其可见性。(详见上一章)
从理论上讲,当镜头聚焦到某个物体上时,与相机相距其他距离S的所有物体都无法聚焦。实际上,稍微靠近焦点的对象的前面和后面的对象也会显得相当清晰。 这种额外的深度称为景深(depth of field)。所有其他物体将模糊。
小的景深通常是艺术照片的理想功能,这用于强调感兴趣的物体并将其与背景隔离。计算机视觉相机可能需要较宽的景深,以便于分析复杂的场景。F-number越大,景深值越大。
焦外模糊导致景深以外的所有物体的分辨率下降。焦外模糊以类似于低通滤波的方式影响图像。
数字图像处理可通过应用逆滤波器来提高图像清晰度,但副作用是会引入振铃效应。
振铃效应(ringing artifact):所谓“振铃”,就是指输出图像的灰度剧烈变化处产生的震荡,就好像钟被敲击后产生的空气震荡。
运动模糊导致快速运动方向的分辨率下降。数字图像处理可以提高图像清晰度,但副作用是它同样会产生振铃效应。
捕获高动态范围场景可能会导致饱和。
那些到达最大量化级别255的样本被裁剪,从而都变成了255的均匀区域,细节丢失了。
自动曝光 (auto-exposure) 和自动增益控制 (automatic gain control) 效率低下的数码相机可能会捕获未使用所有量化级别的图像,从而导致细节丢失。
简单的对比度增强 (contrast enhancement) 仅改变图像的视觉外观,而使用相同数量的量化级别。
直方图是具有[0,L-1]范围内的灰度的图像的直方图(其中L通常为256)
其是离散函数 h® = n, 其中r是k级灰度值 ( 0 - 255), n是图像中拥有该灰度值的像素数量。
要归一化该直方图,我们需要让每个灰度级的n除以图片的总像素数。
任何增强最终都会改变图像的颜色或强度分布。我们可以直接修改图像直方图来实现增强。
均衡化:尝试使增强图像的直方图平坦,即利用所有可用的颜色/强度级别。目标是将图像直方图处理成第三张图的样子。
规格/匹配:将图像的直方图修改为所需的直方图,令大多数观者感到满意。
光源对颜色外观的影响以显色指数(CRI)表示,范围为0-100。 天然室外光的CRI为100,可作为其他任何光源的比较标准。
数码相机是一种除数字之外还包含模拟组件的电子设备。接收和处理目标信号会受到电流的随机波动,电子电路参数的随机变化以及来自其他电子组件的干扰的影响。噪声是一个随机过程,因此无法通过与影响图像质量的其他因素类似的方式消除,例如:分辨率,失焦 (defocus),色彩保真度 (colour fidelity),曝光不足 (under-exposure) 等。不采用统计和概率论就不可能降低噪声。
噪声是一个随机过程,因此只能从统计学角度进行描述。其他统计参数也表征噪声,如均值和标准差。不同类型的噪声具有不同的概率密度。
有两种最常见的概率密度:
量化噪声的均匀概率密度在[0…delta]的区间内。
若使用舍入 (truncation) 代替截断 (rounding),则区间为[-delta/2 … delta/2]
大量独立随机过程的总和将具有大致的高斯概率密度。由于图像噪声来自多个独立来源,因此其分布近似为高斯分布,其中均值 = 0。
图像质量分析,图像处理和图像增强算法基于以下模型:均值为0的高斯分布噪声会添加到图像样本中。
提高色彩还原的准确性色彩校正会放大噪音。由于色彩校正是线性运算且噪声是加法运算,因此我们可以独立分析噪声传播。
为了简化分析,我们做出两个假设:
频域图像处理的基本步骤。首先图片原始信号f(x,y)会通过傅里叶变换转成傅里叶频谱F(u,v), 接着经过滤波操作。之后再通过反向傅里叶变换为增强的图片信号。
数学论证较为复杂,详见大神李永乐老师的讲解。
傅立叶变换如何理解?美颜和变声都是什么原理?李永乐老师告诉你
步骤:
根据通过图像光谱的哪个部分以及抑制光谱的哪个部分,可以将所有滤镜分为几组。
作为典型的自然图像频谱,低频成分占主导地位。因此可以使用低通滤波器来除噪。 当滤波器的所有权重的总和等于1,滤波器不会影响图像的平均亮度。
下图展现几种常用的Low pass filter - LPF内核,它们结合了合理的噪声抑制特性和较低的实现复杂性。
缺陷:LPF抑制噪声,也会影响图像。如果图像包含对象的锐利边缘 (sharp edges),则它们会变得模糊。
理想的噪声抑制滤波器必须
1.有效降低噪音水平,尤其是在均匀区域。
2.不要模糊物体边缘。
Anisotropic Diffusion是一种自适应滤波器,可避免跨对象边界进行LP滤波。其根据相邻图像像素在相应方向上的差异计算权重h。
图像在不同比例下可能看起来完全不同。 一种强大而简单的结构通常在计算机视觉图像金字塔中被使用,它以一种以上的分辨率表示图像。