好久没写博客了,写一波。此为umich eecs504的第二课笔记。
图像分类
完美图像
完美图像(perfect image)是连续图形,完美图像由一个物理过程所产生。
将这个物理过程用I所表示,他们代表了从平面上的点到一个数字的映射,即
Remark:
Remark: 抽象后我们可以将定义域看作超平面上的点,其维度可以超过2 。如此,哦我们可以将它们定义成一个映射:
由所经受的物理过程所决定
Remark: 完美图像仅在无法取样的时候存在抽象化。
例子:朗伯模型(Lambertian Image)
朗伯模型是一个经典的漫反射模型。朗博模型中光的反射量由入射角的余弦角所决定。
考虑一个点 在朗伯表面上,其对此表面的法向量 。入射角的方向是。 此时反射可以写作:
其中是一个常量,用于描述材料属性。
仍和的反射光与我们的图像平面相交时,都会引起我们的完美图像
其中P投影函数,I(u)是投影的能量
问题:朗伯模型的缺点是什么?
朗伯模型难以对光滑的表面,比如金属,进行建模。此时我们需要Phong模型。
数字图像
虽然我们不能直接获得完美图像,但是我们可以通过电子设备将其转换之。如此做,我们可以通过量化和取样完美图像来获得数字图像。
定义:数字图像是取样和量化完美图像所获得。它们展现出从点到非负自然像素(non-negative natural pixels)到自然数的映射
Remark:数字化是一个投影()
Remark:“取样”指的是坐标值的数字化,“量化”指的是(能量,亮度)强度值的数字化。
Remark:取样密度由传感器的物理限制所约束
Remark:量化深度由特殊的硬件所决定。8bit的量化广泛应用于数字化的图像。
Remark: 在特定的数字化情境下(可能指Bayer pattern)完美图像被用于梳理感兴趣的信号。
数字图像建模
对数字图像的数学解释
- 一个从像素到数字的离散函数
- 作为对于原来完美图像的一个近似,我们对一个函数的值域和定义域进行了一个泛化,并且用函数的形式呈现出来。(We generalize domain and range of this function to once again consider a continuous image, albeit an approximate one to our original perfect image,这句话有点离谱)
定义:一个离散图像是一个数字图像的自然数的数字型概述。它获取数字图像中的整数像素位置并且将其映射到整数像素值上。
Remark:它可以表示更高维的图像,比如(视频),并且值域维度也可以更高,比如(三色图像)。
Remark:我们将一个图像的值于的整数的子集称作
例子:Potts 模型
Potts模型是一个离散图像模型。Potts模型最初在统机物理学中作为双态化模型(two-state Ising model)的推广而派生出来的。它假定了一个分段常熟图像信号。对于大小为的图像,我们将其写作能量泛函(energy functional)。
是一个建模常数,最初与所研究的材料的物理性质有关,我们忽略了区域上的边界条件是指示器函数。根据Potts模型的定义,我们发现模型的能量正比于横纵像素的变化。当图像由大的恒定取与,他将具有相应的能量。
定义:一个连续图像可以将离散图像泛化(generalize)为定义域与值域。
Remark:对于离散图像的相似的定义域和值于的泛化可以用于连续模型
Remark:离散与连续混合的表现是非常常见的
Remark:插值。通过数字化过程,最初的完美图像已经被量化到整数坐标了。为了研究连续图形并分析,我们需要不断地对非整数坐标进行插值。
图像操作
在图像的函数解释下,我们可以用数学的角度去处理图像。
在图像的函数解释下,图像的三个主要操作:
- 空间范围操作(Spatial Range Operation)如计算图像所有强度值的和
- 范围映射操作(Range map operation)比如计算图的差别
- 定义域操作或几何变换比如平移和旋转
空间范围操作
空间范围操作讲一个区域内所有信息集合起来,将一个图像的区域定义成 。其中W代表一张图像中的窗口(windows)。
定义:一个空间范围操作是一个讲一张图映射到一个实数的函数
其中为图像本身。
Remark:我们使用缩写来表示定义域由所截取的新图,这种新图也叫子图(sub-image),或者image patch。
Remark:我们可以讲当作一种函数,当时,这种函数讲像素映射到。我们可以将mask应用在图像上。在空间范围操作应用之前,我们也可以基于窗口在函数上实现特殊的定义域。
Remark:一个空间范围操作是线性的当
与是任意常标量。
Remark:空间范围操作可以在图像领域中被组合去组成复杂的操作符。
范围映射操作
范围映射擦欧总作用于图像值域,他们将单个操作作用域整个图像域
定义:一个范围映射操作对于图像来说,是一个函数作用域图像定义域的每一个空间中,范围映射操作会产生一个新的图像。
图像
procedure GENERIC_RANGE_MAP_OPERATOR:
foreach pixel s do
let be the window into at centered at s
end for
end procedure
Remark:范围映射操作的输出集是实数集。实际操作上,它常被放宽到实数或者其他的范围。
Remark:范围映射操作通常被用于一个被称作强度转换(intensity transformations)的像素窗口。文献中存在许多可能的强度变换 (very many possibly intensity transformations exist in the literature,不会翻译)并且包括了操作符比如直方图均衡化(histogram equalization),线性放大(linear scaling)或者log转换等。
例子单像素范围映射强度转换。一个强度转换的例子是对负图像的转换。每一个新像素的值是输入值的负值。
Remark:一个特殊的范围映射例子是映射到二进制像素而不是实数:
对于二进制图像。
例子二进制函数的范围映射
考研率一个二进制阈值操作符。在一个确定的范围对每一个像素窗口,选择像素值。
或在更大的窗口中使用空间范围操作符,比如:
Remark:在一个范围操作符中,空间范围操作在一个大窗口将应用相同的操作在这个图的每一个区域内。
Remark:一个特别重要的参数在一个空间操作符中的是核(kernel)。一个核是一个与大小相同的矩阵。核的值都是实数,。在核操作中,核与图像窗口的元素积操作被计算与累加起来。这个操作最容易被向量化的核与图像窗口的点积所表示。向量化一个矩阵代表连接一个矩阵的所在列,并且将其连成一个长列向量。
当核操作被应用于整个图像中的一个范围映射的时候,我们可以将这个过程称作离散卷积,并用符号表示。我们为了输出图像位置而写下这个卷积。核的大小是因此一个窗口可以索引至与被写作
我们将核映射应用于所有位置,适当地考虑图像边界,即简单的说,它是创建图像的函数。这里有一个卷积的连续模拟,但是我们暂不进行讨论。假如维度与核相匹配,这个操作可以清晰地泛化到高维。
例子离散图像求导
在图像的函数解释下,像这样的计算式非常正常的。
对的部分求导是
考虑一个离散图像模型,我们有一个固定的值可以让我们去考虑一个有限(离散)差别的解释:
最后,考虑到离散图像,我们可以将设为1来表示一个像素的差别。我们将有限差别符设为
将其用于核中,则纵向为,横向为
Remark:范围操作可以是二元,三元,或者同时任意数字
例子图像拉普拉斯与0-crossing
考虑图像 被核与所卷积处理,与是分别从与的高斯函数中取样出来。将卷积出来的图像称为与。取两者之差。可以发现图像的边缘被凸显出来。
一个突然的强度改变会在一阶导提升到顶峰,或者在二阶导达到0-crossing
之前的例子(离散图像求导)表现了一阶导,这个例子考虑二阶导
这两个(二阶导和高斯核)效果相近
专业术语翻译对照(不确定是不是对的)
完美图像: perfect Image
定义域: Domain
值域:range
朗伯模型Lambertian Model
数字图像 digital Image
非负自然像素 non-negative natural pixels
取样:Sampling
量化:quantization
感兴趣的信号 signals of interest.
双态化模型:two-state Ising model
指示器函数:indicator function
泛化generalize
空间范围操作 Spatial Range Operation
范围映射操作 Range map operation
文献中 in the literature