计算机视觉与深度学习-05-纹理表示&卷积神经网络-北邮鲁鹏老师课程笔记
纹理是指物体表面的视觉和触觉特征,它描述了物体表面的细节、图案和结构。
计算机图形学中的纹理既包括通常意义上物体表面的纹理即使物体表面呈现凹凸不平的沟纹,同时也包括在物体的光滑表面上的彩色图案,通常我们更多地称之为花纹。
纹理是由于物体表面的物理属性的多样性而造成的,物理属性不同表示某个特定表面特征的灰度或者颜色信息不同,不同的物理表面会产生不同的纹理图像,因而纹理作为图像的一个极为重要的属性,在计算机视觉和图像处理中占有举足轻重的地位。
纹理是图像中特征值强度的某种局部重复模式的宏观表现。然而,对于自然纹理图像而言这种重复模式往往是近似的和复杂的,难以用语言描述,而人类对纹理的感受多是与心理效果相结合的,因此,迄今都没有一个对纹理的正式的、广泛认可的和一致的定义。
Hawkins曾经对纹理给出了一个比较详细的描述,他认为纹理有三个主要的标志:
卷积核组又称为纹理滤波器组。
前6个卷积核检测是否存在边缘及边缘的方向。
第1个卷积核检测图像中是否有x方向的边缘。(高斯卷积核对y求导)
第4个卷积核检测图像中是否有y方向的边缘。(高斯卷积核对x求导)
第7个卷积核检测图像中是否有斑状基元。
第1个卷积核检测图像中是否有x方向的边缘。(高斯卷积核对y求导)
第7个卷积核检测图像中是否有斑状基元
方式一 (含基元位置信息)
假设图片是 100 * 100,使用上述含7个卷积核的卷积核组,则该图片每一个像素点表示为 r i = [ r i 1 , r i 2 , … , r i 7 ] r_i = [r_{i1},r_{i2},\dots,r_{i 7}] ri=[ri1,ri2,…,ri7], r i m a x = m a x { r i 1 , r i 2 , … , r i 7 } r_{imax} = max\{{r_{i1},r_{i2},\dots,r_{i 7}}\} rimax=max{ri1,ri2,…,ri7}。则 r i m a x r_{imax} rimax对应的特征响应图即为该像素点的特征。
其中 r i r_i ri的维度是 10000 * 1, [ r i 1 , r i 2 , … , r i 7 ] [r_{i1},r_{i2},\dots,r_{i7}] [ri1,ri2,…,ri7]的维度是 10000 * 7,经过变换后 [ r i 1 , r i 2 , … , r i 7 ] [r_{i1},r_{i2},\dots,r_{i7}] [ri1,ri2,…,ri7]的维度为 70000 * 1。
该表示方式的缺点:70000维太复杂。
方式二 (忽略基元位置信息)
纹理分类任务中,基元的位置对纹理分类没有影响。
只关注出现了哪种基元对应的纹理以及基元出现的频率,即用特征响应图的平均值表示图像。
假设图片是100 * 100,使用上述含7个卷积核的卷积核组,则该图片每一个像素点基元平均值表示为 r ˉ = [ r 1 ˉ , r ˉ 2 , … , r ˉ 7 ] \bar r = [ \bar {r_{1}}, \bar r_{2},\dots, \bar r_{ 7}] rˉ=[r1ˉ,rˉ2,…,rˉ7], r ˉ i m a x = m a x { r ˉ 1 , r ˉ 2 , … , r ˉ 7 } \bar r_{imax} = max\{{\bar r_{1}, \bar r_{2},\dots, \bar r_{7}}\} rˉimax=max{rˉ1,rˉ2,…,rˉ7},则 r i m a x r_{imax} rimax对应的特征响应图即为该像素点的特征。
其中 r ˉ i \bar r_i rˉi为第 i 个特征响应图的平均值,其维度是 1 * 1, r ˉ j \bar r_j rˉj的维度是 1 * 7,经过变换后 r ˉ j \bar r_j rˉj的维度为 7 * 1。
举例表示
纹理表示A:r4 比较大,表示y方向的纹理比较多。
纹理表示B:r5 比较大,表示y=x方向的纹理比较多。
纹理表示C:r7 比较大,表示斑点纹理比较多。
r ˉ = [ r ˉ 1 , r ˉ 2 , r ˉ 3 , r ˉ 4 , . . . , r ˉ 46 , r ˉ 47 , r ˉ 48 ] \bar r = [\bar r_1,\bar r_2,\bar r_3,\bar r_4,... ,\bar r_{46},\bar r_{47}, \bar r_{48}] rˉ=[rˉ1,rˉ2,rˉ3,rˉ4,...,rˉ46,rˉ47,rˉ48]中最大值大概率只有一个,因为一张图像包含一个卷积核组所表示的纹理的概率大,包含多个卷积核组所表示纹理的概率很小,所以这个48维向量是稀疏向量。
从纹理表示中的卷积核组理解卷积神经网络的卷积层,神经网络中卷积核可能比上例中纹理表示的卷积核更复杂。神经网络的卷积层可以看做上例中纹理表示卷积核组的扩展。