AKAZE算法分析

1 算法简介

  局部特征相关算法在过去二十年期间风靡一时,其中代表的有SIFT、SURF算法等(广泛应用于目标检测、识别、匹配定位中),这两种算法是用金字塔策略构建高斯尺度空间(SURF算法采用框滤波来近似高斯函数)。不论SIFT还是SURF算法在构造尺度空间时候存在一个重要的缺点:高斯模糊不保留对象边界信息并且在所有尺度上平滑到相同程度的细节与噪声,影响定位的准确性和独特性
  针对高斯核函数构建尺度空间的缺陷,有学者提出了非线性滤波构建尺度空间:双边滤波非线性扩散滤波方式。非线性滤波策略构建尺度空间主要能够局部自适应进行滤除小细节同时保留目标的边界使其尺度空间保留更多的特征信息。例如:BFSIFT采取双边滤波与双向匹配方式改善SIFT算法在SAR图像上匹配性能低下的问题(主要由于SAR图像斑点噪声严重),但是付出更高的计算复杂度。AKAZE作者之前提出的KAZE算法采取非线性扩散滤波相比于SIFT与SURF算法提高了可重复性和独特性。但是KAZE算法缺点在于计算密集,通过AOS数值逼近的策略来求解非线性扩散方程,虽然AOS求解稳定并且可并行化,但是需要求解大型线性方程组,在移动端实时性要求难以满足。

2 非线性扩散滤波

  作者目的在于如何将局部特征算法应用到移动设备(由于移动设备资源有限同时实时性要求较高),主要正对KAZE算法改进一下两点1 利用非线性扩散滤波的优势获取低计算要求的特征,因此作者引入快速显示扩散数学框架FED来快速求解偏微分方程。采用FED来建立尺度空间要比当下其它的非线性模式建立尺度空间都要快,同时比AOS更加准确。2 引入一个高效的改进局部差分二进制描述符(M-LDB),较原始LDB增加了旋转与尺度不变的鲁棒性,结合FED构建的尺度空间梯度信息增加了独特性。与SIFT、SURF算法相比,AKAZE算法更快同时与ORB、BRISK算法相比,可重复性与鲁棒性提升很大。

3 Accelerated-KAZE特征

3.1 快速显示扩散(FED)

  非线性扩散滤波描述图像亮度的演化是通过提升尺度参数作为热扩散函数的散度因子来控制扩散过程。通常采用偏微分方程进行求解,由于涉及微分方程非线性性质,通过图像亮度的扩散来构建尺度空间。经典非线性扩散方程如下:

L/t=div(c(x,y,t)L) ∂ L / ∂ t = d i v ( c ( x , y , t ) ∙ ∇ L )
  参数解释: L为图像亮度矩阵, div分别代表散度与梯度求解操作。由于扩散方程中引入传导函数 c能够自适应于图像局部结构特性进行扩散。传导函数依赖于图像局部差分结构可以是标量或者张量形式。时间参数t对应于尺度因子,在扩散过程中通过图像梯度大小来控制。传导函数公式定义如下:
c(x,y,t)=g(|Lσ(x,y,t)|) c ( x , y , t ) = g ( | ∇ L σ ( x , y , t ) | )
参数解释: Lσ ∇ L σ 是经过高斯函数(尺度参数 σ)平滑图像 L。针对区域扩散平滑最优选择传导核函数:
g2=1/((1+|Lσ|2/λ2)) g 2 = 1 ⁄ ( ( 1 + | ∇ L σ | 2 / λ 2 ) )
  参数 λ λ 用来控制扩散的程度,决定边缘区域要进行增强且平坦区域滤波的决策因子。 FED结合显式和半隐式理论的优势互补, FED求解的思想动机来自于显式理论分解 box滤波器:能够很好的近似高斯滤波器和便于应用。执行 M个循环的 n次显示扩散步骤,每次步长大小 τj τ j 来自于 box filter滤波器的因子分解:
τj=τmax/(2cos2(π(2j+1)/(4n+2)) τ j = τ m a x ⁄ ( 2 c o s 2 ( π ( 2 j + 1 ) / ( 4 n + 2 ) )
   当然, τmax τ m a x 最大步长阈值目的在于不能违背显式求解稳定条件的范围。由于 FEDbox滤波相似性,盒滤波始终稳定状态,因此可以获取 FED循环结束的稳定。上式1用矢量化矩阵进行表示如下:
(L(i+1)Li)/τ=A(Li)Li ( L ( i + 1 ) − L i ) / τ = A ( L i ) L i
  参数解释:A( Li L i )是对图像编码的传导矩阵, τ τ 为一个恒定的步长(限制显式扩散稳定条件)。显式方法中, L(i+1) L ( i + 1 ) 的解将通过前面图像演化 Li L i 与图像的传导函数A( Li L i )直接计算出来:
L(i+1,j+1)=(I+τjA(Li))L(i+1,j)|j=0,1,,n1 L ( i + 1 , j + 1 ) = ( I + τ j A ( L i ) ) L ( i + 1 , j ) | j = 0 , 1 , … , n − 1
  在整个 FED循环中,矩阵A( Li L i )始终保持不变。当 FED循环结束,算法将会重新计算矩阵A( Li L i )的值。

图1 构建非线性尺度空间FED策略流程算法
  构建非线性尺度空间策略与经典SIFT算法类似,通过设置层数 O与塔数 S参数后,通过扩散函数依据时间 ti t i (与尺度参数联系起来)来进行尺度空间的构建。
σi(o,s)=2(o+s/S) σ i ( o , s ) = 2 ( o + s / S )
变量范围:
o[0,1,,O1],s[0,,S1]i[0,,M1] o ∈ [ 0 , 1 , … , O − 1 ] , s ∈ [ 0 , … , S − 1 ] i ∈ [ 0 , … , M − 1 ]
ti=1/2σ2i,i=0M t i = 1 / 2 σ i 2 , i = 0 … M
  从经过高斯平滑后的输入图像中自动计算对比因子 λ λ 为70%比例的梯度直方图。构建尺度空间时下采样阶段要对参数 λ λ 乘以比例系数0.75来适应缩放变换。非线性尺度空间构建完成后,采用Hessian矩阵进行特征点提取同时采用SIFT策略对比相同位置上下两层(加上当前层)的26个点对比是否仍然为极值点。以此完成局部特征点的提取。

3.2 M-LDB描述子

  二进制描述符(ORB、BRISK等)由于高效率(可并行化)计算,在图像变形较小的模式下能够与SIFT算法性能接近。因此被广泛应用在移动端以及实时性要求较高的目标识别、追踪等应用中。最近几年提出的Local Difference Binary(LDB)描述子是由华科杨欣教授在14年提出,LDB通过采用领域的区域强度均值信息水平垂直方向上的梯度信息,来增加二值描述的鲁棒性与区分性。同时划分多种大小不一的网格来描述采取Adaboost算法进行优化(具体内容查阅文末论文链接)。作者进一步针对LDB对图像旋转与缩放性能进行改进,旋转不变性通过KAZE算法的特征点获取主方向,然后LDB的网格进行相应的旋转。M-LDB并不使用所有的划分网格的像素,而是进行网格像素采样(通过采样网格的像素来完成尺度自适应)。采样后平均值近似所划分的细分网格均值效果很好,进行尺度的采样使描述子对尺度变化具有更高的鲁棒性。

图2 M-LDB描述子示意图
  鉴于 M-LDB描述子在计算强度与梯度信息的图像的同一区域均值的布尔值结果并不是相互独立的。通过旋转随机的比特或者更复杂的方式来减少描述子的大小,或许可以改进结果,至少能够减少计算负载而不降低性能。

4 实验性能对比结果

图3 AKAZE算法匹配结果
  AKAZE算法分别与当前鲁棒特征匹配算法SIFT、SURF和快速算法ORB、BRISK分别进行尺度、旋转、JPEG压缩、视差、模糊、抗噪等性能进行全面的评估。通过下图可以看到,AKAZE算法在重复性评估上要优于上述其它的主流局部特征算法。图5通过 Matching Score(MS)和Recall(RC)来进行评估。图6通过不同比特长度的二值 M-LDB描述子进行性能的测试与对比,在模糊与视差数据集比较。同时图6(c)还进行OpenCV与VLfeat视觉库里面SIFT、SURF算法进行系统的比较,结果表明AKAZE算法在计算效率与鲁棒性上都由于经典的局部特征匹配算法。
图4 牛津标准数据集进行尺度缩放旋转等算法性能对比
图5 算法MS和RC性能对比
图6 不同比特位描述子时间评估

5 总结

  局部特征匹配算法发展主要分为两大类:精度提升计算效率提升;自SIFT算法提出之后,出现一系列SIFT框架下的局部特征匹配算法。速度方面:SURF算法是SIFT算法加速版,计算效率成本较SIFT要低3倍。ORB、BRISK等快速局部特征匹配算法主要采用二值描述子进行加速,较SIFT描述符128为梯度差分鲁棒性会降低很多但是速度极大提升。
  当然,在精度上面也出现一系列鲁棒描述子:DAISY描述子、CSIFT算法(多通道信息提取)、GLOH(梯度方向直方图)及其改进描述子等等。总体来说,SIFT框架代表局部特征算法发展趋势:尺度空间的相关改进(多尺度空间保留有效信息去除噪声)、特征点精确提取、构建鲁棒快速描述子、匹配策略及其离群点等步骤。这里面每一个环节都进行相应的改进,不过深度学习大行其道的今天,经典的局部特征算法将会逐渐退出舞台。不过,其背后的思想融入卷积神经网络中,例如多尺度分析思想、卷积核思想、特征分析等等……

代码下载

AKAZE源代码下载:
 作者官网下载 :
   http://www.robesafe.com/personal/pablo.alcantarilla/KAZE.html
OpenCV版AKAZE匹配代码下载:
 百度网盘链接:
   https://pan.baidu.com/s/1lIuv2BQ8MxpgObx6ij3sFw 密码:0lyv
ORB-LDB描述子(匹配)作者官网下载:
  http://lbmedia.ece.ucsb.edu/research/binaryDescriptor/web_home/web_home/index.html

参考文献

http://www.robesafe.com/personal/pablo.alcantarilla/KAZE.html

http://lbmedia.ece.ucsb.edu/research/binaryDescriptor/web_home/web_home/index.html

你可能感兴趣的:(图像处理)