【论文精读】As-Projective-As-Possible Image Stitching with Moving DLT

图像拼接系列相关论文精读

  1. Seam Carving for Content-Aware Image Resizing
  2. As-Rigid-As-Possible Shape Manipulation
  3. Adaptive As-Natural-As-Possible Image Stitching
  4. Shape-Preserving Half-Projective Warps for Image Stitching
  5. Seam-Driven Image Stitching
  6. Parallax-tolerant Image Stitching
  7. Parallax-Tolerant Image Stitching Based on Robust Elastic Warping
  8. SuperPoint: Self-Supervised Interest Point Detection and Description

文章目录

  • 图像拼接系列相关论文精读
  • 摘要
  • 1.APAP总体实现流程
  • 2.APAP
    • 2.1 投影扭曲
    • 2.2 移动DLT
  • 3.高效学习图像拼接
    • 分成cells
    • 更新SVD权重
  • 4.results
  • 5.实验结果
  • 论文中图1可视化复现

APAP项目主页,包括代码数据等:https://cs.adelaide.edu.au/~tjchin/apap/


摘要

大名鼎鼎的APAP。

主要思想:单一投影矩阵只适用于二维平面和旋转的情况,对于扭曲图像会出现重影和明显的视差,拼接线等不好的视觉效果。本文的关键就是得到全局投影,平滑拼接,使用的去重影算法就是MDLT,使用网格划分的方式无缝配准。

关键词:图像拼接,投影扭曲,全局投影,MDLT,网格。

DLT:direct linear transform 直接线性变换

应该是使用网格算法来进行图像拼接的开山之作。

1.APAP总体实现流程

  1. 提取两张图片的sift特征点

SIFT:尺度不变特征变换(Scale-invariant feature transform)
在空间尺度中寻找极值点,并提取出其位置、尺度、旋转不变量

  1. 对两张图片的特征点进行匹配

用cv2的knn或者vlfeat十分方便,有的sift库可能因版权限制不能使用

  1. RANSAC的改进算法筛选特征点,使筛选后的点能一一对应,无匹配错误

RANSAC:Random Sample Consensus随机样本一致:有目的的得到目标数据

  1. 使用DLT,将剩下的特征点进行透视变换矩阵估计。
  2. 将图像网格划分,每个网格逐一估计。

2.APAP

2.1 投影扭曲

这部分就是计算3*3单应矩阵H的过程。如下图。
【论文精读】As-Projective-As-Possible Image Stitching with Moving DLT_第1张图片

2.2 移动DLT

重点是这部分。

当两张图片不只是通过旋转相机或不在同一平面时,用投影扭曲不可避免会产生伪影。为了减少伪影现象,就是给每一个网格使用一个独立的局部单应。其实就是多加了一个权重w,之前是Ah,现在是WAh。权重由每个像素与该像素格子左上角的距离确定。

论文中的公式11:
w ∗ i = m a x ( e x p ( − ∣ ∣ x ∗ − x ∣ ∣ 2 / σ 2 ) , γ ) . (11) w_*^i = max(exp(-||x_*-x_||^2/\sigma^2),\gamma).\tag{11} wi=max(exp(xx2/σ2),γ).(11)
其中gamma是在0-1之间的一个很小的值,gamma趋近于1,每个网格的局部单应就变成了整体的全局单应。

3.高效学习图像拼接

首先是使用RANSAC,用DLT算出全局单应的最小解。阐述了RANSAC的重要,因为outliers的错误要比inlier错误严重的多。这是个很重要的思想:就是内点可以少也可以有错误,但是外点匹配错误必须尽可能避免。

分成cells

将所有像素点作为一个cell太浪费了,因为相邻位置实际上计算的是相同的单应。分成C1*C2,网格中心作为每个网格扭曲的点。

更新SVD权重

更新SVD不用重头计算。具体的代码中详述。

4.results

比较不同的方法,也测试了不同大小的图像。
主要是一些超参数的值选择。还有RMSE定量指标。
γ ∈ [ 0.0025 , 0.025 ] \gamma \in [0.0025,0.025] γ[0.0025,0.025],网格控制在5050-100100之间。

5.实验结果


明显比全局单应效果更好。

论文中图1可视化复现

【论文精读】As-Projective-As-Possible Image Stitching with Moving DLT_第2张图片

你可能感兴趣的:(论文笔记,图像拼接,image,stitching,图像处理,论文精读,python)