CVPR 2023: RIAV-MVS Recurrent-Indexing an Asymmetric Volume for Multi-View Stereo

我们使用以下6个分类标准对本文的研究选题进行分析:

1. 匹配策略:

  • 局部 vs. 全局方法:

    • 局部方法: 在图像的小块区域上进行操作,考虑它们的相似性和空间关系。例如 PatchMatch [5] 和 Sum of Squared Differences (SSD)。这些方法效率高,但可能难以处理较大的深度不连续性。
    • 全局方法: 同时考虑整幅图像或场景,以获得全局一致的深度分配。例如 Semi-Global Matching (SGBM) [24] 和深度学习方法 [31]。它们通常能获得更高的精度,但计算成本可能更高。
  • 基于特征 vs. 基于学习的方法:

    • 基于特征的方法: 依赖于手工制作的特征,例如梯度或 Census 变换 [14] 来表示图像内容进行匹配。这些方法具有可解释性,但可能无法捕捉复杂的图像关系。
    • 基于学习的方法: 利用机器学习,特别是卷积神经网络 (CNN) [23],直接从数据中学习匹配函数。它们可以适应复杂的图像模式,但可解释性较差,并且需要大量的训练数据。

2. 输入数据:

  • 单视图 vs. 多视图立体视觉:

    • 单视图: 从单幅图像中估计深度,通常利用学习先验或场景理解。例如 Pseudo-LiDAR [55]。这些方法方便,但可能难以处理模糊性和缺乏纹理。
    • 多视图: 使用来自不同

你可能感兴趣的:(人工智能,视觉,模型,AI,3d)