文献阅读:PA-MVSNet: Sparse-to-Dense Multi-View Stereo With Pyramid Attention

PA-MVSNet: Sparse-to-Dense Multi-View Stereo With Pyramid Attention

1、四个问题
要解决什么问题?

3D reconstruction。
用了什么方法解决?
在MVSNet的基础上,加入了特征金字塔、注意力机制。
不同尺度的金字塔注意力模块直接用于下一层,而不是构件特征金字塔作为输入。
效果如何?
在DTU上评估,PA-MVSNet准确率为0.313,强过Point-MVSNet,差于Gipuma;完整度为0.437,好过Gipuma和R-MVSNet,弱于Point-MVSNet。
文中提出求准确度和完整度的平均值来评估整体重建质量,其为0.375,胜过Gipuma和Point-MVSNet。

还存在什么问题?
文中提到,其他方法存在内存消耗过大,或计算量庞大的问题。其在实验中只提到关于完整性和准确率的对比结果。由于其使用的特征金字塔方法,估认为,该方法计算量不小。
论文简介:
**摘要:**基于多视图的3D重建旨在通过二维图像获得空​​间物体的3D结构信息。 本文提出了一种新的多视图立体网络,可以稳健地重建场景。 为了增强 Point-MVSNet 的特征表示能力,引入了金字塔注意力模块。 具体来说,利用多尺度特征金字塔的注意力机制来捕捉更大的感受野和更丰富的信息。 不同尺度的金字塔注意力模块的结果直接用于下一层,而不是构建特征金字塔作为输入。
该网络最终通过迭代细化计划为从稀疏到密集的 3D 重建生成高质量的深度估计。 通过与 DTU 数据集上的现有最先进方法进行比较,已经进行了实验以评估 3D 重建质量。 实验结果表明,与以前的方法相比,我们的方法在整体质量上表现最好,证明了我们方法的有效性。 最后,我们利用移动设备采集的数据,结合传统方法和基于学习的方法实现3D重建,为移动设备上的3D重建技术提供思路。
网络结构
文献阅读:PA-MVSNet: Sparse-to-Dense Multi-View Stereo With Pyramid Attention_第1张图片
文献阅读:PA-MVSNet: Sparse-to-Dense Multi-View Stereo With Pyramid Attention_第2张图片
文献阅读:PA-MVSNet: Sparse-to-Dense Multi-View Stereo With Pyramid Attention_第3张图片
实验结果:
文献阅读:PA-MVSNet: Sparse-to-Dense Multi-View Stereo With Pyramid Attention_第4张图片

你可能感兴趣的:(文献阅读)