OSDI 2023: 3D Video Loops From Asynchronous Input

我们使用以下6个分类标准对本文的研究选题进行分析:

1. 场景表示:

这个标准根据研究对所研究场景的表示方式进行分类。每个类别都有不同的优势和局限性:

  • 神经辐射场 (NeRF): 该技术将场景表示为一个连续的体积,其中每个点都有颜色和密度值。它对于复杂场景很强大,但计算成本很高。
  • 体积表示: 类似于 NeRF,它使用 3D 网格来存储体素信息,提供高效的操作,但可能需要大量的内存。
  • 全景/光场视频: 这些同时捕捉场景的多个视图,实现逼真的视图合成,但可能体积庞大且难以捕捉。
  • 其他: 该类别涵盖了各种表示形式,如层叠模型、网格表示和隐式神经表面,每个都适用于特定场景。

2. 场景动态:

这个标准根据场景是否静态或动态对研究进行分类:

  • 静态: 这些研究侧重于没有或最小移动的场景,简化了分析和视图合成技术。
  • 动态: 这些研究处理具有移动对象或随时间变化的场景,需要更复杂的方法来捕捉和表示动态。
  • 部分动态: 这中间类别涵盖了特定元素移动的场景,而背景保持静态,呈现独特的挑战。

3. 视图合成技术:

这个标准根据用于从捕获数据生成新视图的方法对研究进行分类:

  • 基于神经网络: 深度学习技术,特别是 NeRF,由于其灵活性和质量,越来越流行用于视图合成。<

你可能感兴趣的:(3d,深度学习,人工智能)