CVPR 2023: Instant Volumetric Head Avatars

我们使用以下六个特征来刻画本文的研究主题:

1. 输入数据

  • 单图像与视频序列
    • 单图像方法捕获速度更快,但可能在细节和运动模糊方面存在困难。
    • 视频序列提供更多信息,并能够重建动态方面,如表情,但需要更长的时间捕获和处理。
  • 数据类型
    • 仅 RGB 提供基本颜色信息,限制了准确性和照明或材料的重建。
    • RGB-D 包括深度信息,提高了重建准确性并允许 3D 对象操作。
    • 多视图从各种角度捕获对象,增强细节并解决歧义。

2. 神经网络架构

  • 神经网络类型
    • MLP 更简单、更快,但可能在复杂形状和细节方面存在困难。
    • CNN 擅长提取空间特征,适合捕捉纹理和表面变化。
    • RNN 可以处理时间信息,使其在重建动态场景方面具有价值。

你可能感兴趣的:(人工智能,深度学习,机器学习,计算机视觉)