2D到3D视频转换(也称为2D到立体3D转换和立体转换)是将2D(“平面”)胶片转换为3D形式的过程,几乎在所有情况下都是立体声,因此它是创建图像的过程。每个眼睛来自一个2D图像。
2D到3D转换将双目视差深度提示添加到大脑感知的数字图像,因此,如果正确完成,与2D视频相比,在观看立体视频的同时极大地改善了沉浸效果。然而,为了获得成功,转换应该以足够的准确性和正确性进行:原始2D图像的质量不应该恶化,并且引入的视差提示不应该与大脑用于深度感知的其他提示相矛盾。如果正确彻底地完成,转换产生的质量与“原生”立体视频质量相似的立体视频,以立体声拍摄并在后期制作中进行精确调整和对齐。[1]
可以宽松地定义两种立体声转换方法:用于电影和高质量3DTV的高质量半自动转换,以及用于廉价3DTV,VOD和类似应用的低质量自动转换。
如果原始数据仍然可用,则通过添加第二虚拟相机,可以在立体3D中重新渲染利用3D模型制作的计算机动画 2D电影。这在技术上不是转换; 因此,这种重新渲染的胶片具有与最初在立体3D中制作的胶片相同的质量。这种技术的例子包括重新发行玩具总动员和玩具总动员2。重新审视这两部电影的原始计算机数据需要四个月,以及另外六个月的时间来添加3D。[2]然而,由于成本,所需时间,缺乏熟练资源或缺少计算机数据,并非所有CGI影片都会重新渲染以进行3D重新发布。
随着3D中发行的电影的增加,2D到3D转换变得更加普遍。大多数非CGI立体3D大片完全或至少部分地从2D镜头转换。甚至“ 阿凡达”也包含几个以二维拍摄的场景,并在后期制作中转换为立体声。[3]以2D而不是立体声拍摄的原因是金融,技术和艺术:[1] [4]
即使在立体拍摄的情况下,也经常需要转换。除了上面提到的难以拍摄的场景之外,还存在立体视图中的不匹配太大而无法调整的情况,并且执行2D到立体声转换更简单,将其中一个视图视为原始2D源。
不考虑特定算法,所有转换工作流程都应解决以下任务:[4] [5]
高质量的转换方法还应该解决许多典型问题,包括:
大多数半自动立体声转换方法使用深度图和基于深度图像的渲染。[4] [5]
该想法是为每个帧或一系列同质帧创建称为“ 深度图 ” 的单独辅助图片,以指示场景中存在的对象的深度。深度图是具有与原始2D图像相同尺寸的单独灰度图像,具有各种灰度阴影以指示帧的每个部分的深度。虽然深度映射可以在视频中产生相当强大的3D对象幻觉,但它本身不支持半透明对象或区域,也不允许明确使用遮挡,因此这些和其他类似问题应通过单独处理方法。
深度图的一个例子
从单视图或多视图深度图或轮廓生成和重建3D形状[6]
基于深度的转换方法的主要步骤是:
立体声可以以任何格式呈现以供预览,包括立体照片。
耗时的步骤是图像分割/旋转扫描,深度图创建和未覆盖区域填充。后者对于最高质量的转换尤为重要。
有各种自动化技术用于深度图创建和背景重建。例如,自动深度估计可用于生成特定帧和镜头的初始深度图。[7]
从事这种工作的人可能被称为深度艺术家。[8]
多层次[ 编辑]
深度映射,多层次的发展通过引入几层灰度深度掩模来实现有限的半透明度,从而解决深度映射的局限性。与简单技术类似,[9]多层次涉及将深度图应用于平面图像的多个“切片”,从而更好地近似深度和突出。每帧单独处理的层数越多,3D幻觉的质量就越高。
3D重建和重新投影可以用于立体声转换。它涉及场景3D模型创建,原始图像表面的提取作为3D对象的纹理,最后,从两个虚拟相机渲染3D场景以获取立体视频。对于具有静态刚性物体的场景,例如具有建筑物的内部镜头,内部镜头,但是具有非刚体和柔和模糊边缘的问题,该方法足够好。[3]
另一种方法是设置左右虚拟摄像机,既偏离原始摄像机,又分割偏移差异,然后绘制出孤立对象和字符的遮挡边缘。基本上清洁电镀几个背景,中间地面和前景元素。
双眼视差也可以从简单的几何形状导出。[10]
可以使用不同类型的运动自动估计深度。在相机运动的情况下,可以计算整个场景的深度图。此外,可以检测物体运动,并且可以为运动区域分配比背景更小的深度值。遮挡提供有关移动表面的相对位置的信息。[11] [12]
这种类型的方法也称为“离焦深度”和“模糊深度”。[11] [13]关于“离焦深度”(DFD)方法,深度信息是基于所考虑对象的模糊量来估计的,而“从焦点深度”(DFF)方法倾向于比较深度信息的锐度。对不同焦距拍摄的一系列图像进行对象,以找出它与相机的距离。DFD仅需要两个或三个不同的焦点才能正常工作,而DFF至少需要10到15个图像,但比前一个方法更准确。
如果在处理过的图像中检测到天空,则还可以考虑到除了朦胧之外的更远的物体由于厚的空气层而应该更加去饱和并且更蓝。[13]
该方法的想法是基于这样的事实:平行线,例如铁轨和路边,似乎与距离会聚,最终到达地平线上的消失点。找到这个消失点给出了整个图像的最远点。[11] [13]
线条汇聚越多,它们看起来就越远。因此,对于深度图,两个相邻消失线之间的区域可以用梯度平面近似。