谷歌HDR+研读(一)
谷歌HDR+研读(二)
6整理
对齐和合并捕获的拜耳原始帧会生成具有较高比特深度和SNR的单个原始图像。在实践中,我们的输入是10位原始数据,我们将其合并到12位以保留从合并获得的精度。这张图片现在必须经过校正,去马赛克和色调映射 - 这些操作通常由ISP来执行,但在我们的情况下,这些操作是软件,并且包括动态范围压缩的关键附加步骤。按应用顺序,这些操作是:
1.黑色级别减法可以减少所有像素的偏移量,使得不接收光线的像素变为零。我们从传感器上的光学屏蔽像素获得这种偏移。
2.透镜阴影校正。增强图像的角落以补偿透镜渐晕,并校正由于光以斜角照射传感器而在空间上变化的颜色。这些更正是使用ISP提供的低分辨率RGGB图像执行的。
3.白平衡。线性缩放四个(RGGB)通道,以便场景中的灰度映射到图像中的灰色。这些比例因子由ISP提供。
4. Demosaicking。将图像从Bayer原始图像转换为每像素12位的全分辨率线性RGB图像。我们使用Gunturk等人的技术组合。包括带有加权平均的边缘插入插值,基于恒定色调的插值和作为校正项的二阶梯度。
5.色度去噪。减少暗光低光图像中的红色和绿色斑点。为此,我们使用一个近似的双边滤波器,使用YUV中的两遍应用的稀疏3×3抽头非线性核来实现。
6.色彩校正使用ISP提供的3x3矩阵将图像从传感器RGB转换为线性sRGB。
7.动态范围压缩。请参阅下面的描述。
8.除雾 通过应用全局色调曲线来降低眩光的影响,该曲线将低像素值推到更低的位置,同时保留中间调和高光。具体来说,我们允许多达0.1%的像素被钳位到零,但只能调整低于白色电平7%的像素。
9.全局色调调节,通过将S形对比度增强色调曲线与标准sRGB色彩分量传输功能连接起来,以提高对比度并应用sRGB伽玛校正。
10.色差校正,以隐藏横向和纵向色差。我们不假设镜头模型,而是沿着高对比度边缘查找像素,并将其附近像素的色度替换为不太可能受色差影响的像素。
11.锐化,使用由3级卷积金字塔构造的高斯内核的总和来实现不锐利的掩蔽[Farbman et al。 2011]。
12.色调特定的颜色调整,使蓝天和蔬菜看起来更具吸引力,通过将蓝蓝色和紫色转换为淡蓝色来实现,并且通常会增加蓝色和绿色的饱和度。
13.抖动,当从每像素12位减少到8位显示时,通过添加来自预计算表的蓝噪声来实现量化伪像。融合灰度而不是彩色图像,只使用两个合成曝光,可以减少计算和内存要求。与Mertens等人的工作相比,它还使我们能够简化每像素混合权重。 [2007]。特别是,我们使用亮度固定的加权函数,有利于中等亮度的像素。
该函数可以表示为一维查找表。 融合合成曝光之后,我们撤消所得灰度图像的伽马校正,并通过复制原始线性RGB图像中的每像素色度比值来对其进行重新着色。
7结果
图10显示了使用我们的系统并排拍摄由传统成像管线生成的单次曝光照片的示例照片。我们的系统几乎总能产生优于传统单一曝光管线的效果,并且在动态范围较大或光线较弱的场景中,改善效果通常很明显 - 较少的高光溢出或压碎的阴影,较少的噪点,较少的运动模糊,较好的色彩,更清晰的细节和更多的纹理。虽然我们的结果受益于选择一个尖锐的参考框架,但我们的系统对替代选择非常有效;它可以将任何突发转换为去噪视频。
图10:将我们的方法产生的照片与同一设备上的标准单次曝光处理流水线产生的类似照片进行比较。在作物中,我们还将我们的管线结果应用于单个框架,以展示合并的好处。鼓励读者放大。最上面一行显示了一个经典的HDR场景:教堂里的彩色玻璃窗。在这个例子中,我们的方法在明亮的窗户和周围较暗的墙壁中保留了更多细节。中间一行显示一个黑暗的场景(3勒克斯大致相当于烛光)。这里我们的方法产生比标准管道更亮的图像。另外,通过减少空间去噪,我们可以保留低对比度的细节。最下面的一行显示了中等光线下的一个快速移动的物体。在这种情况下,我们使用比传统流水线中的单次曝光更短的曝光时间来减少运动模糊。我们还从这个场景中获益,从幸运成像中选择最接近爆发开始时可以找到的最清晰的帧。
为了更详细地评估我们的系统的对齐和合并方法,证明其与现有技术的连拍融合相比的稳健性[Liu et al。 2014; Dabov等人2007年a; Adobe Inc. 2016; Heide等人2014],请参阅附录。
图11:我们处理不好的情况。 上图:在这个非常高的动态场景中,我们优先曝光面部和建筑物内部,从而在明亮的开放门道上丢失细节。 中:在快速运动的低光场景中,我们会将曝光时间缩短,产生过多噪音以避免运动模糊。 机身:由于我们使用了曝光融合,高对比度的场景可以呈现轻微的中频晕(天空中的深蓝色斑点)。
2.5秒,我们测量100毫秒的捕获,250毫秒的对齐,合并为580毫秒,完成为1600毫秒。
8结论
在本文中,我们描述了一种捕获曝光不足帧的系统,对齐和合并这些帧以产生高比特深度的单个中间图像,并对该图像进行色调映射以产生高分辨率照片。我们的结果比传统成像管道生成的单次曝光照片具有更好的图像质量,特别是在高动态范围或低光照场景中,并且几乎不会显示令人反感的伪影。该系统部署在几款大规模生产的手机中,在Nexus 6,5X和6P中作为“HDR +”销售。使用我们系统的消费者不知道他们在每次快门按下时都会拍摄帧,或者他们的最终照片是使用计算摄影从多个图像生成的。
在技术论文中很难证明我们对超级图像质量的一般要求,或覆盖我们的系统强有力处理的角落案例的范围。然而,我们的系统在新闻界得到了积极的评价,在独立评估[DxO Inc. 2015]中获得的评分高于大多数竞争商业系统,并且每周消费者捕获的数百万张照片中,我们没有看到灾难性的结果。
为了让其他人可以判断我们的图像质量并改进我们的算法,我们创建了DNG格式的数千个原始图像阵列的存档[Google Inc. 2016b]。对于每个突发,我们都包含我们的合并原始输出和最终的JPEG输出。 EXIF标签和附加文件描述了我们的摄像机参数,噪声模型和用于生成结果的其他元数据。
局限性和未来的工作。我们系统的最大缺点是,用户按下快门后,在爆发开始并捕获参考帧之前存在明显的滞后。由于此框架设置了照片的构图,因此可能很难在动作场景中捕捉正确的时刻。这种滞后的部分原因是我们的自动曝光算法,有些针对Camera2的软件结构,另一些针对我们使用的幸运成像,它根据选择哪个帧作为参考增加了可变延迟。
为了避免快门时滞,许多手机采用零快门时滞(ZSL),其中相机连续捕捉全分辨率帧,将它们存储在循环缓冲区中,并通过从该缓冲区中选择一个图像来完成并存储快门按钮。由于焦点,曝光和白平衡在目标期间不断变化,处理ZSL将需要放松我们对恒定曝光突发的假设。这是未来工作的主题。