https://zhuanlan.zhihu.com/p/31768560
HDR是什么
简而言之,HDR代表高动态范围(High Dynamic Range),它是一个技术术语,它描述了一种与这种类型的屏幕相关的新型电视屏幕和技术标准,它首先出现在静态摄影的曝光方法中。
HDR简史
HDR首先作为静止摄影技术而闻名于世。在静态摄影中,我们会一次捕捉多次曝光,然后将它们压缩成一个单独的图像,而不是显示高光和阴影色调的所有细节。
HDR曝光过程
事实上,法国摄影师古斯塔夫·勒·格雷(Gustave Le Gray)在1850年代首次使用了它。他了解胶片底片的动态范围限制,并使用两个单独的曝光来创建克服这些限制的图像。
上述照片是从1855年开始的照相感光乳剂(感光乳剂在金属板上)。所用的胶片的曝光范围约为3 f / stop。一档是下一档的两倍明亮或暗淡。在这种情况下,海洋和天空的细节将不可能同时保留。天空的亮度显然远高于水面的亮度。正常的曝光将要么洗出天空,让船只可见; 保留云的细节,海洋就会太黑,船就会丢失细节。勒格雷简单地结合了两次曝光,以及在印刷过程中一些创造性的减淡和加深(dodging and burning),创造了HDR最早的例子之一。
其他像安塞尔·亚当斯(Ansel Adams)这样的摄影师,专门用来减淡和加深(dodging and burning),以延长他们的图像的色调范围(tonal range)。通过选择性地欠曝(dodging)或过曝(burning)图像的不同部分,他可以让原本在正常印刷品中看不到的细节显现。这种技术最终被定义为区域系统(Zone System)。
为了捕捉上面所示的色调范围,使用单张胶片进行曝光和打印是不可能的。只有仔细操纵各种暗区和亮区才能产生这种动态范围。亚当斯使用了一种近百年的老技术,并将其提升为艺术形式。
所有这一切的目标是,而且是创造出更贴近人眼所见的图像。利用视网膜中的视杆和视锥细胞,加上我们大脑的视觉皮层能够分别处理图像的黑暗和明亮区域,使我们可以看到完整的亮度等级范围。相机无论是拍摄静止图像还是运动图像,都无法做到这一点。
随着数码摄影的出现,将这些暗房技术添加到控制相机成像传感器的软件成为可能。这些传感器受到类似的胶片的限制,其动态范围有限。但是,由于只需要设置数码相机进行多次曝光并将它们组合成HDR图像,现在我们在智能手机上就可以完成以往在暗房中需要几小时的时间才能做到的效果。
以下是将四个单独曝光合并为单个色调映射(tone mapping)图像的示例。
随后的每一次曝光都增加了大厦的细节。当你看到第四张时,你可以看到天空中的云彩,但建筑物则完全被冲刷掉。现在看看结合的结果如何显示。这被称为“色调映射”。
你可以看到图像中最暗和最亮部分的每个细节,就像你的眼睛通过适应极端光线和黑暗的层次来看待它一样。最后的照片只有每个曝光的最好的元素,同时扔掉部分没有用的细节。
2010年Soviet Montage用分束镜将画面一分为二,用两部佳能5D Mark II拍摄。其中一部调到+2 EV,另一部调到-2 EV,拍出来的影片再用某些方法(Soviet Montage并未说明是什么方法)合成为HDR的影片,成为第一部“HDR”视频:
显而易见,以动态图像的形式进行这项工作的能力具有深远的意义。对比度和动态范围是决定图像质量的最重要指标。最好的显示器可以同时渲染深黑色和亮白色,以展现每一个细节,并提供深度感。HDR在影像显示上将带来了更大的对比度、更宽的亮度范围、更广的色域,使得影像更加真实和鲜活。
开发HDR电视屏幕的想法出现在5年前,因为屏幕制造商能够开发具有更好的颜色和亮度响应的发光二极管。对此有两种方法,一种是使用响应更好的磷酸材料,另一种是使用也称为OLED的有机半导体。
采用这种新技术后,制造商能够在保持较低的阴影水平的同时创建更高亮度的屏幕,从而有效地创造出更大对比度的屏幕。大多数HDR屏幕能够达到1000尼特的最大亮度,但未来的标准允许亮度高达10000尼特。相比之下,普通HDTV能够显示的最大亮度仅为100尼特(尼特是可见光强度的测量单位)。
新的HDR屏幕也能够显示比当前HDTV屏幕所能够显示的更大的色域。今天,我们正在研究1990年推出的REC709标准,并且已经受到CRT屏幕理论最大色彩值的限制。
然而,要注意的重点是,HDR的目的不是创造更明亮,更丰富多彩的图像,而是显示那些通常会丢失或剪裁的高光细节,使颜色看起来更加真实。
UHD/HDR/WCG/HFR挑战人类真实视觉
十多年前,数字技术诞生时,完美表现35mm胶片的效果便是数字电影的终极目的。既然技术已经OK,那么数字电影的下一步呢?我们现在已经超越了数字电影诞生时所面临的挑战,现在更关心的则是颜色和画质方面的细微差别了。
如果数字电影演变的初始阶段让我们超过了35mm胶片,那么第二阶段就完全改变了思路和方向。它不再是模仿以前的事物,而是想象和实现一个未知的目标(还原人眼的真实视觉)。
真实世界的亮度范围和人眼的亮度范围
HDR提高了当前的显示亮度范围
这是晴天下一朵花的亮度分布
目前HDR还处与发展中
视觉
我们的视觉只有一个小区域视网膜,其中包括非常高的密度的锥形细胞。这个区域被称为“fovea”,而它占视网膜不到1%,占大脑视觉皮层的50%以上。只有视野的中心集中在fovea,大约是两个指甲盖那个大的距离。
当你观察一个超过这个中心区域两度大小的物体时,你的眼睛必须扫描该区域,并且让你的大脑填补空白。你的外围视野实际并不能提供图像,但是当你的眼睛扫过去时,你的大脑能够构建你面前的场景的整体形象。在你的眼睛移动焦点后,即使在运动中,你也记得并能回忆起现场部分的细节,并能在整个视野中保持实时的视觉感知。
然而,你所看到的是在大脑中处理的不断更新的构造出来的图像,而不是你眼睛看到的“真实”投影图像。你一直感知计算构建“图像”,这是比以固定的,均匀的像素密度和帧速率聚焦图像在传感器上的记录更加复杂和微妙的过程。
这就是为什么你的眼睛会在阅读这个屏幕时移动扫描屏幕:为了让你再次看到另一部分的细节,你必须移动你的眼睛再读一次。你知道其余文字的空间布局和整体位置,但每一个字的细节需要fovea来细细品读;屏幕上的运动图像也是幻觉,这只是大脑感知移动物体的伎俩。
分辨率
过去几年来,我们都知道4K是会大放异彩的;现在8K也正在向我们走来。然而,简单的增加像素分辨率带来的影响却不简单。较高的颜色位深度意味着更多的数据,这增加了带宽需求。增加图像的锐度和细节后,没有巨大的开销是无法完成视频交付的。
感知分辨率与实际像素分辨率之间是存在着差异的,唯一对观众重要的是“感知”锐度和细节。因此,如果我们正在衡量不同技术及其其影响的利弊,这时必须将人类视觉的反应带入方程式。很多时候,用蛮力解决一个问题比如:实际像素增加了400%时会带来其他许多的问题。
HDR
像素分辨率不是锐度的唯一度量。在数学上,增加像素计数可以达到目的,但超出某个阈值时,将会做无用功。在到达UHD的分辨率后,为了提升图像的质量再单纯的增加像素已经是没有必要的,此时该从其他维度来提升比如HDR和WCG。
如果把两台电视放在一起对比,前者拥有更棒的对比度和更准确的色彩,后者仅仅分辨率更高,那么几乎每一位观众都会认为前者的画质更棒。虽然分辨率更低,但更高的对比度和色度让画面效果看上去更加自然和真实。换句话说,一部分辨率和色彩绝佳的1080p分辨率电视绝对要比一部对比度和色彩表现一般的4K电视更受欢迎。
HDR可同时大幅度拓展对比度和色彩。画面中明亮的部分会更加明亮,从而使其看上去更具“深度”;而色彩的拓展的能让红绿蓝和它们之间的所有颜色看上去更加明亮纯粹。
运动错觉和抖动
我们的大脑在保持运动错觉时,无法顺利连接整合各个帧,这可以说是我们目前面临的最大的挑战。但是究竟是什么原因呢?在HDR背景下我们归结为以下几个因素:
显示亮度不是根本原因,但会带来一些糟糕体验。当整体图像亮度越低,在SDR显示级别,抖动通常被电影和视频帧速率的运动模糊所隐藏。
但是,在HDR对比度和显示背光级别下,不可能隐藏这些虚影!那么我们如何解决这个问题呢?请继续往下看:
帧速率
在现实世界中,我们的眼睛充满了图像信息。我们看不到随着时间的推移的离散帧或固定图像。然而,当我们快速连续地观看一系列静止图像时,我们感觉到的运动的错觉是由我们所说的视觉惰性引起的,因为视网膜能够将一个图像暂缓0.05s。
你的视网膜视锥细胞不是固定的传感器,而是一直在移动。
眼脉动是一种现象,你眼睛中的肌肉会轻轻振动大约83.68Hz的微量(对于大多数人来说)。(Dominant Frequency Content of OcularMicrotremor From Normal Subjects, 1999, Bolger, Bojanic, Sheahan, Coakley &Malone, Vision Research)正常受试者的眼脉动频率在70-103Hz范围内。如果你的眼睛在一个已知的周期摆动,它的摆动使得光线撞击锥体并在锥体身上漫游(每个锥体为0.5-40μm,摆动约为1至3个感光体宽度)。我们可以使用时间采样,经过处理后则会产生比单个锥体能接受到的更高的分辨率。眼睛是生物系统,它需要一些额外的画面来弥补整体的场景。
“当你观察一个超过这个中心区域两倍大小的物体时,您的眼睛必须扫描该区域,并且让你的大脑填补空白。你的外围视野实际并不能解决问题,但是当你的眼睛扫过去时,你的大脑能够构建你面前的场景的整体形象。在你的眼睛移动焦点后,即使在运动中,你也记得并能回忆起现场部分的细节,并能在整个视野中保持实时的视觉感知。”
感觉神经元分为中心和周围两部分。它的工作原理如下:
它是非常好的边缘检测系统,如果你模拟它,它会看起来像这样:
这意味着如果您摆动图像,中心环绕和非中心环绕细胞将在图像中穿过边缘时触发。这是一个脉冲串,可以与振荡控制信号一起来提取更多的(2倍)分辨率信号。
眼脉动的副作用和帧率:
现实生活中你所看到的是不断变化并且拥有噪声冗余的事物,你的大脑可以非常有效地从中挑出有效的数据信号。它可以超量化(如上所述),并从中得到两倍的数据。事实上,信号噪声是很重要的(也许你很讨厌它),这种现象叫做“随机共振”。
注:在信号分析过程中,噪声常被认为是令人讨厌的东西,因为噪声的存在降低了信噪比,影响了有用信息的提取,然而在某些特定的非线性系统中,噪声的存在能够增强微弱信号的检测能力,这种现象就称为随机共振。而在图像系统中,在一定噪声强度条件下,图像视觉质量可以达到最佳效果
除此之外,如果眼球83.68Hz的摆动使我们能够感觉到双倍的分辨率,那么如果你看一些不同帧率的图像序列(比如24FPS电影或者30Hz电子游戏)会发生什么? 我们不再收到一个变化足够快的信号,足以让超量化发生的那种,就会扔掉很多运动的数据和细节;如果帧率高于振荡速度的一半,那么随着眼睛的摇摆,它会拥有更多的细节,并可以使用这些信息来建立一个更好的画面。不过最好还是在那里有一些噪声来填补空白。(Stochasticresonancein visual cortical neurons: does the eye-tremor actually improvevisual acuity?- Hennig,Kerscher,Funke,Wörgötter;Neurocomputing Vol 44-46,June 2002,p.115-120 摘要:我们用生理记录表明,以非常小的噪声刺激视皮层细胞,可以增强视觉皮层细胞对小幅度移动的反应。在生理学现实的模型中,我们还展示了微运动可以用于增强皮质细胞的视觉分辨率。)
83.68Hz的一半恰好约41Hz。因此,如果要将高分辨率从图像中正确“抽出”,则该图像需要一定的噪声(如胶片颗粒),并且帧率为> 41Hz。就像《霍比特人》一样。一旦低于一半的极限,你的眼睛会对相同的图像进行两次采样,并且不能从眼球摆动中抽出任何额外的空间信息,你将被限制在显示图像的分辨率上,而不是一些理论上的随机极限。
双倍的帧速率,降低了一半的运动模糊,你自然得到两倍的锐度。
帧频24fps标准被认为是人眼能看到运动图像的最小可接受速率,这已经有100多年的电影,电影历史,一直到“数字电影”的开始。我们现在观看35mm胶片电影的分辨率和颜色,使用传统的帧率没有一点问题;但是使用高分辨率图像,高动态范围和更亮的显示器需要更高的帧速率。简单地说,我们在更高的帧速率下感觉到较少的抖动,因为对象的相对运动帧在减少。非常高的细节,高对比度和快速运动的区域可能需要非常高的帧速率才能感觉到没有任何抖动。
高帧率采集还有其他优点:以120fps进行拍摄允许在后期插入运动模糊,并且能够轻松掌握任何数量的较低帧速率传送要求;当然也有缺点,首先是显而易见的:高分辨带来了丰富的细节,但存储和处理运动图像所需的带宽同样需要很大。
超真实感和肥皂剧效应
彼得·杰克逊在《霍比特人》中拍摄使用48fps;而最近李安大热的电影《比利·林恩的中场故事》更是使用3D 120fps,具有超清晰的细节,梦幻的品质将你剥离现实置身于一个巨大的故事之中,这也许是我们需要适应的一种新体验。
UHD Premium
随着新的屏幕技术的发展,需要创建一个行业机构来管理和创建一个从节目源制作到传输分配,再到播放显示的标准,所以UHD联盟诞生了。今天,所有主要的工作室和屏幕制造商都是UHD联盟的一部分(Dolby实验室、The Walt Disney Studios(迪斯尼)、Twentieth Century Fox(二十一世纪 福斯)、Universal Pictures(环球影业)、Warner Bros. Entertainment(华纳兄弟)、Technicolor、Netflix、DIRECTV Group Inc、Sony(索尼)、LG、Samsung(三星)与Panasonic(松下))。于二零一六年一月,UHD联盟已制定三项规格,以UHD Premium之名义支持下一代高级家庭娱乐。三个规范涵盖以下几个方面:
1、显示设备
2、发行
3、母版内容
显示设备
要取得ULTRA HD PREMIUM认证,设备必须达到或者超出以下的规范:
· 画面分辨率:3840×2160
· 色彩深度:10bit
· 信号色彩输入:BT.2020色彩标准
· 显示再现:超出90% P3的色彩
· 动态范围:HDR高动态范围
· 电光转换函数(或伽玛):SMPTE ST2084 EOTF
· 达到以下两种亮度峰值与黑位标准组合之一:
1. 超过1000nit的峰值亮度与小于0.05nit的黑位范围
2. 超过540nit的峰值亮度与小于0.0005nit的黑位范围
发行
提供UHD联盟内容的任何发行渠道必须支持:
· 画面分辨率:3840×2160
· 色彩深度:最小10位信号
· 色彩:BT.2020色彩标准
· 高动态范围电光转换函数(或伽玛):SMPTE ST2084 EOTF
母版内容
UHD联盟内容大师必须满足以下要求:
· 画面分辨率:3840×2160
· 色彩深度:最小10位信号
· 色彩:BT.2020颜色表示
· 高动态范围电光转换函数(或伽玛):SMPTE ST2084 EOTF
UHD联盟推荐以下母版显示规格:
· 显示再现:至少100%的P3颜色
· 峰值亮度:超过1000尼特
· 黑位:小于0.03尼特
HDR - PQ和HLG
我们主要关注PQ和HLG HDR,以及它们对显示器校准,图像工作流程和最终图像观看体验的意义。虽然Philips/ Technicolor和EclairColor HDR在LightSpace CMS中作为标准HDR格式包含在内,但它们尚未广泛使用,因此在此技术上被省略。
其中一些问题是:
· HDR - 不只是更明亮
· 绝对与相对观看环境
· 元数据 - 为什么需要?
· 基于PQ的NDR - Dolby Vision,HDR10和HDR10 +
· HLG HDR - BBC
· HDR – 现状与相关问题
· WCG - 宽色域
· UHD – 分辨率
注意:PQ HDR定义了HDR10,HDR10 +和Dolby Vision,因为它们都使用相同的目标色彩空间PQ EOTF和Rec2020色域 - 因此,所有的校准都是相同的。
HDR
真正的HDR诞生于2015年8月27日,那一天美国消费者技术协会(ConsumerTechnology Association)公布了HDR10标准,提供17.6档的动态范围。在之前,因为显示技术(如液晶技术)早已超出了SDR画面水平,所以在HDR的过渡期,一些厂商引入了一些辅助HDR的技术来弥补画面的缺陷,如WCG(宽色域)以及我们熟悉的背光技术(黑色场景关闭背景灯,白色场景打开背景灯),现在我们在一些主流网站看电影视频时,也会看到有那么一个“关灯”的按钮在旁边。
HDR和亮度
HDR方面最大的误会在于,它并没有试图让整个图像更加明亮(然而不幸的是,这似乎是大多数人对HDR的看法),而是为光谱高光细节提供额外的亮度余量,如铬反射,太阳照亮的云彩,火,爆炸,灯泡灯丝等等。
显然,在分级过程中,色调师/ DP以及任何其他影响投入到最终图像显示的人都可以随意使用它们认为合适的方法扩展亮度范围。
如果“明亮”图像的平均面积很高,则HDR显示器不能维持对输入信号亮度变化的线性输出亮度响应。只有一小部分屏幕区域可以是“HDR亮”。
HDR-图像规范:
以下内容直接来自ST2084(PQ EOTF)规范。
该EOTF(ST2084)旨在使得能够创建具有增加的亮度范围的视频图像; 不是用于创建整体亮度更高的视频图像。为了不同输出亮度的设备呈现的一致性,内容中的平均图像水平可能保持与当前亮度水平相似; 即中等范围的场景曝光将产生适合于视频或电影的当前预期的亮度级别。
PQ和HLG介绍
PQ感知量化(ST2084),由杜比开创的HDR光电转换方式,被应用于Dolby Vision(世界上第一个HDR标准),而Dolby Vision也是后来被广泛使用的HDR10标准的前身(HDR10是Dolby Vision的简化版)。下面我们先来看看PQ的“奥秘”(部分摘抄自ST2084(PQ EOTF)定义):
ST2084旨在能够创建增加亮度范围的视频图像,而不是增加整体的亮度。为了在具有不同亮度输出的设备之间呈现一致性,视频中的平均亮度水平即中档曝光将产生一个适合于视频或电影的预期亮度范围。
基于PQ的HDR标准参考了正常漫反射白,并定义为100尼特,与SDR(标准动态范围)显示完全相同。PQ HDR中高于100尼特部分仅适用于高光细节。这表明PQ HDR显示器的平均图像水平(APL)与SDR显示不会有明显差异。
无论最大峰值亮度如何,显示器产生的漫反射白始终为100尼特。
漫反射白色的标称尼特值也会随着显示器的峰值亮度而变化,1000nits的显示器具有大约175nits的漫反射白色,以及4000nits对应的600nits(取决于系统的伽马值,即系统的光线辉度曲线)。因此现实情况是,HDR能增加SDR显示屏的现有亮度范围,这意味着在图像的较亮区域可以看到更多的细节。 以下直方图是SDR(标准动态范围)图像与其PQ HDR等效物之间差异的简化视图。请注意,SDR(平均图像级别)在SDR和PQ HDR图像之间保持大致一致,只有对比度范围和高光级别增加了。(以上为理想状下)
HDR(左)与SDR(右)模拟。注意整体APL是相似的
HDR:显示技术
对于所有关于峰值亮度的讨论,我们都需要退后一步谈论光谱的另一端:黑色,还是缺少光线。
液晶显示:
使用传统的,无处不在的LCD显示屏设计,实现HDR实际上是不可能的。虽然你可以(假设)用一个数十亿瓦特的氙弧灯驱动一块液晶面板,并且不计一切的输出功率,但是你不会有任何黑色的细节。液晶显示器并不擅长收缩光线。解决的办法是将背光分成块或区域,并根据图像内容调整每个区域的背光亮度。如果一个区域主要含有明亮的内容,那么它后面的光源就会上升。如果一个区域主要含有较暗的内容,则其光源会变暗。区域调光已经完全可行,因为LED背光系统。LED可以以合适的阵列排列并且在调光时具有近乎瞬时的响应。当然,区域数量必须足够多,或者换句话说,必须足够小,以便创建可接受的精确的图像亮度传输。虽然实验模型现在能够多达2000个区域,但是大多数消费型HDR模型现在都只可以使用128到500个区域。这种创建HDR图像的方法受到以下事实的挑战:区域的数量最多只是可用像素数量的一小部分。考虑到传统的1080p图像中有超过200万像素。这是相当于有几百个,甚至几千个调光区域。同时包含明亮和黑暗图片内容的区域是很难产生令人满意的照明水平:背光照明对于黑暗内容来说太亮了,对于明亮的内容来说太暗淡了,或者(很有可能)是一种不利于两者的妥协。
HDR调光区域
在上面的例子中,你可以看到144个区域是不是很难满足亮度极限的内容。粉红色的正方形突出显示了一个这样的区域,它既有深层次的细节,又有极端的亮度。如果我们把区域的数量翻两番到576,用绿色方块表示,这个区域仍然存在问题。钢水本应该是明亮且有细节的,却不得不被区域调暗,否则周围的黑暗内容将变成泥泞的灰色。想要减少这类“妥协”区域,就要划分更多的区域,但即使有几千个区域这样的“妥协”仍然存在。
以上都是以LED光源为背景,在屏幕后面排列。因此有营销术语“全阵列,局部调光”(通常缩写为FALD)。另外还有一个LED布置,被称为边缘照明。
到目前为止,液晶电视中LED背光的主要配置是所谓的边缘(edge-lits)排列:LED仅位于侧面(或顶部和底部),其光通过漫射被投射到整个屏幕LCD本身后面的层。虽然这能使得电视非常“薄”,但它是一个糟糕的设计,即使是SDR,这种安排也严重挑战屏幕均匀性:这样糟糕的设计使得光源排布在边缘。更为重要的是,应该相当直观的认识到,这种安排不可能实现HDR所需的局部对比度。将上述全阵列局部调光区域布局与以下侧光局部调光区域布局进行比较:
典型的边缘照明调光区域布局。请注意“妥协”区域与前面的例子相比有多大。
由于LED仅在左侧和右侧,它们的光通过从边缘到中心的扩散来分布,因此上述布局是用于侧光式面板的调光区域的唯一布局(这些“条纹”不能进一步水平细分)。结果,现在这个场景中几乎每一个区域都会有极端的高光和暗部。与全阵列局部调光不同的是,即使有几百个区域,它们也至少是正方形,因此均匀分布;边缘光线不仅区域太少,而且这些区域是完全的长方形。你实际上最好不要试图去区分亮暗对比。然而市面上有几款边缘照明的“HDR”液晶电视,它虽然有些可以产生一些相当不错的峰值亮度的数字,但是没有一个能产生可接受的HDR图像。
OLED:
OLED技术正好适用于HDR。因为每个像素都是独立的光源,所以OLED恰恰是解决局部调光LCD(您可以将OLED视为具有数百万个区域)混合区域的困境。然而,OLED在绝对亮度方面面临挑战:在LCD的情况下,我们可以简单地将更明亮的背光放在背后,OLED目前正在努力推出我们期望的HDR(当前最先进的消费类电子产品OLED约在700左右)。当然,和任何正在发展的事物一样,这必将随着时间的推移而改善,这确实给OLED带来了一个非常光明的未来。
绝对VS相对
但是终归从SDR到HDR的转变需要一个过程,不是所有电视台都能负担得起SDR和HDR两套光电转换系统,BBC的首席技术专家Andrew Cotton提出了这样的疑问:"They showed spectacular TV pictures…but it would have required a complicated encoding
system to deliver to both standard dynamic range[today's TVs]as well as HDR displays. And it would have needed two separate color grades [for each version]. We just couldn't see how we could deliver that type of experience to our audiences. TV is run on a shoestring budget and can't afford two color grades"(原话)
于是BBC与NHK合作开发了另一项HDR技术HLG(Hybrid Log-Gamma),并认为这是针对电视广播信号的最佳HDR技术。HLG就是为了简化HDR的制作流程,它与PQ系统的不同之处在于,HLG可以在摄像机内直接完成HDR的编码(省去了各电视台的转换负担);PQ则是通过后期显示参考以及调色参考后完成编码,更适合于电影的后期创作。
BBC的HLG HDR标准使用75%的信号(输入)范围作为标称漫反射白,这是一个“变量”,因为HLG标准是“相对”标准,它所提供的动态范围为1200%;而不是像PQ那样“绝对”。
在家里看电视时,我们所做的其中一件事就是设置电视机的峰值亮度,以适应电视室内现有的观看环境。
我们知道,SDR分级显示器被校准为100尼特,之前提到,对于漫反射白,PQ和SDR的标准一致,那么PQ HDR的观看中经常被忽视的问题之一便是:因为标准是“绝对的”,所以无法增加显示器的光输出(来增加漫反射白的亮度),以克服周围的房间光照水平。
所以如果在不太理想的观看环境中(周围房间亮度水平相对较高),HDR图像的大部分将显得非常暗,阴影细节变得很难看。为了更好的观看基于PQ的“绝对”HDR图像,环境光照水平必须非常严格的控制。为了支持这个说法,被指定为基于PQ的HDR观看需要的平均环境光照水平是5尼特,而对于SDR,它被指定为显示器的最大亮度的10%。
PQ - 绝对标准
将PQ称为“绝对”标准意味着每个输入数据电平都有绝对输出亮度值,不存在变化,除非改变伽马曲线(EOTF)。
然而,使用基于HLG的“相对”HDR时,这就不是事儿了。因为HDR标准可以按照与传统SDR电视完全相同的方式进行缩放,此外,还包括基于亮度的系统伽玛变量,特别针对环境照明问题。
元数据
基于PQ的HDR使用嵌入在信号内的元数据来提供关于分级显示的参数信息。
PQ元数据有两种形式——静态和动态。
静态和动态元数据都包括显示RGB色度坐标的母带,白点色度和最小/最大亮度;它还包括最大帧平均光级(MaxFALL),其定义最亮的帧;以及最大内容光级(MaxCLL),其定义最亮的像素。
静态元数据在使用数据的所有时间内使用相同的值,而动态元数据会根据需要进行更改(可能会逐帧进行)。HDR10使用静态元数据;而Dolby Vision和HDR10 +使用动态。
但是,为什么我们需要元数据?真正需要元数据的原因只有一个:当HDR被引入时,没有电视可以匹配主控/分级显示器的峰值亮度和色域覆盖率,特别是峰值亮度。由于基于PQ的HDR的“绝对性”与母带显示无关,所以它们的峰值亮度不一样。为了试图克服这个问题,便引入了元数据以允许HDR电视重新映射图像内容。
HDR显示器校准精度的比较
了解上述关于元数据的需要,对于不同的HDR显示设备如何进行比较,提出了一个有趣的想法。
假设现代HDR显示器都能够达到给定的最小峰值亮度水平,例如1000尼特,使用在90%P3的UHD规范内的色域,以1000尼特为峰值亮度的HDR内容源应该不触发任何“元数据” (色调映射/缩放),允许直接比较不同显示器的底层校准精度。
结束第一个比较后,再加一个相对简单的附加步骤,可以在相同的显示器上比较2000+尼特以上具有完整的P3色域的不同源素材,从而可以将显示器的色调映射/缩放分开进行比较。
PQ HDR - DOLBY VISION & HRD10
ST2084为基于PQ的DOLBY VISION和HDR10格式定义了EOTF(Gamma)。PQ HDR具有10,000 nits最大亮度能力的理论参考值,并具有如下所述的伽马曲线:
如果将其与标准的Rec709伽马曲线进行比较,则差异是显而易见的。
注意:由于基于PQ的HDR是基于10000nits的峰值亮度的“绝对”标准,而Rec709(SDR)是没有设置峰值亮度值的“相对”标准,实际上很难 直接与伽马(EOTF)曲线比较。最接近的方法是将Rec709峰值亮度值与1000 nits ST2084进行比较,如下所示:
有趣的是,与基于Rec709的显示器校准相比,特别是在Rec709显示器的峰值亮度提升的情况下,显示的是基于PQ的HDR在阴影中的位置。这是基于PQ的HDR的主要问题之一 - 整体的图像亮度比大多数家庭用户所习惯的低很多,这使得在普通明亮的“客厅”环境下观看非常困难。
对于PQ HDR,不同的显示器将具有不同的峰值亮度水平,因此需要修改的伽玛曲线,例如杜比4000 nit脉冲星监视器,这需要HDR伽马曲线峰值约为PQ标准的90%。:
注意:只有不同的剪切点。曲线是绝对的,因此保持一致
索尼的BVM-X300显示器需要一个峰值为PQ标准75%的伽玛曲线,因为BVM-X300显示器的峰值为1000尼特,而PQ“参考”显示器的最大值为10,000尼特:
以下PQ HDR EOTF曲线显示了100 nits监视器的内容:
注意:上述图表都标准化为0到1的范围。为了更容易理解的比较,我们需要将所有曲线映射到它们的真实绝对值,如下所示:
(记住这些图是线性的,不是对数的,所以人眼所见的视觉效果被夸大了!)
如果我们更改图形缩放,我们将得到以下内容:
注意:值得注意的是,无论别处怎么说,没有HDR标准可以产生“更黑”,因为它们是由显示技术所能达到的最低黑电平来设定的,而现在的SDR(标准动态范围)Rec709标准已经使用了在任何给定显示器上可达到的最小黑色。同样,HDR也无法生成改进的阴影细节,忽略了今天的8位SDR蓝光标准与10位HDR的区别。10位SDR将有更好的实际阴影细节。
DOLBY VISION
2007年杜比实验室收购了一家名叫BrightSide technologies的公司,并且制作了第一个HDR显示屏的原型。从那时开始,杜比不断投入对于这项技术,并在2014年CES上正式命名为Dolby Vision。
这项技术的核心是一项叫做“感知转换”(Perceptual Quantizer )的电-光转换功能(将电信号转为可见光),由此催生并定义了更高的动态范围。这项技术将亮度标准定义在 10,000 Nits(普通的电视亮度仅100-200nits左右)。但是,目前还没有实用显示设备能达到这一亮度,因此目前Dolby Vision的亮度目标是更实际的4,000nits。使用Dolby Vision录制的内容还包括最高12-bit色深,Rec 2020色域以及4K分辨率。
Dolby Vision是整套的专利解决方案,内容、播放源、显示设备都必须是兼容Dolby Vision标准的才可以。并且,每个Dolby Vision显示设备都带有一块专用芯片来检测确认此设备的输出能力(亮度,色彩空间等),播放时将这些数据传输给Dolby Vision的播放信号源。信号源将依据这些显示设备数据来逐帧优化输出,既兼顾到显示设备能力,又保持了原始信号的表达意图。
Dolby Vision和其他标准的亮度范围
2020色域和709的色彩空间区别
灰色部分是Dolby Vision定义的最大亮度和色域空间,中间的是普通HDTV的空间
12bit PQ在图中是在人眼感知之上的压缩高的最好曲线
Dolby Vision的内容制作流程
杜比作为当今影院技术发展的龙头老大,不但在声音技术上炉火纯青,更推出了Dolby Cinema这一全方位提升影院音画效果的完整解决方案。 Dolby Atmos(全景声)负责声音,Dolby Vision负责画面。第一家Dolby Cinema影院于2014年12月18日在荷兰埃因霍温开业的JT Bioscopen影院。因此从时间上来说Dolby Vision是最早投入实用的HDR技术。
HDR – 最低黑电平
以下声明摘自杜比自己的“DOLBY VISION HOME”白皮书。
“目前的电视和蓝光标准限制最高亮度为100尼特,最低亮度为0.117尼特...”
不幸的是,这是一个不准确的声明,因为蓝光格式对于最小或 最大亮度级别没有这样的限制,这些值可以由显示器设置定义。最低电平(黑色电平)通常只是显示屏可以达到的最小值,并且可以在OLED显示屏上从非常暗 (例如0.0001nits)到更高级别(约0.03nits甚至更高);而家庭电视的最大亮度通常设置得远高于克服周围室内光线的水平,许多家庭电视设置为300nits或更高。
注意:“最低级别(黑色级别)通常只是显示器可以达到的最小值”一词是指通常OLED黑色可能太低,而且用户经常选择提升它以防止阴影细节丢失。
当 SDR蓝光分级时,所使用的显示器将在受控的分级环境(黑暗环境)内校准为80-120nits(100nits为常用平均值),黑色电平为 0.001-0.03nits,这取决于所使用的显示器。如上所述,当蓝光在家庭环境中观看时,通常需要将电视设置为更亮的水平以克服周围的室内光线水平。
HDR - 阴影细节
正如我们所看到的,HDR对于黑色层次没有任何作用,阴影细节也是如此(无论一些营销文案怎么吹牛)。
包括在国内宣传甚至YouTube上很多视频宣称“阴影细节的丰富”被表示为HDR相比SDR的优点,这是不正确的!HDR不会提供超过SDR的阴影细节。
由于在基于PQ的HDR上使用的EOTF曲线,与同一图像的SDR标准相比,正常家庭观看条件下的黑色通常会被“压缩”。这是由被指定为优选得HDR照明级
别所产生的,为5nits;而对于SDR,其被指定为显示器的最大层级的10%。这是一个巨大的差异:当处于环境光线水平极端的环境中,HDR黑/阴影通 常会被掩盖。与基于PQ的HDR图像相比,10位SDR图像反倒具有更好的黑/阴影细节。
不同的观看环境确实需要不同的显示伽玛,这是基于“绝对”PQ的HDR标准所不能解决的。
以下模拟SDR与PQ HDR的图像比较:
SDR
PQ HDR
不同的显示器和PQ HDR
不同的HDR显示器明显具有不同的峰值亮度能力,因此所显示的图像将需要剪切到可用的峰值点,如上面的PQ EOTF图所定义的。该“峰值亮度范围”由信号内的元数据控制,定义用于执行分级的显示器的峰值亮度,显示器显示器使用该亮度来设置正确的分级。
如何进行分级 - 根据上述EOTF曲线的硬裁剪或具有滚降的软裁剪尚未在Dolby Vision之外进行定义,Dolby Visio是一种高度定义的HDR标准,设定涵盖了从生产到交付的各方面规格,但是任何显示器制造商采用该规格都会产生许可费。
实际情况是,即使两个显示器具有完全相同的峰值能力,两个显示器不可能以相同的方式呈现相同的图像,因为用于峰值亮度色调映射的处理将不相同。
峰值亮度水平
由于PQ标准是绝对的,不是相对的,每个亮度级别都具有等效的位电平。对于10位信号,电平如下:
这意味着任何给定的基于PQ的HDR标准图像将仅使用完整信号范围内的一个子集,其中一个1,000位的显示最大值仅为769位,其余254个电平被剪切(一共1023)。
另外,如上所述,由于PQ EPTF的绝对性质,因为没有显示器可以达到零黑色,因此存在黑色的问题,并且因此将原始地将输入信号相对于其最小黑色限制在比特级别。这意味着任何PQ显示器都需要某种形式的“阴影”滚降来防止裁剪,但是这反过来会使黑色水平更高的显示器上的阴影变得更糟。
另一种HLG标准是一个相对标准,所以总是使用完整的比特级别,而不管任何给定显示器的峰值亮度,并且显示映射在显示器最小黑和最大白之间的图像,因此没有剪切/破碎。
HLG HDR
与基于PQ的HDR不同,BBC HLG HDR标准不是绝对标准;相反,它是相对的,EOTF伽马曲线始终是全范围,无论给定显示器的实际峰值亮度值如何。另外,HLG标准还包括EOTF修改器,它会根据显示器的环绕照明情况改变EOTF。
注意:BBC HLG标准不使用指定的参考白色(漫反射白),而是将其置于输入信号的75%。
BBC HLG标准设计专用于5000nits的显示器,因此低于ST2084标准的10,000nits,但HDR峰值亮度水平实际上是足够的。
所有上述BBC HLG曲线均基于10nits的“低照明”
正是这种“环绕”值对于家庭电视使用尤其重要,除了使用显示器的峰值亮度值来计算EOTF,BBC的HLG标准还使用显示器的环绕照明来改变系统伽马,如下所示为1000 Nit显示:
不同的显示和HLG
由于HLG格式不依赖于元数据,所以在不同显示器之间的图像一致性水平会更好一些。
另外,使用显示器的环绕照明来改变系统伽马校准在不同环境中,这是对于基于PQ的HDR将面临困难的领域,因为它需要良好光线控制的观看环境。
HLG和RGB分离
BBC的HLG标准已经内置了可变系统伽马的补偿。
该标准首先使用RGB分量的加权和来计算源的亮度。通过将纯数学伽马函数应用于源亮度来计算目的地亮度,其中RGB通道按源与目标亮度的比率缩放。
通过RGB分离图可以看出的:
HDR -现实与相关的问题
HDR显示器最大的问题是它们看起来也很痛苦,也被称为过度的眼疲劳。
人眼动态范围的对比度约为1,000,000:1左右。这是眼睛的动态适应能力,使我们能够在黑暗的环境以及明亮的阳光下看到细节。
然而,在任何一个给定的时间,人类视觉系统只能在这个巨大范围的一小部分上运行,被称为静态(固定)动态范围。这种静态动态范围发生在人类视觉系统处于完全
适应状态时,在正常观看距离上观看家庭电视和某些戏剧表演时是活跃的。虽然人眼的静态动态范围几乎没有确切的数字,不过对于平均观看环境来说它是大约 10,000:1。
另外,需要考虑人类视觉系统的自适应响应:在黑暗场景与明亮的场景之间进行适应的时间,反之亦然,明亮到暗的过渡通常需要更长的时间来适应。从一个黑暗的房间里望向窗外;再把你的眼睛从窗外平移到室内,这样就很容易体会到。随着眼睛适应亮度的变化,房间细节慢慢的在丰富。
此外,由于电视机尺寸相对较小,结合标准观看距离(3m左右),整个电视机屏幕均处于人眼中心视角(5°至15°)高敏感区:即视角人类视觉系统不能独立地 对不同的亮度区域进行反应 - 被卡在完全适应的状态之内,所以观众只能使用人眼的静态动态范围。为了从HDR中获益,显示器需要占据的实际视角将为45°左右。
所有这一切正意味着,具有过高HDR的显示器将在正常观看距离时存在导致眼睛疲劳,并且很可能会感到痛苦的问题。
PQ HDR - 白色水平
值得指出的是,由于人眼对光变化的对数响应,目前的100nits的SDR(标准动态范围)Rec709“标准”实际上是基于PQ的HDR的10,000nits峰值水平的50% 。
(注意:Rec709是一个相对标准,因此缩放峰值亮度级别以克服环境光问题是一种可以接受的方法,而PQ HDR是一种基于绝对nits的标准,因此无法缩放)
以下图像显示了当参考不同时的峰值白电平:
亮度限制
HDR中经常被忽视的另一个潜在问题与显示器的电源需求有关,因为端亮度会导致功耗过大。这本身就是引起关注的一个原因,这取决于电力成本和潜在的环境问题。希望通过更高效的显示背光技术,可以克服这两种情况。
为了克服极端的功率需求,所有HDR显示器都使用ABL(自动亮度限制,称为HDR术语中的功率限制)中的形式,ABL根据超过预定亮度级别的屏幕面积百分 比来降低屏幕的功率,从而降低场景的整体亮度。PQ HDR规范定义了所谓的MaxCLL(最大内容光级别)和MaxFALL(最大帧平均光级别),它们旨在成为HDR母带元数据的一部分,观看显示将从该参 数计算如何显示图像并限制潜在的高功率需求。
显然,这导致在不同的显示器上观看相同的图像,亮度是有所不同的。准确的显示校准和图像播放也是一个严峻的问题。
WCG宽色域问题
作为不断发展的UHDTV标准的一部分,WCG与HDR结合使用Rec2020色域作为目标色彩空间,拉大了与现有HDTV标准的差距。
从左:709,P3和202
问题在于,现实中很少的市售显示器可以实现Rec2020,这意味着不同的UHDTV显示器将不得不基于显示器的实际色域能力“调整”显示图像色域。这是通 过在定义源图像色域的UHDTV信号(与上述HDR元数据相关联的)内使用嵌入式元数据来提供的,旨在允许显示器“智能地”重新映射到可用色域上。
问题是,和HDR元数据和峰值亮度限幅一样,没有提出设置的色域重映射技术。结果是,不同的显示器将以不同的方式管理所需的色域重新映射,最终产生不同的图像结果。
上图显示了尝试在具有较小色域的显示器上显示宽色域的问题。在这种情况下,显示器具有与DCI-P3类似但不完全相同的色域,这是针对UHDTV显示器(较小的内部色域三角形)最小色域的所谓“偏好”,而较大的色域三角形则表示Rec2020。
显示器已经在Rec2020的可用色域限制下进行了校准,如色域扫描图(测量的交叉与目标圆相匹配)所示。然而,显示器可用色域以外的去饱和区域以及Rec2020内的显示颜色将无法正确显示,该区域内的任何颜色都会被有效地拉回到显示器的色域边缘。
显然,显示器的实际色域能力越宽,剪切越少,不同色域得能力就越明显,特别是在现实世界中几乎没有任何接近Rec2020色域边缘的颜色。
为了降低色域限幅的硬度,可以使用色域重新映射来将交叉从“色域内”软化到“色域外”。
在上图中,较小的内三角形与实际色域三角形之间的区域显示校准区域,以更好地保持图像颜色细节;并以色彩不准确为代价,有效地压缩去饱和区域中的所有颜色进入显示器最大色域和缩小色域内三角形之间。
实际上,色域重新映射复杂得多,考虑到人类颜色感知不同,所以重映射真的需要考虑到这一点。问题是UHDTV规范没有指定要使用的色域重映射。在现实世界中,显示相同的图像时,没有两个Ultra HD显示器将看起来一样。
此外,Ultra HD规格在使用Rec2020作为目标颜色空间的同时,实际上规定任何Ultra HD显示器必须达到被认为是UHDTV显示器的DCI-P3的90%,而容量为90%的DCI-P3基本上是Rec709!
上述CIEuv图显示了100%DCI-P3和Rec709之间的色域差异以及展示Rec2020。
指定色域覆盖率问题:
UHDTV规范定为色域方式的一个真正的问题是它使用P3色彩范围的90%覆盖率的通用百分比值,但P3色域原色与Rec2020原色不一致,这可能意味着显示较少。如果具有较低色域覆盖率的显示具有与Rec2020更一致的颜色,则问题会好很多。
上图显示了与Rec2020相比,(约)90% P3色域覆盖率的问题。可以看出,90%P3绿色和红色的峰值初级与Rec2020原色显著不同,这意味着Rec2020主要矢量的颜色将被扭曲,使得显示器的真实色域覆盖率显著低于规定值90%的覆盖。
HDR在游戏渲染中的应用
为什么我们要在游戏中使用HDR:
所有的显示器(除了HDR显示器)的显色范围都是0-1,而现实中的颜色/光强范围肯定没这么少,HDR也就是让这个范围超过1,一般是用16位浮点来储存(也有用32位的,不过内存太大精度过高一般用不到),这样就可以储存更多数据,精度更高,效果自然更好。然而到这里自然就会产生一个问题,现在显卡输出以及显示器接受的格式还是0~1的8位格式,超过1的部分还是会被舍弃掉。但是使用HDR和不使用HDR在最终成像上还是会有很大的区别。
引用自维基百科部分:
例如风景的动态范围(最亮部分和最暗部分的明暗比)是十分大的,可以轻易超越10W:1,胶片或者CMOS传感器或者别的一般的记录手段的动态范围十分狭小,最多能到15EV,最大亮暗比3.2W:1,而一般的显示器能显示的亮暗比大概在1000:1,所以说在现实中也会有很多无法记录所有亮暗信息的时候。
而在游戏中,虽然制作过程可以让光照和颜色信息轻松过1,但是由于最终的显示器是普通家用显示器,只能还原到0-1之间的信息,所以高于1的部分还是会被舍弃,这时候游戏美工最常见的做法就是把光照亮度调小:
这张游戏画面的场景很明显的是夕阳环境,然而仔细观察不难发现,画面最亮的地方是天空中的落日场景,但是如果直接还原太阳的亮度,那么场景中至少太阳和云层的所有部分都应该是过曝的,场景中的人也应该因为受到太阳直射而部分过曝,而画面右侧的天空也不应该维持在这样一个亮度。
这样做虽然保证了所有的游戏画面亮度都能在0-1,但是对于场景真实性的还原来说无疑是失败的。
两张图对比,一张是很明显的带月亮的夜晚晴空,一张是夕阳西下的日落场景。两者的亮度相差极大是不证自明的,而在游戏中,两者的亮度给人的感觉确实是一样的。产生了矛盾,也就会给用户带来不真实的体验。
这时候在游戏中最常见的方法是在前期制作过程中保留亮度数据,在最后输出到显示器的时候做bloom处理,bloom是用来模仿人眼看超亮的东西产生的一种光向外溢出的效果。大概类似于眩光。
这张图是在使用了bloom之后得出的HDR场景,很明显地在云层,背景的塔以及人物的处理上都相对于前者较好地还原了现实光比。作为太阳的云层一定是超亮的,背景中的塔的受光面的高光材质反射到屏幕也应该是超亮的,而人物的衣服作为白色的布料材质在阳光照射下也应该是超亮的,当然首先,这里的超亮都是相对于相机而非人眼的,其次这个超亮并不是指大于1就一定是超亮,但是和HDR结合的话,用1作为阈值效果还不错,所以就这么用了,当然也可以设为其它值,比如设成0,那么就是全屏高斯模糊(一般Bloom的实现方式)了。为了只让超亮的东西Bloom,HDR是有必要的,不然没有大于1的值,就只能设置一个0-1之间的数,如果这么做的话在实际上做Bloom处理的地方有很多,这样会显得图像很模糊,并且使得画面不真实。
有的人可能会说我不用Bloom,或者说我就自己调一个阈值,效果其实还不错,那HDR是否是可以丢弃的。但是HDR的作用并不只是配合Bloom使用,它更基本的作用是让渲染更加正确,更加真实,具体来说:在LDR(即非高动态范围)中,因为范围是0~1,那么最后计算结果如果超过1的话(光照方程可没限制结果必须小于1)那么就会被切割成1,啥细节都没了,也就是说超亮的光照不能有。下图就是被切割的画面,细节啥都看不清。
解决这种问题的方法一是HDR二是降低光照亮度,这样又会回到前文提到的渲染不真实的问题。更重要的是,所有的材质都是按照实际的物理来制作的,但是光源却不是现实的光源亮度,这样出来的结果肯定是“虚假的”或者说“不被接受的”。正确的方式当然是可以大于1才行,这样的话亮的东西能够特别亮,暗的也能特别暗,然后细节还都能看得到。
一下是一些参考资料:
https://www.lightillusion.com/uhdtv.html
http://vmi.tv/training/useful-stuff/HDR_reality_and_monitoring-a_DOP%27s_Perspective
http://vmi.tv/training/useful-stuff/HDR_SURVIVAL_GUIDE
https://hometheaterhifi.com/technical/technical-reviews/high-dynamic-range-hdr-explanation-dynamic-range-resolution-color-calibration/
http://developers-club.com/posts/238425/
https://knarkowicz.wordpress.com/2016/01/09/automatic-exposure/
https://learnopengl.com/#!Advanced-Lighting/HDR
还有一些Dolby官网的PDF和一些SMPTE标准的PDF
最后补充一句:
关于HDR在图像拍摄处理这个领域和影像制作放映的HDR流程这个领域以及游戏中的HDR渲染这个领域,这三个HDR的一些区别:
HDR图像是在在SDR图像上添加了高光和阴影的细节,使得它的曝光范围提升,但实际上由于不同的曝光,它在不同亮度区域交接的地方会显得很不真实。这项技术在这应用是为了弥补相机的曝光范围的限制,如果要从本质解决问题,购买更好的相机是最好的解决办法,类似于哈苏和飞思等高动态范围的机器,一张曝光就可以包括所有的细节,即不需要进行多级曝光来合成HDR了。
HDR影像是为了尽可能的还原人眼所看到的真实场景,所以它对现实终端的亮度和色域都有更高的要求,这里的HDR便是亮部细节突出色彩丰富鲜艳
而游戏里的是一种渲染方式,为了模拟现实中的人眼突然到从阴影到一个很亮的场景的一个自适应过程。
这三个领域中对HDR的理解各不尽相同,也希望大家多琢磨琢磨。
本文有任何问题欢迎斧正~