Ultra-High-Definition Television (Rec. ITU-RBT.2020): A Generational Leap in the Evolution of Television
超高清电视(Rec. ITU-R BT.2020):电视发展史上的一个飞跃
作者:Masayuki Sugawara,Seo-Young Choi,David Wood
国际电信联盟无线电通信部门(ITU-R)发布了推荐标准(Rec.)BT.2020“超高清电视系统产品和国际节目交流的指标参数” [1] 在2012年8月。电视系统的指标参数大致等同于图像格式,包括像素数目,帧率和比色法(色度学定义)。这些基本的系统参数决定了系统在一些项目上所能够提供给观看者的视觉感受,如可观看视场角(FOV)、运动图像质量、色彩重现的精准度。
电子技术在一代一代地进步,并且电视技术更新换代的周期比其它许多领域(比如信息技术)都要长。自从黑白标清电视(SDTV)出现以来,重大的变革仅仅发生了两次,即彩色电视的出现和高清电视(HDTV)的普及。电视系统发展相对迟缓的原因在于电视系统或服务的特殊性质:整体系统成本的降低较为困难,因为电视广播系统由少数昂贵的传输部分和多数廉价的接收部分所组成。系统也要求严格的标准以支持尽可能多的区域的节目交流。当前,HDTV正在全世界范围内普及。对于HDTV下一代产品的兴趣也正在一些国家和广播公司逐渐增加。这种新的电视形式被称为超高清电视(UHDTV),考虑到其水平方向上的大致像素数目,也称其为4K或者8K。Rec. BT.2020为UHDTV规定了详细的系统指标参数。本文主要介绍参考Rec. BT.2020所定义的UHDTV,重点说明了主要指标参数的定义背景。
ITU-R的主要目标之一是提供能够有效地使用有限的广播频段资源的环境,以确保广播通信系统运营所必需的性能和质量。这也就是为什么ITU-R主要应用于无线电通信领域,并涉及电视图像格式规范化。广播服务特别需要优化从节目供应商到终端观看用户之间的端对端链路系统。同时,还需要国际节目交流。在模拟电路的年代,电视图像格式直接被关联到必需的无线电波带宽和调制方法。现在广播链路已经数字化,并且图像格式主要被终端用户的视觉体验感受的改善所驱动。
至今,仍然没有完美的世界统一的电视系统标准,尽管大家都期盼着流畅的节目交流和低价的设备。例如,1970年的ITU-R Rec. BT.470 [2] 提出了三种彩色电视系统标准,并逐步演变为现在所知的SDTV [3] 。那些标准规定了具有50Hz和60Hz帧频的625/50和525/60系统,其中,625和525描述每帧的扫描线数目,50和60描述帧频率。多种原因导致了信号格式的不标准。由于欧洲和美洲的供电频率分别为50Hz和60Hz,这一事实很大程度上影响了帧频的定义,就当是的技术而言,采用相同的频率设定是有利的。1972年日本首先提议开始关于HDTV的ITU-R的研究 [4] 。HDTV标准化主要关注于扫描线(像素数量)和帧频的增加,尽管像色度学等其它参数也被研究。考虑到对于SDTV的兼容性,各种观点的冲突导致这一过程持续了很长时间。第一版Rec.ITU-R BT.709 [5] 标准创立于1990年。然而,它仅仅规定了宽高比和色度学定义,关于扫描线和帧频仍在研究中。最后,在2000年公布的第四版实现了世界统一的HDTV系统指标参数,而帧频不在其中。这已经简化了50Hz和60Hz区域之间的节目交流,通过仅包含帧频因素的格式转换。
关于超越HDTV的电视系统的ITU-R的研究开始于1993年,HDTV的Rec. BT.709标准确立后不久。当时这一研究被极端地称为高分辨率影像。它想要标准化超高分辨率视频系统的方法,从而同时应用与广播与非广播领域。该项研究的结果反映为ITU-R Rec. BT.1201 [6] 。该标准中的一项建议如下:“基于ITU-RBT.709标准,对于来自获取和显示的电子设备的电视系统图像,其空间分辨率应该通过简单的整数比例变换转换为1920(水平)x1080(垂直)”。
在ITU-R中关于超越HDTV系统的后续研究被称为大屏幕数字化影像(LSDI)。LSDI被定义为一个数字化影像系统家族,适用于如电视剧、戏剧、运动赛事、文化活动等节目,在剧院、礼堂和其它场馆,这些节目通过适当的设备以高分辨率进行获取和大屏幕显示。LSDI的扩展版本被研究,并且发布了相应的Rec. ITU-R BT.1769标准。该标准规定了7680x4320和3840x2160系统。除了像素数目的其它参数值与Rec. BT.709或Rec. BT.1361中所规定的相同。
当超越HDTV的图像格式的应用尚处于研究中的时候,HDTV的应用早已遍布全球,并且一些技术领先的国家和广播公司已经开始考虑下一代的电视系统和标准。鉴于这些发展状况,ITU-R开始了对于UHDTV的研究,依据在2008年ITU-R的SG6会议上所做的提议。会议上定义了研究的框架,并且建立了督导组,该督导组主要负责引导研究工作的进行。通过4年的研究,在2012年8月,正式确立了Rec. BT.2020标准。详细的研究结果编制在ITU-R Rep. BT.2246中 [8] 。
表1中列举了Rec. BT.2020中所规定的主要指标参数及其参考值。从SDTV到HDTV的演进,发生变化的仅仅是像素数量,而从HDTV到UHDTV的演进涉及到额外的帧频和新的色度学定义。就此而言,Rec. BT.2020将会带来对整个领域的重大改变,这一改变仅仅发生在几十年间。在Rep. BT.2246中将研究的理论基础描述如下:UHDTV是一种电视应用,该应用将为观众提供更好的视觉体验,通过更为接近人眼可视范围的视场角,同时还会保持或者改善HDTV的其它特性。因此,UHDTV将是一种能够支持增强型空间分辨率的广视域电视系统。
UHDTV的主要目标是扩展视场角。当决定系统参数时,像素数量是主要的考虑点,其满足视场角扩展这一主要目标,同时可以保证图像质量不会受到角度分辨率的影响。UHDTV所需像素数量的定义指导着各项主观和客观的实验。这些实验聚焦于视场角与真实感之间的关联。实验结果表明视场角增加100°左右时真实感会有所提升。
假定另一种用例,更高的像素数量有助于增加视场角和角度分辨率。对于相同的显示尺寸和绝对观看距离,更高的像素数量导致角度分辨率的增加。在传统电视中,针对30 cpd(cycles/degree)的角度分辨率所设计的观看距离表示当前条件下采用5级质量标准衡量得到的图像质量为“5” [10] 。这一距离通常被当做“理想”观看距离。然而,实验结果显示,当角度分辨率超过30 cpd时,可以观察到辨别力(对于自然图像的视觉敏锐度)与真实感(重建图像的主观视觉保真度)的增加 [11] 。
图1. HDTV与UHDTV所提供的视场角和角度分辨率
图1绘制了三种具有不同像素数量的系统所提供的水平视场角和角度分辨率。对于1920x1080(全高清或2K)系统,在30°的视场角,理想观看距离提供了30 cpd的角度分辨率。对于3840x2160(4K)和7680x4320(8K)系统,在维持角度分辨率不变的情况下,视场角分别能够增加到60°和100°。这就导致了之前所提到的更强的真实感。当使用更高的像素数量增加角度分辨率时,真实感得到进一步提升。ITU-R文档 [8] [12]中有更多的关于增加像素数量提升主观感受的实验结果的描述。
同时,依据Rec. BT.1201,超越HDTV的系统具有HDTV整数倍的像素数目。UHDTV的像素数目在水平和垂直方向上均为HDTV的2或4倍。
由于UHDTV仅可能用于数字系统,逐行扫描是唯一被考虑的扫描方式。帧频高达60Hz与HDTV相同。另外,UHDTV还用到了120Hz。该频率的使用来自于抖动和运动模糊的调查结果。这两种特征对于特定频率发生了占空比的冲突,例如,对整个帧持续时间的显示器照明周期的比率。随着占空比降低,闪烁变得更明显,并且运动模糊也降低,反之亦然。尽管当前对于闪烁已有许多研究报告,但是一项新实验在不同的条件下执行,比如视场角、屏幕亮度、占空比,与当前显示器技术和UHDTV相适应。结果表明,更广的视场角要求更高的帧频以便于压制闪烁问题 [13] 。60Hz的帧频(HDTV频率)基本满足限于30°视场角的临界频闪频率(CFF),比如HDTV的设计可视距离。然而,8K UHDTV要求高于80Hz的帧频,以便于满足限于100°视场角的临界频闪频率。
运动模糊是由于时域采样和有限时域孔径所导致的主要问题之一。传统电视系统基于100%时域孔径采样和脉冲类型的显示器所设计。这意味着运动模糊归于采集侧。然而,从CRT到非CRT的技术变化已经将运动模糊带到了显示器端。主观测试结果显示,6~11像素/帧的模拟运动模糊是一种可接受的限制。这符合每秒1/320的时域孔径持续时间,对于32°/s的物体移动,接近人眼的运动追踪能力和电视节目的物体速度。通过降低占空比或增加帧频可以实现这一目标。从带宽的角度出发,最小帧频的增加是更加合适的。因此,采用以下方法是合理的。首先,帧频应该增加到在任何占空比下闪烁都不可察觉的值。相应地,通过在相机或显示器端缩短占空比,能够减轻运动模糊。在Rep. BT.2246中亦有关于运动图像质量评价结果的描述。Rec. BT.2020中规定了120Hz的附加帧频。
表1. UHDTV与HDTV的指标参数比对
传统电视(SDTV和HDTV)的系统色度学定义受限于显示器设备的类型。总之,RGB三基色的色度坐标依据CRT荧光剂属性所定义。然而,CRT技术不可能用于UHDTV显示。此外,很难能够想象到未来的主流显示器技术是怎样的。如此环境条件下,对于UHDTV的系统色度学定义提出了以下三个要求:
1) 广色域电视色度学定义应该包含所有颜色,可用于已存电视系统和其它相关非广播系统。
2) 广色域电视的颜色编码效率应该比得上当前广播系统所使用的。
3) 用于广色域内容的每种颜色应该显示在参考显示器,以至于广播公司能够监控图像质量。
因此,对于三基色,统一使用真实的物理颜色,其结果如表1和图2所示。这些值分别对应到波长为467nm、532nm、630nm的蓝、绿、红三基色。在HDTV和早期的标准中,亮度(Y)信号并不是亮度的真实表现(非常量亮度)。这是由于伽马校正所导致的。在当今系统中,R/G/B信号先经过伽马校正,再被转换为Y信号(luma信号)。这明显背离于真实的亮度,其源自于使用伽马校正计算Y。尽管这对于主观图像质量仅有很小的影响,但是问题却是被TV工程师们所共知的,他们中的大多数人都认为应该尽快推出一个常量的亮度系统。另一方面,通过ITU-R活动,当前非常量亮度方法的微弱的益处得以更多地展现出来。例如,如两幅图像相加的信号处理操作得以在伽马校正亮度和颜色差异空间所完成,因为他们是伽马校正RGB信号的线性组合。考虑到常量和非常量方法的优缺点,BT.2020明确规定了包含两种方法的公式。
考虑到色度下采样,4:2:0和4:4:4比例由于其在逐行扫描中的应用被添加,抛弃8比特位深,使用12比特位深,以便于更好地匹配人眼视觉系统(HVS)的对比度曲线。
图2. HDTV与UHDTV的RGB色域范围和参考白位置
UHDTV是电视史上跨时代的改变,将会给消费者提供更好的视听感受。为了有效地实现UHDTV,促进了对于新技术的需求。同时,也需要能够给消费者提供合理开销的视频内容。
我们相信,Rec. BT.2020能够符合这些针对视频的应用需求,由于这些指标参数根据人眼视觉系统(HVS)特性所制定,其表现能够很好地匹配于HVS。同时,近年来与数字相机系统一样好的4K和8K电视系统原型的出现,已经证明了采用当前的技术的实现可行性。
系统指标参数的制定只是电视系统研发的第一步。一系列相符的指标参数和国际标准将会推进技术和设备的高速发展,以UHDTV广播服务的开始为目标。
ITU的主页(www.itu.int)包含了所有ITU-R出版物的链接。ITU成员可以通过访问其中的相关文档进行UHDTV的学习。
感谢WP6C的贡献者,他们对于引导Rec. BT.2020的制定做出了杰出的工作。
Masayuki Sugawara是日本NHK科学与技术研究实验室高端电视系统研发部门的高层领导,自从2004年起便致力于ITU-R SG6的制定工作。
Seo-Young Choi是韩国三星电子高级研究部门的研发人员,一直致力于UHDTV基带图像格式的ITU-R标准的相关工作。
David Wood是欧洲广播联盟(位于瑞士日内瓦)的技术创新顾问,担任主席职务,在世界广播联盟技术委员会、ITU-R工作组6P,及关于3DTV和UHDTV的DVB组。
[1] “Parameter values for ultra-high definition television systemsfor production and international
programme exchange,” Recommendation ITU-R BT.2020, Aug. 2012.
[2] “Conventional analogue television systems,” Recommendation ITU-RBT.470-7, Feb. 2005.
[3] “Studio encoding parameters of digital television for standard4:3 and wide screen 16:9 aspect ratios,” Recommendation ITU-R BT.601-7, Mar.2011.
[4] M. I. Krivocheev and S. N. Baron, “The first twenty years ofHDTV: 1972-1992,” SMPTE Motion Imaging J., vol. 102, no. 10, pp. 913–930, Oct.1993.
[5] “Parameter values for the HDTV standards for production andinternational programme exchange,” Recommendation ITU-RBT.709-5, Apr. 2002.
[6] “Extremely high resolution imagery,” Recommendation ITU-RBT.1201-1, Mar. 2004.
[7] “Worldwide unified colorimetry and related characteristics offuture television and imaging systems,” Recommendation ITU-R BT.1361, Feb.1998.
[8] “The present state of ultra-high definition television,” ReportITU-R BT.2246, 2012.
[9] M. Sugawara, K. Masaoka, M. Emoto, Y. Matsuo, and Y. Nojiri,“Research on human factors in ultra-high-definition television to determine itsspecifications,” SMPTE Motion Imaging J., vol. 117, no. 3, pp. 23–29, Apr.2008.
[10] “Relative quality requirements of television broadcastsystems,” Recommendation ITU-R BT.1127, July 1994.
[11] K. Masaoka, Y. Nishida, M. Sugawara, E. Nakasu, and Y.Nojiri, “Sensation of realness from high-resolution images of real objects,” IEEETrans. Broadcast., vol. 59, no. 1, pp. 72–83, Jan. 2013.
[12] “Parameter values for an expanded hierarchy of LSDI imageformats for production and international programme exchange,” RecommendationITU-R BT.1769, July 2006.
[13] M. Emoto and M. Sugawara, “Critical fusion frequency forbright and wide field-of-view image display,” J. Display Technol., vol. 8, no.7, pp. 424–429, July 2012.
[14] M. Sugawara, M. Emoto, K. Masaoka, Y. Nishida, and Y.Shishikui, “SUPER Hi-VISION for the next generation television: Determinationof system parameters,” ITE Trans. MTA, vol. 1, no. 1, pp. 27–33, Jan. 2013.