• NTSC 或 PAL/SECAM最大可视分辨率:
• 4:3 宽高比
• 可以以模拟或数字形式进入前端
• 横向 x 纵向: 720 像素 x 480 线(NTSC) [ITU-R BT.601-6] 或720 像素 x 576线 (PAL)帧率:
• 低分辨率 (例如 ¾ 水平 或 ½ 水平 – 所谓的 ½ D1) 可能被用来保证复杂素材的编码质量
• 29.97 fps (NTSC) 或 25 fps (PAL/SECAM)
• 23.97 / 24 fps 也可能用于基于电影的素材(NTSC 通过3:2下拉转换为 30 fps( with 3:2 pull-down for NTSC conversion to 30 fps))
• 每帧两个隔行扫描场
• NTSC 或 PAL/SECAM音频采样率:
• 源素材可以包含多个立体声音轨,以支持多语言或环绕声效果,除非在表6-2中有明确指出,否则建议的最小比特率只适用于单一立体声对。
音频声道:
• 许多广播商也将5.1(多达六声道)环绕声应用于黄金时段的节目和特殊内容,尤其是音乐会和体育赛事。
• Dolby digital (AC-3): 48 kHz 采样率
• MPEG-2 Audio Layer III (MP3): 16 kHz - 24 kHz
• MPEG-1 Audio Layer III (MP3):32 kHz - 44.1 kHz
• 32 kHz, 44.1 kHz or 48 kHz for MPEG-1 Audio Layer II as per [b_ETSI TR 101 154]
• AAC:48 kHz
• NTSC 或 PAL/SECAM最小可视分辨率:
• 4:3 宽高比
• 通过使用多通道系统,可以在线下进行存储内容(例如VoD节目资产)的编码。
• 水平 x 垂直: 允许使用1/2 D1 352 像素 x 480 线 (NTSC) [b ITU-R BT.601-6] 或 352 像素 x 576 线 (PAL/SECAM) 来保证复杂素材的编码质量帧率:
• 但是,对于有线电视系统,建议使用¾ D1 分辨率(528x480 / 528x576)( However, it’s recommended that be used where possible to align with the maximum specified for cable systems)
• 电信服务供应商可以以全D1分辨率运行VoD节目资产,但很可能无法重新使用为电缆部署而进行预编码的节目资产。
• 29.97 fps (NTSC) 或25 fps (PAL/SECAM)
• 23.97 / 24 fps 也可能用于基于电影的素材(NTSC 通过3:2下拉转换为 30 fps( with 3:2 pull-down for NTSC conversion to 30 fps))
• 每帧两个隔行扫描场
• 实际的比特率要求必须单独确定以满足各IPTV服务环境的所有要求
• H.262的比特率基于VoD内容的常用值,并且符合目前可用的大多数VoD节目资产
• H.264、 SMPTE 421M和AVS 比特率是从H.262 推导得出的,其中使用了一个1.5x 因子
• 大多数常见H.262编码 VoD 资产的视音频总比特率为 3.75 Mbits/s
• 一个VoD服务的QoE也可能受特技模式功能实现质量的影响,例如快进和快退,这些模式应该尽可能地流畅。如果可能的话,在特技模式中还应该包含有清晰的音频。
• ATSC 或 DVB
• 16:9宽高比
• 源素材以数字格式形式进入前端
分辨率和帧率:
• 720p60 (例如SMPTE 296M)或 720p50 (DVB)
- 水平 x 垂直: 1280 像素 x 720线- 每秒50, 59.94, 60逐行扫描帧
• 1080i60 (例如SMPTE 274M) 或 1080i50 (DVB)
- 水平 x 垂直: 1920 像素 x 1080 线- 每秒29.97 (59.94i), 30 (60i) 隔行扫描帧,每帧两场
• ATSC 或 DVB
• 源素材可能包含多个音频轨以支持多语言应用
• 可能的情况下,要提供环绕声效果所需的多轨音频
• 音频轨:
• 许多广播商也将5.1环绕声应用于黄金时段的节目和特殊内容,尤其是音乐会和体育赛事。
• 音频采样率:
• MPEG-1 (or -2) Audio Layer II:44.1 kHz 或 48 kHz
• Dolby digital (AC-3): 48 kHz 采样率
• MPEG-2 Audio Layer III (MP3): 16 kHz - 48 kHz
• MPEG-1 Audio Layer III (MP3):32 kHz - 48 kHz
• 32 kHz, 44.1 kHz or 48 kHz for MPEG-1 Audio Layer II as per [b_ETSI TR 101 154]
HDTV的A/V同步要求目前正在由ATSC等机构研究中,在此之前,HDTV素材也应遵循表6-3中提供的针对于SDTV的指导方针
• 高度依赖于所损失的数据类型
- 系统信息和报头的损失会产生不同的损伤
- I帧和P帧丢失的数据由于会造成误差传播而比B帧分组丢失造成的损伤更严重
• 依赖于所用的编解码器
• 依赖于所用的MPEG 传输流分组
• Loss distance and loss profile
• 编码比特率越高,数据流对分组损失造成的损伤越敏感
- 对于相同的丢包率,码率高的视频流更易发生因损失造成的损伤(也就是说单位时间内可见的错误越多),因为码率高的视频流中每秒传输的分组更多并且每个分组被影响的概率相同
• 解码器隐藏算法可以减轻一些损失造成的感知影响
在视频比特流中的一个错误或一系列错误会造成不同程度的影响,可能根本觉察不到,也可能是视频或音频信号的彻底损失,这取决于丢失的是什么以及实施时的鲁棒性。图IV.1展示了单一IP分组(包含7个MPEG传输流数据包)丢失(丢失的信息来自于I帧或B帧)对一个视频帧造成的影响示例。我们可以看到,由于I帧在后续P帧和B帧的压缩中起关键作用,所以I帧的损伤传播时间达到了14帧,也就是几乎半秒(假设每帧33ms)的时间。如果丢失的分组影响的是B帧,其损伤只会影响这一帧(33ms),因为编解码器不会采用B帧进行帧间预测编码。需要注意的是,在这个示例中,解码器端没有运行损失隐藏算法。
图 IV.1:单个IP分组丢失的影响示例(左图为B帧,右图为I帧)
下面的表格展示了为达到各种视频服务令人满意的服务质量目标所需的IP数据包传输丢失和抖动要求阈值的最低要求,同时也指明了相关的假设。
网络延迟和抖动应该匹配于机顶盒抖动缓冲区配置(等待时间和缓冲区大小)及网络整体设计,因此在不同的实现之间会有不同。网络抖动必须小于去抖动缓冲区的大小;超出限制的时延偏差会表现为损失。不断增加的缓冲也会对频道切换延迟这样的特性造成负面影响,所以在理想情况下,去抖动缓冲区应该尽可能地小。抖动的目标值设置要基于运营商的经验和机顶盒的缓冲能力。
在IETF RFC3357的单向损失模式示例指标中,数据包损失的目标值是从损失时间和损失距离两方面进行描述的。损失距离即连续网络数据包丢失或错误事件之间的间隔;损失时间即为丢失或错误事件的持续时间(以及这段时间内丢失了多少数据包)。表格中的损失率则是在没有或只有最少的损失隐藏的假设下设计的用来确保令人满意的终端用户服务水平质量的目标。如果网络基础设施的性能低于要求水平,服务供应商可能会用到DSLF TR126的附录II-错误保护机制中所描述的网络层技术(例如交错和FEC)和应用层机制(例如损失隐藏、应用层FEC、自动重发请求(ARQ))来实现要求的性能水平。此外,这些技术的使用可能会改善体验质量,超越竞争对手提供的服务。
理想的最大损失时间应该对应于一个IP数据包,因为随机的比特错误或少量的拥塞常常会导致损失时间为一个数据包的孤立损失事件,而这些孤立损失事件就足以造成如图IV.1所示的非常明显的损伤。但是,在一些会发生循环损伤或FEC的物理层上(例如DSL),或发生大量拥塞的情况下,会产生持续几十毫秒的损失,我们也需要考虑到这种情况。这种类型的损失事件根据下表所示的不同视频流比特率会导致不同数量的数据包丢失。这里的最大损失时间目标是临时设置的,直到将来的研究能在考虑到不同的物理层、保护机制和优化机制的前提下更好地调整最大允许损失时间。
此外,在一些情况下,如DSL调制解调器重新同步或IGP在没有其他保护机制时的收敛(例如MPLS快速路由、快速IGP收敛),会发生持续数十秒的损失事件。这样的事件已经不能算作是服务质量缺陷,而应该被认为是服务中断,一个IPTV系统也无法奢望在发生这样的事件时还能维持正常的服务。
视频应用应该能够在存在正常运行缺陷的情况下正常运行。一个正常的操作考虑就是网络中的保护切换机制的操作。SONET/SDH保护切换机制可能会导致一个持续大约50ms(举例)的潜在数据包丢失时间。对于其他的保护机制(例如MPLS快速重路由、快速IGP收敛),潜在的数据包丢失持续时间可能更长,例如可能约250ms。这些都会对大量订户造成影响,所以鼓励服务供应商增加可以最小化或消除这些保护机制造成的可见影响的机制。
考虑到其他保护机制所带来的潜在分组丢失持续时间可能更长,例如,一个完整的IP(IGP)路由表重收敛将带来约30s的潜在分组丢失脉冲。这样的事件已经不能算作是服务质量缺陷,而应该被认为是服务中断,一个IPTV系统也无法奢望在发生这样的事件时还能维持正常的服务。
所有的损失都被指定为端到端的目标(从视频源到机顶盒的视频输出到电视机,包括任何可能在网络或应用层应用的损失校正机制)
• 错误事件的损失距离应被限制在特定时间段内要求的损失事件数以下。一组IP数据包(每个数据包包含有7个MPEG传输流数据包)的丢失或损坏都被认为是错误事件。
• 机顶盒解码器应该采用错误隐藏技术来最小化丢失或损坏的视频数据包的影响。
• DSLF TR126的附录II-错误保护机制提供了有关于接入误码率,FEC和ARQ机制的额外细节。
我们的目标是,通过结合网络性能要求、损失恢复机制(例如FEC、梳妆滤波器)和损失缓解机制(例如解码器损失隐藏)来尽可能最小化可见损失。