本文转载自“煤矿工厂”。莫斯科国立大学(MSU)开启了一项从主观层面对比视频质量的服务,本文是他们对AV1和VP9、HEVC编码质量的测试结果。
前言
最新的编码质量对比研究表明,视频编码标准AV1在质量已经登顶,但在编码速度方面仍与VP9、HEVC相差甚远。同时,莫斯科国立大学(MSU)开启了一项从主观层面对比视频质量的服务,名为Subjectify.us。
MSU的研究表明,仅考虑编码质量时,AV1的性能已胜过HEVC和VP9,成为目前质量最高的可用视频编码标准。同时发现,在常规操作模式下,VP9相比于HEVC也有更好的编码质量。不过,以上仅是MSU 2017编码对比报告中诸多亮点的一小部分,除此之外,MSU开展了在线对比视频与静态图像主观质量的服务,并对于SSIM在运用于度量编码质量的测试时需作出的调整问题有了一些新的发现。
MSU从06年就已开始在编码质量对比领域进行深入研究,并在15年公开了HEVC与其他标准比较的成果。近年来,MSU继续利用多类视频/图像文件,多种测试方法,多种解码器不断更新出编码对比测试的版本。MSU今年将对比报告分为五个部分,每部分的大体内容如下所示:
图1 MSU报告概述
AV1标准将逐渐盛行
这部分将针对上图中的Part.5进行展开描述。其中,图2为解码器客观质量对比中最具总结性的图表。从图中可看到,在编码质量相同的情况下,AV1标准仅产生相比于x264 55%的数据量,其次是三通道和二通道Placebo模式下的x265标准,分别产生67%和69%的数据量,然而这两种模式在编解码中并不多见。
同时,报告中对于编码速率也提出了明确的说明:“AV1的编码速率低于其他编码标准2500-3000倍不等,x265的Placebo模式与其他标准的差别有10-15倍”。但MSU发现,AV1还未被完全优化,这也意味着AV1距离实际的投入使用还需要一段时间。
图2 各类编码标准质量对比
MSU在对比时对VP9采用了最慢以及次慢的编码配置,这两种配置常被用于实际的数据传输。VP9呈现出了略优于x265双通道模式的性能,在对比,阐明系统参数的过程中,MSU也常向编码解码器的开发商咨询确认,并会采用一些开发商实际使用的参数进行测试。最终得到一个严谨的结论:在利用31个高清视频样本和独立的第三方配置条件下,VP9比HEVC有更好的质量表现。
Subjectify.us产生的主观测试结果
今年MSU的报告中第一次包含主观测试结果,系统效果如下图所示。Subjectify.us允许用户上传不同类型的图像或视频,并处理用户的主观评价。在测试期间,用户需要频繁点击以保证他们测试的专注程度。
例如,一次测试会出现10个样本,每个样本会有原始样本和压缩样本,显然,原始样本在主观质量上总优于压缩样本。如果用户在这类对比上产生了错误的判断,则认为他们的测试结果无效,并终止他们的测试。
图3 Subjectify.us系统界面
MSU通过Subjectify.us收集了325人次的11530次对比结果,MSU团队折算后的主观评分计算出平均比特率的评分。下图则展示了主观评分对于HEVC编码器整体评分(包含速率)的影响。
图4 HEVC编码器整体得分
从目前的各类成果来看,主观测试费时费力费财,因而Subjectify已是一种研究者或开发商选取编码方式的良好途径。
Tune SSIM
最后一项有意义的发现是关于编码配置tune SSIM的。这是源于x264和x265开发者发现,单一的用于提高主观质量的解码工具会引起客观指标如SSIM、PSNR数值的下降。所以开发者通常放弃这类指标中影响视觉质量的调整,使得两者协调一致。
以下是来自x265文件的建议:“SSIM/PSNR调优的选项会禁止一切以牺牲视觉质量为代价的指标优化”。据此,x265中常以可到达的最高视觉质量为基准进行调优。
同样,也可以以SSIM为基准进行调整,但这可能会使主观评分急剧下降。然而,MSU的研究发现了相反的结果,特定调整后的x264/x265编码性能反而比未调整前更好,结果如下所示。
图5 SSIM调整前后质量对比
MSU的这一结果实际上是在1Mbps至4Mbps之间传输1080p视频的条件下得到的,对此,x264的开发者是这样回应的:
“1-4Mbps对于1080p视频的解码来说是较低的比特率,此时会产生铃铛效应或者区块效应,这本身就降低了主观质量,因而以牺牲视觉质量为代价的客观指标调整需在高比特率条件下进行。同时,SSIM的调整也分为两种模式,一种模式因其自适应性并不需要太多的变形,而另一种则相反,因而不同类型的调整也会影响最终的结果。”
但实际上,4Mbps对于1080p视频的传输来讲已不算太低,这使得利用客观指标对比编码质量的研究变得迷茫,研究者究竟应该用什么范围的速率进行SSIM调整的测试研究?对此,x264开发者认为或许对每个源均进行变形的方法可以得到理想的效果,但这也会引发指标计算需简化的问题。
由此,MSU的成果带来了一个利用SSIM和PSNR比较传输速率跨度较大的视频集时的有效性问题。对于这个问题,或许更先进的指标,如VMAF,可以避免这样的冲突,又或许只能通过主观对比才能消除这种矛盾。众多相关领域人员也希望接下来的几个月甚至更长的时间能有团队解决这个难点。
参考自:
http://www.streamingmedia.com/Articles/News/Online-Video-News/AV1-Beats-VP9-and-HEVC-on-Quality-if-Youve-Got-Time-says-Moscow-State-122945.aspx
http://www.streamingmedia.com/Articles/Editorial/Featured-Articles/Moscow-State-Releases-First-HEVC-Comparison-107455.aspx