图像和视频通常包含着大量的视觉信息,且视觉信息本身具有直观高效的描述能力,所以随着信息技术的高速发展,图像和视频的应用逐渐遍布人类社会的各个领域。近些年来,在计算机图像处理,计算机视觉和机器学习等领域中,来自工业界和学术界的许多学者和专家都持续关注着视频图像的超分辨率技术这个基础热点问题。
本文试着讲述超分辨率技术的正确打开方式,浅谈视频图像的超分辨率技术的基本概念和应用场景等问题。
简单来讲,图像超分辨率就是提高图像的空间分辨率,例如将一幅图片的分辨率由352x288扩大到704x576,方便用户在大尺寸的显示设备上观看。图像的超分辨率,是图像处理相关问题中的基础问题之一,并具有广泛的实际需求和应用场景,在数字成像技术,视频编码通信技术,深空卫星遥感技术,目标识别分析技术和医学影像分析技术等方面,视频图像超分辨率技术都能够应对显示设备分辨率大于图像源分辨率的问题。
简单来说超分辨率技术可以分为以下两种:
这两类技术中,一般来讲后者相比于前者具有更多的可参考信息,并具有更好的高分辨率视频图像的重建质量,但是其更高的计算复杂度也限制了其应用。故,本文后边将以单图超分辨率/图像插值为例,进行超分辨率技术的介绍。
这个很直观的超分辨率问题,它的理论描述又是什么样子的呢?如下图所示,超分辨率就是将左图中像素点之间的空间位置用像素点进行填充,使得整个图像具有更多的像素点,更丰富的细节,从信号的角度讲就是补充出更多的高频成分。
通常在处理这个超分辨率问题的时候,我们常常探索这个退化信号是如何从我们希望的理想信号变化得到的(即分辨率的退化过程),如果对退化过程进行精确地描述,往往对其逆问题的求解有重要的意义。
资料内容包括《Andoird音视频开发必备手册+音视频最新学习视频+大厂面试真题+2022最新学习路线图》,私信扣1,免费分享
在本文的问题中,即超分辨率的退化模型,可以通过以下公式来描述:
Y = HDX + n
其中Y为低分辨率的视频帧/图像,X为我们理想高分辨率的视频帧/图像,而H和D分别为模糊算子和分辨率下采样算子,n为退化过程中产生的噪声。
由上述公式可知该退化问题存在着病构特性,即多个不同的高分辨率图像X,经过相同的退化过程处理,可以得到同样的低分辨率图像Y。这就导致我们无法直接通过Y求解出一个精确的X,也是视频图像超分辨率问题一直是一个开放性问题的原因(逐渐逼近符合人眼视觉认识的解)。
根据图像超分辨率的技术路线进行分类,图像超分辨率技术大致可以分为以下几类:
先举一个小例子,一张悠久而经典的低分辨率老照片,怎么在一个先进的高清的显示器上播放?这就是低分辨率图片和高分辨率显示设备之间的不匹配。很明显,这个场景下我们可以使用超分辨率技术,如下图所示。
单从图像的后处理显示的角度来讲,目前在PC和手机的屏幕显示功能上都配有相应的实时的超分辨率技术。
通过观察可知,PC机上的超分辨率技术相对比较简单(比如,临近像素复制or双线性插值),而手机端屏幕的超分辨率技术比PC机显示的超分辨率技术的性能要更好一些,能够提供较好的主观视觉质量,且IOS系统的手机的超分辨率技术相比于一些Andriod系统手机的超分辨率技术性能更高一些。不同的超分辨率算法带来的增强视觉感受的效果不同,一些软件的超分辨率方法在带来更好的视觉质量的同时,也引入了很大的计算代价,不断挑战着显示设备的计算能力。
那么,前边赘述了这么多超分辨率的基础概念和使用方法,这个技术看起来就是万能的吗?有些人会有疑问,那就可以借着超分辨率技术用小分辨率的图进行通信就好了?其实并不是这样的!
在传输图片的时候,超分辨率和带宽有什么关系呢?
一般来讲,现在的通信类应用中,图片都是需要经过压缩,传输,再解压缩这样的一系列过程:
如下图所示:
这里,超分辨率技术就不单单是一个视频图像的后处理技术,而是基于上下采样的编码传输框架中的一个重要环节。那么问题来了,这种下采样-超分辨率的图片传输方案B能够节省带宽吗?(最终图片的视觉质量一致的前提下),或者说是在相同的带宽限制下,直接压缩传输大图片和压缩小图片再超分辨率显示,哪一种方案对显示的主观质量更好?
由于在这个场景下两个方案之间不能直观的从理论上比较,所以我们通过实验来进行说明,设计了以下实验:
原图压缩方案A,即原始高分辨率图像直接通过编码器进行压缩和传输,在解码端直接得到原始分辨率的重构图像。基于上下采样的图像压缩方案B,即图像首先经过一个分辨率下采样(宽高均为1/2倍)的预处理方法,再将得到的低分辨率图像利用相同的第三方的编解码器WebP进行压缩和传输,最后将在解码端得到的低分辨率图像利用超分辨率技术重建出其高分辨率的图片(这里超分辨率技术选用Google在G+上的方案和一种经典的深度网络的SCN方法)。
下面我们给出两个不同策略下的图像压缩的(图片质量和文件大小)性能的比较,如下图所示:
如图(a)和(b)两幅图像的性能比较所示,图像纵坐标为图像全参考的视觉质量评价方法SSIM指标(用来比较相同分辨率下的原图和在对端最终显示的图像的差异),横坐标为图像经由第三方编码器WebP的压缩码流所占用的存储空间(KB),上下采样压缩曲线的四个数据点对应WebP质量因子分别为40,60,80,100,而原图压缩的四个数据点对应WebP质量因子分别是2,5,15,60。
实验中首先验证得到两个认识:
再通过实验曲线可以得出,在低码率范围内,采用原图压缩方案的压缩效率要低于基于采样的图像编码策略(即同等质量下,基于采样的图像编码策略图片文件更小,节省带宽),而在中高码率范围内,采用原图压缩方案的压缩效率要优于基于采样的图像压缩方案(即同等质量下,超分辨率的图像编码策略的图片文件更大,浪费带宽)。
进而我们结合应用环境得出以下结论:
目前,在常见的一些视频图像的应用中,我们给定的码率均为中高码率以满足图像视频的视觉质量,大部分移动终端上的视频图像应用的方案均为在目标分辨率上直接压缩,质量控制在高于WebP质量因子为60的水平,如实验中验证的一样,在这个码率范围下,采用现有的直接压缩原图方案A要优于下采样压缩低分辨率图像再做解压缩超分辨率的方案B。
视频图像超分辨率技术,是图像处理相关问题中的基础问题之一,也是近些年来学术界研究的热点问题。
视频图像超分辨率技术作为图像的后处理技术能为了匹配更大分辨率的显示设备够提升图像的主观视觉效果。在压缩传输的应用场景中,为了在同等带宽下获得更高的图像质量,超分辨率算法适用于低带宽时低质量图像上的增强,在带宽充足时仍然应该传输高分辨率图像,即下采样—超分辨率的技术,受限于其性能上限,仅仅在低码率传输条件下,采用超分辨率增强的图像质量明显优于的在大图像上直接编码(即同等质量节省带宽)。
综上所述,视频图像超分辨率技术在应用中要考虑计算复杂性限制,传输带宽的限制和视觉性能上限(主观视觉效果)等因素,来选择恰当的应用场景。