简洁的架构还能高效和准确？清华&华为提出新型残差循环超分模型：RRN！

作者 | Wangsy
编辑 | CV君
报道 | 我爱计算机视觉（微信id:aicvml）

分享一篇视频超分辨率的论文 Revisiting Temporal Modeling for Video Super-resolution，其为BMVC 2020 论文，该文的结果目前在视频超分的几个数据集上都是排名第一，代码已开源。

作者单位：清华大学、纽约大学、华为诺亚方舟实验室

1 看点

本文提出了一种简洁而又高效的超分架构，在测试集上一帧只需45ms PSNR就可以达到27.69，具有很大的实用价值，亮点如下：

以往已经提出了许多基于深度学习的视频超分辨率（video super-resolution，VSR）方法，但是由于使用不同的损失函数或训练集，因此很难直接比较这些方法。本文统一的研究和比较了三种时域建模方法：早期融合的2D CNN、慢融合的3D CNN和RNN。
提出了一种新的残差循环网络（RRN），利用残差稳定RNN的训练，同时提高超分辨率性能，在三个基准测试集上均达到了SOTA。

2 时域融合模型

2D CNN：采用了几个改进的2D残差块，每个块由3×3卷积层和ReLU组成。模型以2T+1个连续帧为输入，首先先在通道维度串联，然后通过一批残差块，输出shape大小为H×W×Cr^2^的残差特征图，通过depth-to-space上采样四倍得到残差图像R~t~^↑^，和双三次上采样的中心帧相加，得到HR图像。