计算机视觉 | 面试题:30、常见的三种图像插值方法

FPN网络的上采样过程用到了最近邻插值(转置卷积也是一种上采样方法,具体在其他问题中介绍),Mask R-CNN的 ROI Align 中用到了双线性插值,本科选修课上课时候听了一下,现在却忘了,又得花时间捡起来……

背景知识

其实图像插值分为图像内插值和图像间插值两种。

图像内插值的主要应用是对图像进行放大以及旋转等操作,是从低分辨率的图像生成高分辨率图像的过程,用以恢复图像中丢失的信息,使得图像更清晰,细节信息更多,相邻像素之间的过渡更加有连续性。也就是单帧图像的图像重建过程。

图像间插值,也叫图像的超分辨率重建,是指在一图像序列之间再生出若干幅新的图像,可应用于医学图像序列切片和视频序列之间的的插值。

我们这里主要讨论的是图像内插值,常用的图像内插值算法有:最近邻插值、双线性插值、三次内插法。

最近邻插值

这是最简单的一种插值方法,不需要计算。算法是:在待求像素的四邻域中,将距离待求像素最近的邻像素的灰度值赋给待求像素。下面举个例子:如图所示,我们要求坐标为 ( i + u , j +

你可能感兴趣的:(CV面试题,深度学习)