论文阅读——Disentangled Image Matting

摘要:论文认为以往的算法试图直接从粗糙的trimap估计出alpha matte,试图同时解决两个难题:识别trimap中的混合像素和估计准确的alpha。所以论文提出了AdaMatting,端到端的方法将上述问题分解成两个子问题:trimap适应问题和alpha估计问题。具体来看,trimap适应问题是像素级别通过识别特定前景和半透明图像区域来推断输入图片的整体架构的分类问题。而alpha估计问题是计算混合区域透明度的回归问题。

论文阅读——Disentangled Image Matting_第1张图片

论文采用一个新颖的管道设计同时解决trimap适应的分类问题和alpha估计的回归问题。

1、 Trimap Adaptation

论文阅读——Disentangled Image Matting_第2张图片

(x,y)表示图片的每个像素点。

论文中提到获取Topt包括两个步骤,一是根据alpha值确定背景或前景,二是计算不确定区域。同时提到相比于输入的trimap,我们的预测结果不需要完全匹配,该模型具有一定的容错能力。

2、Network Overview

AdaMatting以图片和对应的粗略trimap作为输入,首先经过encoder生成深度特征用于后续步骤,然后接下来是两个decoder,分别对应两个任务。每个decoder都是由多个3*3卷积和上采样模块构成。其中T-decoder(trimap classification task)输出3通道的分类结果,采用cross-entropy loss。而A-decoder(alpha regression task)输出一通道的alpha估计结果,用于传播模块来进行进一步调整。

Multi-task Autoencoder:

实验发现,trimap调整更依赖于高维特征,而alpha估计更依赖于低维特征,因为模型将encoder获得的高维特征和低维特征分别做了skip操作,分别直接连接到两个decoder上,这样也有利于保证感受野不会太小,计算复杂度又不会太高。

Propagation Unit:

利用lstm卷积网络,每个模块由两个resblocks和一个lstm构成。每次迭代都是以初始的输入图片、调整后的trimap结果和上一步生成的alpha估计作为输入。

3、 Multi-task Loss

论文阅读——Disentangled Image Matting_第3张图片

论文阅读——Disentangled Image Matting_第4张图片

你可能感兴趣的:(深度学习,人工智能,计算机视觉,神经网络)