视频物体分割--One-Shot Video Object Segmentation 2017年cvpr

One-Shot Video Object Segmentation CVPR2017

http://www.vision.ee.ethz.ch/~cvlsegmentation/osvos/

One-Shot Video Object Segmentation,基于单帧标记的视频物体分割,对于一个视频中的某一个物体,只提供一张训练样本,从视频里所有的该物体分割出来。
视频物体分割--One-Shot Video Object Segmentation 2017年cvpr_第1张图片
上图第一张图像是标记样本,其他的图像是分割的结果。

One-Shot Video Object Segmentation (OSVOS) 算法总体的思路如下:
视频物体分割--One-Shot Video Object Segmentation 2017年cvpr_第2张图片
先在 ImageNet 训练一个图像分类模型,得到的网络称之为 Base Network,接着我们 在 DAVIS 训练一个分割网络,得到 Parent Network,最后我们在目标视频上微调,得到 Test Network。前两个网络的训练都是 offline, 最后一个网络的训练是 online

这个online 时间越长效果越好
视频物体分割--One-Shot Video Object Segmentation 2017年cvpr_第3张图片

3 One-Shot Deep Learning

对于单张训练样本的问题,是怎么解决这个问题的了? we leverage strong priors: first “It is an object,” and then “It is this particular object.”我们的算法也是采取这个思路,循序渐进的解决这个问题。

视频物体分割--One-Shot Video Object Segmentation 2017年cvpr_第4张图片
3.1. End-to-end trainable foreground FCN
这里我们采用了一个 语义分割网络,参考文献【30】,基于 VGG模型。就是上图的 foreground branch,对于 这个分割网络的损失函数,我们参考文献【51】的 pixel-wise cross-entropy loss,同时了采取了文献【51】解决 imbalance between the two binary classes 的方法。

这个前景分割主要是判断物体的有无和大致位置,不能给予精确的边界位置信息,这里我们又加入了 contour 信息,
边缘检测CNN网络的训练完全是离线的, train the contour branch only offline

有了边缘信息,我们使用这些边缘信息来得到精确的物体分割,
the use of the Fast Bilateral Solver (FBS) [2] to snap the background prediction to the image edges

DAVIS Validation
视频物体分割--One-Shot Video Object Segmentation 2017年cvpr_第5张图片

Qualitative results
视频物体分割--One-Shot Video Object Segmentation 2017年cvpr_第6张图片

Youtube-Objects evaluation
视频物体分割--One-Shot Video Object Segmentation 2017年cvpr_第7张图片

更多的训练样本
视频物体分割--One-Shot Video Object Segmentation 2017年cvpr_第8张图片

Extended version of “One-Shot Video Object Segmentation”, CVPR 2017

Video Object Segmentation Without Temporal Information

extract the semantic instance information from instance-aware semantic segmentation algorithms (we experiment with two top-performing methods:
MNC [9] and the most recent FCIS [34]). We modify the algorithm and the network architecture to select and propagate the specific instances we are interested in, and then we adapt the network architecture to include these instance inside the CNN

视频物体分割--One-Shot Video Object Segmentation 2017年cvpr_第9张图片

视频物体分割--One-Shot Video Object Segmentation 2017年cvpr_第10张图片


你可能感兴趣的:(论文)