《Learning multi-Domain Convolutional Neural Networks for Visual Tracking》论文笔记

1,Multi-Domain Network


《Learning multi-Domain Convolutional Neural Networks for Visual Tracking》论文笔记_第1张图片
网络结构

网络比较精简,3卷积(继承自VGG-M)+2全连接(ReLU+dropouts),共五层,最终由k个branch(对应k个domain)

训练SGD(Stochastic Gradient Descent)

网络精简原因:

1,追踪系统只是想要将target和背景区分开,任务总体来说很简单

2,计算量

2, Learning Algorithm


高亮部分就是核心思想


《Learning multi-Domain Convolutional Neural Networks for Visual Tracking》论文笔记_第2张图片

网络的训练没有太多的特点,用mini-batch 到的指定的iteration就ok

在loss function 没有特定的设定,但domain-independent 还没有很好地理解

3,Online Tracking using MDNet

trick 1: long-term and short-term update

trick 2: Hard Minibatch Mining

trick 3: Box Bounding Regression (提高定位准确率)

trick 4: implementation details(一些实现的小技巧:参数初始化、训练数据、网络的学习速率等)




文章核心思想是将追踪变成了一个简单的二义性问题:将target和background区分开来

你可能感兴趣的:(《Learning multi-Domain Convolutional Neural Networks for Visual Tracking》论文笔记)