【CVPR2017,action recognition,动作识别】Quo Vadis, Action Recognition?
本文只主要有两个贡献。ImageNet表明在足够大的数据集上训练网络之后,在其他的数据集甚至其它类型的任务上直接使用pre-trained参数初始化能够取得很好的效果。本文探究了在足够大的视频数据集Kinetics上训练了之后在UCF101和HMDB51上能够得到非常好的效果,可以达到在目前最好的效果。总结了经典的动作分类方法,提出了一个新的结构组合方式,即把3Dconv应用到two-tream的