【论文阅读】Two-Stream Convolutional Networks for Action Recognition in Videos

论文是视频分类的开山之作,采用了一个双流网络,是空间流和事件流共同组成的,网络的具体实现都是CNN,空间流的输入是静止的图片,来获取物体形状大小等appearance信息,时间流的输入是多个从两帧之间提取的光流图片叠加在一起,来获得视频中物体的运动信息,最后将结果进行融合。

 

【论文阅读】Two-Stream Convolutional Networks for Action Recognition in Videos_第1张图片

参考文献:

  1. Simonyan K, Zisserman A. Two-stream convolutional networks for action recognition in videos[J]. Advances in neural information processing systems, 2014, 27.

你可能感兴趣的:(个人学习,计算机视觉)