【CVPR2018,action recognition,动作识别】Appearance-and-Relation Networks for Video Classification...
Appearance-and-RelationNetworksforVideoClassification,CVPR2018Two-tream网络效果好,但是太耗时;2Dconv+LSTM和其他方式的效果又不太好,主要是因为LSTM只能抓住高层次的模糊信息,不能抓住细粒度的运动信息。3Dconv的效果到目前为止也不太好。所以作者提出了一个新的网络结构---ARTNet,用叫做SMART的block