飞桨论文复现作业:Temporal Pyramid Network for Action Recognition论文阅读

最近在参加百度飞桨组织的“顶会论文复现营”,课程主要围绕着gan和视频分类两个类别的论文进行论文的讲解和复现,课程链接如下,感兴趣的朋友可以听听 https://aistudio.baidu.com/aistudio/education/group/info/1340
下面切入正题,Temporal Pyramid Network for Action Recognition是港中文和商汤的成果,而且有大佬周博磊的参与。
本文提出TPN(Temporal Pyramid Network)网络结构。起源于对视频动作快慢得研究,在多个数据集上取得优秀得结果。可以嵌入到各种视频分类网络中,有效提高检测精度。
TPN主要的工作是在之前的网络基础上解决了视频的节奏问题,由于之前的视频分类网络在识别上主要是固定间隔在输入层进行采样,这样无法识别视频的节奏,该论文的主要框架如下图,通过框架可以知道作者的总体思路,但要是想了解详细是实现,还得仔细阅读作者的源码了。

飞桨论文复现作业:Temporal Pyramid Network for Action Recognition论文阅读_第1张图片

你可能感兴趣的:(ai)