论文笔记-Richly Activated Graph Convolutional Network for Robust Skeleton-based Action Recognition

Hello,今天是论文阅读计划的第5天啦。
今天这篇论文比较简单,没有什么特别复杂的技术。

一、论文题目关键词提取

Richly:丰富地。为什么称之丰富的呢?丰富地激活了什么呢?
Robust: 鲁棒的。提取的特征更具备鲁棒性?
带着疑问往下阅读。

二、研究背景

这个NTU数据集上目前都是直接识别分类的,但实际真实情况下,会出现物体遮挡、自遮挡等情况。现有的算法在缺失的情况下,性能下降非常多非常快。本篇论文的Baseline是ST-GCN。

三、研究目标 & 内容

目标:提升ST-GCN的准确率,在遮挡的情况下,尽可能的减少性能损失

内容:通过设计多流的方式,使用MASK的方式来将已经激活的节点过滤掉,强制在还未识别到的关节点上进行识别,来激活那些还未识别到的关节点,提取到更丰富的特征。

四、方法

整体框架图:
论文笔记-Richly Activated Graph Convolutional Network for Robust Skeleton-based Action Recognition_第1张图片
注意他的数据处理这部分,将原数据x进行了时间差得到Motion运动信息,以及将原数据x做了相对坐标的处理,然后将其Concat起来形成了9维数据。

模型这部分呢主要是将ST-GCN的模型重复了三流,这中间使用了CAM的方式来保存和传递信息,是下一流的模型更能专注在那些还未被识别到的关节点上。

损失函数这块呢,是把每一流的损失进行了整合。

作者自己合成的缺失数据集:

分别做了时间帧、身体部分、区域、以及一些随机的遮挡和干扰。这也是本文的一个较为突出的贡献点。
作者提出的模型有利于在这种缺失或干扰的情况下进行动作的识别。论文笔记-Richly Activated Graph Convolutional Network for Robust Skeleton-based Action Recognition_第2张图片

五、总结

本文模型上的创新在于使用了mask的方式来连接了多流的网络,以及提出了自己合成的数据集。提供了一个新的思路。所以之后有一篇论文专门做了合成干扰、噪声的数据集。
本篇论文在性能和效率上都有提升的空间。不过要是能有自己很全新的idea当然更好。

你可能感兴趣的:(#,论文阅读笔记)