弱监督时间动作定位的等效分类映射Equivalent Classification Mapping for Weakly Supervised Temporal Action Localization

        该论文介绍了用于弱监督时间动作定位的等效分类映射(ECM)方法。 它将预分类和后分类两种分类流程结合到一个统一的框架中。 该方法强调等价机制,确保两个管道之间的分类分数和聚合权重一致。 它还提出了一个权重转换模块等效的训练策略来提高性能。 ECM 在基准数据集上的动作定位方面显示出有希望的结果,而无需详细的帧级注释。 


先分类(Pre-classification)和后分类(Post-classification)

弱监督时间动作定位的等效分类映射Equivalent Classification Mapping for Weakly Supervised Temporal Action Localization_第1张图片

两个动作定位Pipeline的图示:

(a)先分类/预分类 Pre-classification:首先在每个时间点进行分类,然后汇总分数。

(b)后分类 Post-classification:首先汇总特征,然后预测分类分数。

这两种Pipeline都由视频级分类损失Lcls约束。


等效分类映射(ECM)方法的框架

弱监督时间动作定位的等效分类映射Equivalent Classification Mapping for Weakly Supervised Temporal Action Localization_第2张图片

等效分类映射(ECM)方法的框架:提取视频特征并将其发送到Pre-classification和Post-classification。Pre-classification在每个

你可能感兴趣的:(视频动作定位,计算机视觉,python,人工智能,算法,视频)