paper总结(6)Cross-Model Pseudo-Labeling for Semi-Supervised Action Recognition

        提出了一种更有效的伪标记方案,称为跨模型伪标记(CMPL)。具体来说,除了主骨干网之外,我们还引入了一个轻量级辅助网络,并要求它们相互预测伪标签。我们观察到,由于结构偏差不同,这两个模型倾向于从相同的视频片段中学习互补表示。因此,通过利用交叉模型预测作为监督,每个模型都可以从对应的模型中受益。

        尽管小型模型的容量较低,但在某些类别上,与大型模型相比,可以实现显著的改进。特别是,它在识别动作时更好地捕捉时间动态,而大型模型往往更好地学习空间语义,以区分不同的动作实例。

        基于这一观察结果,我们提出了交叉模型伪标记(CMPL),其中主主干由一个轻量级辅助网络进行补充,该网络具有不同的结构,与主干相比信道更少。

这种架构上的差异导致输入数据的不同表示形式,与主骨干网的表示形式互补。然后,给定一个未标记的视频片段,我们从辅助网络借用一个可靠的预测作为主主干的伪标签,反之亦然paper总结(6)Cross-Model Pseudo-Labeling for Semi-Supervised Action Recognition_第1张图片

        跨模型伪标记(CMPL)框架的说明,该框架由两个模型组成,即主骨干F(·)和辅助网络A(·)。它们以不同的帧速率接收视频输入。除非另有规定,我们采用3DResNet50作为主骨干网,采用轻型3D-ResNet50×1/4作为辅助网。给定一个未标记的视频,这两个模型对弱增强数据进行独立预测。预测结果用于为其同级生成伪标签,并将其用作强增强版本的监督。“SG”表示停止梯度操作。本图中省略了标记数据的监督损失。 

你可能感兴趣的:(paper总结(6)Cross-Model Pseudo-Labeling for Semi-Supervised Action Recognition)