RTFM:Weakly-supervised Video Anomaly Detection with Robust Temporal Feature【ICCV 2021】附代码注释

论文解读      

摘要具有弱监督视频级别标签的异常检测通常被表述为多实例学习(MIL)问题,其中我们旨在识别包含异常事件的片段,每个视频被表示为一个视频片段包(Bag)。尽管当前的方法显示出有效的检测性能,但它们对正样本(即异常视频中的稀有异常片段)的识别在很大程度上受到大量负样本的影响,尤其是当异常事件是与正常事件相比仅表现出微小差异时。在许多忽略重要视频时间依赖性的方法中,这个问题更加严重。为了解决这一问题,我们引入了一种新的理论上可行的方法,称为鲁棒时间特征幅值学习(RTFM,它训练特征幅值学习函数,以有效地识别正样本,大大提高了MIL方法对异常视频负样本的鲁棒性。RTFM还采用扩展卷积和自我注意机制来捕获长距离和短距离的时间相关性,以更鲁棒地学习特征量值。大量的实验表明,支持RTFM的MIL模型(i)在四个基准数据集(ShanghaiTech, UCF-Crime, XD-Violence and UCSD-Peds)上大大优于几种最先进的方法;(ii)实现了显著改进的细微异常辨别能力和样本效率。

你可能感兴趣的:(论文笔记,人工智能,深度学习)