群体行为识别深度学习方法研究综述

摘要

群体行为识别是计算机视觉领域应用广泛且亟待解决的重要研究问题。伴随着深度神经网络的发展,群体行为识别与理解的宽度与深度也在不断扩展。通过调研近十年来群体行为识别的研究文献,确定了目前群体行为识别研究的问题定义;指出了群体行为识别研究现存的问题与挑战;在深度学习网络架构下,描述了从早期仅仅对群体行为进行分类识别,到如今更加侧重于对行为群体中活动细节理解的群体行为识别算法的发展历程;重点介绍了以卷积神经网络CNN/3DCNN、双流网络Two-Stream Network、循环神经网络RNN/LSTM和Transformer等网络架构为基础的,主流群体行为识别算法的核心网络架构和主要研究思路,对各算法在常用公共数据集上的识别效果进行了对比;对标注了群体行为类型和个体行为类别等多级标签的常用的群体行为数据集进行了梳理和对比。期望通过客观的对各种算法优缺点的讨论分析,引发读者提出群体行为识别研究的新思路或新问题。最后,对群体行为分析的未来发展进行了展望,期待能够启发新的研究方向。

关键词: 群体行为识别; 深度学习; 深度神经网络架构; 卷积神经网络(CNN); 长短时记忆神经网络(LSTM)

群体行为的识别与理解是计算机视觉领域的热点问题,它是一个多学科交叉融合的研究方向,涉及了模式识别、人工智能、机器学习、计算机视觉等众多学科的研究技术。该方向是国家自然科学基金委员会设立的重大研究计划

你可能感兴趣的:(数字化转型及信息化建设专栏,深度学习,人工智能,神经网络)