本期 AI Drive,我们邀请到西安交通大学网络空间安全学院硕士生林卉,为大家在线解读其发表在 CVPR 2022 的最新研究成果。本次报告的主题为「基于多面注意力机制的人群计数」。对本期主题感兴趣的小伙伴,5 月 24 日(本周二)晚 7 点,我们准时相约 PaperWeekly 直播间。
直播信息
本次讲座将主要汇报我们 CVPR 2022 的一篇文章。该文主要针对人群计数任务的两个难点:首先,密集人群图像中由于远近关系人头大小差异很大;其次,部分提供的标签由于标注误差等原因不在人头正中心位置,因此存在噪声。
为此,本文提出了三个模块:1)Transformer 中可学习的区域注意力机制,实现动态地为每个特征分配注意力;2)与其配套的局部注意力正则化,通过最小化不同特征位置的注意力偏差来监督变形器网络的训练,解决尺度差异问题;3)实例注意力损失,可在训练期间动态地关注最重要的实例,减弱标签噪声带来的负面影响。
论文信息
论文标题:
Boosting Crowd Counting via Multifaceted Attention
收录会议:
CVPR 2022
论文链接:
https://arxiv.org/pdf/2203.02636.pdf
代码链接:
https://github.com/LoraLinH/Boosting-Crowd-Counting-via-Multifaceted-Attention
演讲提纲
人群计数任务背景和目前存在问题
解决方案(三个模块)
具体实现
实验结果和可视化
结论和未来工作
嘉宾介绍
林卉 / 西安交通大学硕士生
林卉,西安交通大学网络空间安全学院一年级硕士生,师从洪晓鹏教授。研究方向为人群计数和半监督学习,目前已在包括 CVPR 22、IJCAI 21、 AAAI 21 等 CCF-A 类国际会议上发表论文 3 篇(一作 2 篇),并担任 ICME 22 等国际会议的审稿人。
直播地址
本次直播将在 AI Drive 直播间进行,扫描下方海报二维码即可免费观看。
B站直播间
https://live.bilibili.com/h5/21887724
合作伙伴
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
·