会议持续3天(8月22-24日),5个报告,12个APR报告,18场Workshop,200篇左右的顶会顶刊Poster。
每篇博文的内容太多消化不了,请移步以下链接分别浏览:
PS:没关注的同学点点关注[厚着脸皮球球了],主页更多内容,持续输出干货,有问题私信或者留言都可,笔者看到后会第一时间回复,助力大家科研。
第一天是没有Workshop的,所以大家几乎都是同时看的一场报告。
卢老师的报告主要围绕着视频领域单/多目标跟踪/分割讲解,具体的可以搜索下卢老师相关文章,下面是一些现场的PPT照片,
张磊老师的报告言简意赅,很容易理解,实属我最喜欢的老师之一了,分别从模型的特征优化,权重优化,优化器优化三个方面讲解的优化内容,没有复杂的公式讲解,就是一些基础原理很直白,理解起来没啥难度。
图森未来讲的时候没赶上,去趟卫生间了,报告不安排休息时间。后面听了华为的报告,不得不说,PPT做的牛XX。
这些PPT的照片是有关于我的方向(多模态)认为比较重要的东西,好比综述。
这一部分与我的研究方向契合,所以PPT得拍足了[龇牙]
这里过了一下,所以第一张的近期工作汇总没拍上,可以去找下老师的文章来读。
相信不用我多说,大家也能得到这些工作的启发了。
北京大学多媒体信息处理研究室,招生!!!
下午的报告没听多少,主要是太多公式看不懂啊,但确实都太强了 ┭┮﹏┭┮
161篇Poster,链接在这:VALSE2022-Poster
我重点关注的是VQA,发现一篇VQA数据集的工作,视频VQA,推广下
Env-QA: A Video Question Answering Benchmark for Comprehensive Understanding of Dynamic Environments
一篇很有意思的工作,双端模型中的不平衡问题,从数据集转向模型
Balanced Multimodal Learning via On-the-fly Gradient Modulation
当时来得早,很多讲者还没过来,所以只看Poster的话,在没有看过论文的前提下,实在看不出啥。
感受下现成的火热吧,这还是没到正点,人更多。
写在后面
这篇博文的内容有点多了,遂开了3篇博文分别总结这三天我听过的报告,请移步以下链接: