今天观看了微软亚研院举办的 创研论坛 CVPR2020 论文分享会,分享会邀请了计算机视觉领域多个子领域的大佬们分享已发表的CVPR2020论文。除了论文分享外,还邀请了几位深耕CV领域多年的学界大佬进行了圆桌讨论。
论文分享部分主要就 检测、多模态、机器学习、底层视觉、图像生成 几个方向,每个方向邀请了3-4位作者分享论文。这部分由于我也只是听了作者的介绍还没有认真阅读论文,暂时不讨论,后面精度过文章后再来分享。本文主要分享一下圆桌讨论时大佬们的看法和建议等等。
本次分享会是由 账号 微软中国视频中心 在B站直播的,有兴趣的朋友可以在录播放出后前往观看。
圆桌讨论邀请了几位大佬:
马毅,加州大学伯克利分校教授。(以下简称 Ma )
屠卓文,加州大学圣地亚哥分校教授。(以下简称 Tu )
杨明玄,加州大学默塞德分校。(以下简称 Yang )
华刚,Wormpex AI Research首席科学家。(以下简称 Hua )
罗杰波,罗彻斯特大学教授。(以下简称 Luo )
非常感谢各位老师能够参与讨论和分享。上文简介点击即可跳转到大佬们的主页。
以下就是圆桌讨论相应的问题与各位老师的分享,我在看直播时记录了关键信息,下文补充了一下使语言相对完整,根据笔记和自己回忆整理,可能与老师们实际表述不完全一致,如果有问题请大家包涵,录播发布后我也会贴出链接并且自行校对一下。
Luo:首先不要刷榜,不要凑热闹,做自己感兴趣的东西;其次论文写作的核心是让别人看得懂、看出创新点和妙处,不要觉得文章是给自己/导师等看的,要讲清楚问题。
Ma:第一是写作的技巧、能力、语言组织等要多加训练,可以采取比如follow一位或几位自己觉得厉害的人,看看他们的论文和书,训练行文结构、语言表达能力等;第二是不要取悦审稿人,不要为了通过审稿就刻意取悦审稿人,也不要对review意见看得太重;第三课题选择也是要从兴趣出发,可能研究者最初发表的文章就是对基础能力的锻炼,基础能力有了在从兴趣出发research;第四是自己就要做最严厉的审稿人,不断给自己的文章提出质疑,要先说服得了自己。
Tu:作者要“帮人帮己”,自己发表论文对其他人也有一定的启发,做出自己的贡献。
Yang:第一可以让老板做攻击者,找文章的弱点;第二多看好的文章,看看结构是怎么写的;第三不要跟业界拼算力,学界算力打不过业界(太真实了)
Hua:第一不要跟风,不要说“看看今年顶会做了啥值得跟一下”,要做自己感兴趣的;第二点提到了国内基础教育对科技论文训练很少,要先学习别人paper的样子,有哪些部分,分别怎么写,科技论文不是堆华丽的语言,是简单的语言讲清楚道理;第三也提到了老板和学生“生成对抗”的模式,先自己找问题。
2· 关于 arXiv
Hua:还是有积极的作用,但是上面的文章未经审核,鱼龙混杂,需要自己判断。比如先看title、abstract,觉得有意思再读下去;需要自己过滤出有用的信息。而且顶会原则上不必在投稿前site到arXiv上。
Ma:arXiv存在的问题是打破了顶会双盲的审稿模式,审稿人搜一下就看得到作者了,变得不公平了。而且带来了额外的审稿工作量,遇到相似的要去查查site的时间判断有没有借鉴等等
Tu:单盲是不公平的,arXiv一定程度上破坏了双盲,但是目前放在arXiv似乎成了共识
3· Deep Learning问题,可解释性、对CV发展的影响、领域结合、Robust AI等
Yang:目前可解释AI还是探索阶段,但是总会有人去做的
Tu:CV和NLP的区别很大,但是二者的结合和融合是趋势
Luo:Vision任务发展是从识别到描述,再到推理,这样发展的。目前也有一些领域在图像基础上加入了domain knowledge。计算机视觉的初心就是理解图像的语义,最终也必须进化到这一步。肯定会从调参提高识别准确度这类问题上升到更高的层面,未来一定有performance garantee,一定会到higher level。
Ma:现阶段深度学习确实存在当做黑盒用、依赖数据的问题。很多场景对精度要求高,所以也要求了鲁棒性。不是所有应用场景都需要,但一定有一些场景需要这样的鲁棒性来保证,决定了这个问题能不能用视觉系统解决。
4· 对顶会和CV未来发展的看法
Luo:首先线上线下会议的问题,疫情影响很多会议转到线上,比起线下缺少了反馈和及时的交流。
Hua:未来可能是线上线下的Hybrid conference。顶会投稿和发表过去十年接近指数级增长。CV未来要做的是 Go beyond humankind ability。计算机视觉发展到现在,期待Core的扩展带来规模的增长。
Yang:目前会议趋势是资深研究者主攻workshop,学生投conference
Tu:希望继续发展(hhh)
Ma:vision一开始是个小众方向,会议小,话题新,有挑战性;现在也逐渐变成了大会议,期待开辟出新的方向,回到小规模。人多带来了从众效应,研究者变成了“网红” (是有这个趋势)
小结一下,各位CV领域深耕了数十年的老师们都建议研究者不要从众、跟风、或者拼算力刷指标,找到自己感兴趣的东西研究;不断磨练写作功力,从看别人怎么写,到跟导师或者身边的人找文章问题,先说服自己,再去说服审稿人;提到了arXiv打破了双盲审稿的模式,带来了不公平,但有逐渐成为业内共识,暂时还不知道有什么好办法;对于DL也提到了落地需要鲁棒性、需要精度、需要performance garantee,相信CV会进化到真正的理解与推理的层面,会与其他方向(NLP等)结合、融合;也期待CV能找到新的突破点和方向。
作为普通研究者,能够学到一些论文写作和训练的技巧,听大佬们畅谈发展趋势,表示很开心。
感谢老师们的分享和微软的组织。
以上就是个人凭借直播时的笔记和记忆小结的圆桌讨论内容,希望对大家有帮助。