点击上方,选择星标或置顶,每天给你送干货!
阅读大概需要12分钟
跟随小博主,每天进步一丢丢
来自:微软研究院AI头条
zenRRan:
虽然该博士是CV的,但是他的PhD经验,值得我们借鉴下!
Push 你的 Mentor,而不是等他来 push 你。
“太紧张刺激了。”无论过多少年,陈冬冬都能把第一次在顶会发表论文的心情记得分毫不差。
“2016年8月底,我开始做图像风格迁移的研究,那时离 CVPR 2017 截稿日期只剩两个多月。两周里,我火速做出了一个初步结果发给 mentor 华刚老师看,以验证方法的有效性。”结束一天的实验,高速运转的大脑依然无法停止,陈冬冬总是躺到床上还在继续“咀嚼”问题,深夜偶尔能带来突如其来的灵感。几个月后,这篇工作也成为了陈冬冬以一作身份在国际顶级计算机视觉会议上发表的第一篇论文。在完成顶会“首秀”后,他又陆续在 ICCV、ECCV、SIGGRAPH 等顶级会议中收获了数篇论文。
陈冬冬(右二)与组里小伙伴和 mentor 袁路(左四)在 ICCV 2017 期间参观梵蒂冈
时间再往回拨三年,陈冬冬对读博生活的想象还是一个模糊的轮廓。正在中国科学技术大学读大三的陈冬冬走进教室,参加了中国科大和微软亚洲研究院联合培养博士项目的选拔。
“我说我对计算机视觉很感兴趣,面试官李世鹏老师就主动把我推荐给了当时视觉计算组的首席研究员马毅老师,并最终幸运地通过了面试。”
在第一年完成博士期间所有的校内课程以后,陈冬冬只身来到北京,进入微软亚洲研究院视觉计算组,成为了“练习时长四年的博士生”,也开启了他“百发百中”的奇妙科研之旅。
“百发百中”的联培博士
在 CVPR 2017 发表的第一篇论文“StyleBank”,为陈冬冬的博士论文——风格迁移(style transfer)的主线故事按下了起始键。风格迁移技术能够一键为普通图片生成强烈的艺术效果。针对此前风格迁移算法存在的问题,“StyleBank”为图像风格提供了一种更加显式的表达。
图片风格迁移
在做完图片的风格迁移之后,陈冬冬很自然地想到了做视频和 3D 的风格迁移,即从数据的不同维度去设计不同的风格迁移算法。视频风格迁移的挑战是保证视频每一帧风格迁移结果的时序连续性,使得画面稳定不抖动。
视频风格迁移
“其实这个工作前期一直没有做出很好的结果,也是在 deadline 激发的斗志中才开足马力克服了技术难关,发表在了 ICCV 2017。在完成图片和视频的风格迁移算法以后,我和几位 mentor 讨论决定继续完成 3D 的风格迁移,最终这篇论文也非常幸运地发表在了 CVPR 2018 上。”
陈冬冬(左)与 mentor 廖菁(中)、袁路(右)在 CVPR 2018
一次论文分享会上,陈冬冬的 mentor 袁路突然想到,给黑白图像加上有意义的颜色,也可以看作一种特殊的艺术风格化,能不能由用户给定一张参照图,让算法自动以相似的色彩和风格上色?这时,距离次年1月的 SIGGRAPH 截稿日期又堪堪只剩下两个月,从零产出一篇 SIGGRAPH 水准的工作,几乎是不可能完成的任务。“SIGGRAPH 对实验结果是出了名的要求完美,要命的是,我们的方法在截稿前一周还完全行不通。而且SIGGRAPH论文一般是双栏14页,字还特别小!”陈冬冬把右手攥成“我离当场去世只差这么点儿”的表情包。
陈冬冬和另一位同学一起,争分夺秒连续钻研了一周,累了就在微软亚洲研究院13层办公室角落的沙发区轮班睡一会。同时,在完全没有实验结果支撑的情况下,mentor 廖菁先开始给论文初稿搭建框架。“最后两三天,我们真的把结果跑了出来,并且一直赶论文到截稿当天。那一天,全球的论文作者都在提交paper,服务器都被挤爆了,大家都很紧张,提交完论文我就瞬间瘫在了椅子上。”努力终有回音,这篇论文最终以3.9的高分入选了 SIGGRAPH 2018。
经历过 SIGGRAPH 的考验,陈冬冬又在 ECCV 2018 上发表了使用解耦学习模拟泛化的参数化图像处理算子的工作,以5篇论文全中的战绩结束了博士阶段的历练。5篇循序渐进的论文也自然形成了陈冬冬博士论文的主线——在经典的风格迁移之外,既从图片、视频、3D 等不同的数据维度,也从老照片到高清图片的时间维度,对广义的风格迁移问题设计了针对性的算法,探索了 AI 艺术创作的无限可能。
临近毕业时,陈冬冬还在微软雷德蒙研究院度过了一段难忘的实习时光。实习结束后,陈冬冬回到了中国科大校园进行论文答辩,也迎接了一个小小的新生命的降临。
陈冬冬(第一排左四)抱娃毕业
我有特别的“Mentor 管理技巧”
微软亚洲研究院联合培养博士项目实行“双导师”制度,每位学生一年级期间在校学习课程,接受高校导师的指导,在博士二年级到五年级期间来到微软亚洲研究院,以微软亚洲研究院的 mentor 为主导师,在双方导师的共同指导下进行科研训练。
在联培博士里,陈冬冬无疑是最特殊的一个。从大四第一次来实习,到博士毕业,陈冬冬一共接受了5位 mentor 的指导。“大四时期的 mentor 是马毅老师,马毅老师总是观点独特,又特别能坚持自己的想法。博二的时候,孙剑老师短暂地担任过我的 mentor,孙老大是严师型的,大家进他办公室的时候最怕听到孙老大说‘你把门关起来’。华刚老师就特别‘Social’,我喜欢和他开玩笑,完全感觉不到代沟,华老师在科研上给我的引领特别多。袁路老师特别认真,会翻天覆地地帮我大改论文。廖菁老师是我见过思维跨度最大的人,分析问题的时候特别能够抓住问题的本质。”
微软亚洲研究院视觉计算组,陈冬冬(左二)与 mentor 华刚(前右)
性格鲜明的5位 mentor 风格迥异,但陈冬冬对每一位 mentor 都很感激,“没有马毅老师我就不会进入微软亚洲研究院。孙剑老师虽然严厉,但也是那段时间里,我打下了扎实的深度学习基础。华刚老师可以说是我的伯乐了,在与华刚、袁路、廖菁老师合作以后,我的科研成长加速,第一次在 CVPR 发表论文也让我重塑了信心,科研路也逐渐越来越顺利。每一位老师都特别细节导向,从思考问题的方式,学术研究的思路,到学术写作的小细节,我都学到了很多。是他们让我真正在科研上做出了一些成绩。”
除了吸收不同的思维模式,陈冬冬也在与 mentor 们的日常沟通中掌握了特别的技巧——Manage your manager。“你要 push 你的 mentor,而不是等他来 push 你。我会非常主动,有问题就问,有进展就抓 mentor 来看,他们会在我思路走偏的时候,一次次把我从坑里拽出来,让我顺着正确的方向往下走。”
博士与导师的沟通,是一个双向反馈的过程。在领悟到这一点之前,陈冬冬也曾在博士低年级时经历过一段原地打转的迷茫期,看着身边的人陆续发表论文,自己却四处碰壁,他开始着急,却不敢告诉 mentor 自己遇到的问题。
这段经历让他深感沟通的重要性。“不要害羞,遇到困难马上寻求 mentor 的帮助。微软亚洲研究院的研究员实力都很强,只要你抓住机会,总能做出成果。而另一方面,面对开放问题,大家各执一词必然会争论,但要记住对事不对人。”和 mentor 袁路讨论问题时,两人经常前一秒还对着屏幕剑拔弩张,“吵”得工区人人侧目,下一秒就收拾东西一起下楼吃饭了。
在科研学习之外,陈冬冬还在微软亚洲研究院结交了许多特别优秀的小伙伴。除了每天和实习生“饭团”一起吃饭,各式各样的社团活动也让陈冬冬和许多其他组的同学打成一片。周三晚上狼人杀,周五下班约德扑,羽毛球、篮球、攀岩社提供一整周的花式运动,北京炎热的夏天则是游泳社的主场。新人一波一波地来,被称为“Principal Intern(首席实习生)”的联培博士们能够认识许多来自世界各地的朋友。“如果没来微软亚洲研究院,我们可能就是和实验室的同学天天见,但在这里你会遇到各种各样的实习生,让科研生活特别开心。”
陈冬冬(右二)与小伙伴在微软雷德蒙研究院
聚是一团火,散是满天星。在毕业之后,陈冬冬更感到了一种奇妙的引力,“在这里遇到的朋友会遍布世界各地。即使很长时间没见,重逢时刻总会感到亲近和熟悉,这种感觉特别好。”
沿着一条主线收敛
两年连续在计算机视觉和图形学顶会发表5篇论文,陈冬冬认为自己博士期间“高产”的秘诀其实很简单。
从 CVPR、ICCV、ECCV 到 SIGGRAPH,陈冬冬没有错过任何一个重要学术会议的 deadline。“无论时间多紧张,无论做到什么程度,我一定会先完成一个完整的版本。在这短短的时间内,我会推着自己往前走。这时你会发现很多平时发现不了的问题,一次次快速迭代,快速成长。所以,不要错过任何一个 deadline,因为错过第一个就会错过下一个,错过一个就会一直错过。另外,无论是研究还是生活,人总是会碰到各式各样的问题,如何抓住重点沿着一条主线收敛非常重要,在 deadline 面前要学会选择性地忽略一些细枝末节的问题。”
陈冬冬也曾经给了自己一段时间,去做“不收敛”的人生探索。本科临近毕业时,他一度准备去创业。当时智能可穿戴硬件正在风口浪尖,陈冬冬摸索了各种各样的创业项目,却一个也没有成功。“年轻的时候特别容易上头,当时知识面不够广,也很难看到事情的全貌。”举棋不定之时,陈冬冬的学校导师俞能海教授强烈建议他继续参加中国科大和微软亚洲研究院的联合培养项目,也成就了他后来的科研之路。“除了微软亚洲研究院的导师,我真心特别感激我的学校导师俞能海教授。他在我人生的岔路口上给我指路,也给我很多帮助。有一次在夜班高铁上,俞老师还在帮我看博士论文,半夜12点还发了大段的语音帮我指出问题,令我非常感动。读博几年能够一路遇到很多贵人,我真心觉得自己特别幸运。”
陈冬冬与学校导师俞能海教授(左一)的毕业合影
从微软亚洲研究院毕业后,陈冬冬加入了微软认知服务团队担任高级研究员,继续从事计算机视觉的研究和应用工作。从学生到职场,超强的适应能力让陈冬冬得以迅速进入角色。与读博期间深入一个问题不同,角色的转换为陈冬冬带来了新的挑战,“现在的工作中研究和产品各占50%,既有自由做研究的空间,又要将最新的研究成果与产品结合起来。我现在也和同事一起带学生,这也需要不断扩充知识,对计算机视觉的每个方向都要了解,我的研究方向也因此更加广泛。”即使离开微软亚洲研究院加入了微软产品组,陈冬冬也继续与研究院保持着密切的合作,他在不久之前还与微软亚洲研究院的研究员们合作了一篇 CVPR 2020 的论文。
回想起本科毕业时对未来毫无头绪的自己,陈冬冬觉得自己的选择非常明智。“大四的时候,我还考了 GRE 准备出国,但最终选择了微软亚洲研究院。以前只是听说研究院厉害,进来以后发现离科研大佬太近了,我可以直接走到最优秀的研究员面前问问题,他们都会倾囊相授。这里不仅科研牛人很多,身边的小伙伴也都特别强。能在这样的环境中耳濡目染,学习大家思考问题的方式,让我第一次意识到环境对我成长的帮助。”
“微软亚洲研究院真的很特别,你很难在业界找到这样纯粹的做研究的地方,”微软大厦的五年时光承载着满满当当的回忆,作为 Principal Intern 之一的陈冬冬也热衷于给学校的师弟师妹们“卖安利”,“这里学术氛围好,文化也很包容和自由。但是与其听大家说,不如自己来感受,来成长,这里的体验会让你觉得很棒。”
方便交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。
方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。
记得备注呦
推荐阅读:
【ACL 2019】腾讯AI Lab解读三大前沿方向及20篇入选论文
【一分钟论文】IJCAI2019 | Self-attentive Biaffine Dependency Parsing
【一分钟论文】 NAACL2019-使用感知句法词表示的句法增强神经机器翻译
【一分钟论文】Semi-supervised Sequence Learning半监督序列学习
【一分钟论文】Deep Biaffine Attention for Neural Dependency Parsing
详解Transition-based Dependency parser基于转移的依存句法解析器
经验 | 初入NLP领域的一些小建议
学术 | 如何写一篇合格的NLP论文
干货 | 那些高产的学者都是怎样工作的?
一个简单有效的联合模型
近年来NLP在法律领域的相关研究工作
让更多的人知道你“在看”