酸了!她在MSRA实习短短半年时间内便完成了两篇入选顶级学术会议 AAAI、ACL 的研究...

来自:微软学术合作

博士二年级,南开大学-微软亚洲研究院联合培养博士生、微软亚洲研究院自然语言组实习生王程一在短短半年时间内便完成了两篇入选顶级学术会议 AAAI、ACL 的研究。看似“发文必中”的经历背后,也有过屡屡失败带来的自我怀疑。

她用“冒充者综合征”形容曾经的自己——对自己获得的成功心存怀疑,认为自己不是靠能力取得成功,而更像是一个冒名顶替者。

好在王程一懂得自我调解,MSRA 也给了她足够的帮助来击碎对自己的怀疑。两位 mentor 刘树杰和吴俣巧妙地帮她建立了正反馈机制:努力,收获,更努力,更大的收获。

人们总喜欢将论文数量作为衡量博士工作的首要标准。MSRA 的旅途不仅让王程一走出“冒充者综合征”,还让她在刻板印象之外,找到了属于自己的对于“合格博士生”的再定义——对科研的敏感度、对知识的融会贯通、良好的写作能力和展示能力、阅读文献和记录实验细节的习惯,这些都非常重要;而最为关键的是,要有独立做科研的能力。

科研之外,她是 MSRA“风云社团”桌游社的社长。从潇帝手中接下社长的担子,桌游社让她在游戏与科研两种截然不同的话语中找到了交集。在这里,她结识了一群志同道合的伙伴,还收获了一份帮助她转变科研观念的爱情。

酸了!她在MSRA实习短短半年时间内便完成了两篇入选顶级学术会议 AAAI、ACL 的研究..._第1张图片

在 MSRA 找到了科研的价值感

“读博之后我能做些什么?我做的事情在现实生活中对其他人能有什么帮助?”

这是 2017 年的盛夏,就读于南开大学计算机系大三的王程一问自己的两个问题。对于科研的现实意义,她开始感到迷茫。带着这些疑问,王程一参加了微软亚洲研究院副院长周明博士在南开大学举办的联合培养博士项目宣讲会。

正是那年,机器学习刚刚成为信息科学领域的热门研究方向。“周明老师介绍了他们在做的项目,机器人怎么和人类聊天,甚至对对联、写诗。”科研成果在现实产品中的集成,让王程一看到了一种具象化的价值感,“当时就觉得挺神奇的,你好像看到了一个非常大的自己。如果在科研上小小的进步,能够马上转化到产品里面,那是非常有成就感的一件事情。”

周明博士的宣讲消除了王程一对于未来选择的迷茫,也种下了她与 MSRA 的缘分。她成功入选南开大学-微软亚洲研究院联合培养博士生,并在大四阶段来到 MSRA 实习。

2019 年夏天,结束博士一年级基础课的学习,王程一回到 MSRA 继续实习,主要进行语音翻译相关的研究。短短半年的时间内,她所做的两项工作,接连入选顶级会议 AAAI 2020 和 ACL 2020

王程一对科研价值的追寻,也体现在她所做的研究课题中。如果说机器翻译是让计算机完成翻译领域笔译的工作,那语音翻译则让计算机实现最接近“同声传译”的现实应用。

以往的技术通常将语音识别和机器翻译割裂为两个阶段,容易发生因模型缺乏纠错能力导致的错误传递。王程一和合作研究员提出串联编码网络,在端到端的语音翻译中使参与语音翻译任务的每个子网络都能够被预训练,且预训练中学到的参数都将在微调过程中使用,从而显著提升语音翻译模型性能。(详细了解这项研究,请点击:AAAI 2020 | 沟壑易填:端到端语音翻译中预训练和微调的衔接方法)

这项工作于 2019 年 9 月初完成,投稿后,她又紧张地投入到下一项研究中,提出了一种课程预训练的方法,进一步解决模型结合过程中存在的不匹配问题。

与此同时,王程一与组里的同事还在与美国微软总部 Speech and Language Group 进行科研合作。这也是微软亚洲研究院得天独厚的优势,在这里,实习生有机会与全球范围内的顶尖团队合作。目前,王程一已通过这项合作产出了两篇一作的论文并投稿至 Interspeech 2020。

酸了!她在MSRA实习短短半年时间内便完成了两篇入选顶级学术会议 AAAI、ACL 的研究..._第2张图片

王程一(前排左一)与 MSRA 实习生合影

领路人和“实习生鼓励师”

“冒充者综合征”,王程一用这个新学的词,形容 2017 年刚刚进入联合培养博士生项目的自己。大四初来 MSRA 实习的王程一经历了一段坎坷的研究经历,论文屡屡被拒,一年中接连两次投稿都以失败告终。

冒充者综合症(Impostor syndrome),又称自我能力否定倾向。在其中挣扎的人,常常对自己获得的成功心存怀疑,认为自己不是靠能力取得成功,而更像是一个冒名顶替者。

好在不仅王程一自己是一个很会自我调节的人,她还在 MSRA 遇到了带她走出迷雾的 mentor。微软亚洲研究院高级研究员刘树杰和微软亚洲研究院研究员吴俣帮她建立了一套“努力-收获-更努力-更大的收获的”正反馈机制。在他们的帮助下,王程一脚踏实地地突破着每一个瓶颈。

2019 年 10 月,在课程预训练模型的研究中,她曾经历了五个星期的反复实验,始终未能得到好的结果。“那段时间,我跟吴俣每天都会 sync,和他说最新的实验结果,及时地调整研究方向。当我们遇到两个人解决不了的困难,就会把树杰直接从工位上叫过来,三个人一起讨论。”

刘树杰是那个在王程一“走弯路”时为她引导方向的人,有着丰富的科研经验的刘树杰,总能结合程一的优势,一阵见血地给出兼具建设性和实操性的建议。这些建议帮助王程一从泥淖中走出,将“努力”变为“收获”。“做一份工作,肯定是要先知道你要解决什么问题,然后提出解决方法。但是在找到最优解之前,你可能会走很多弯路。”王程一说。

刘树杰发现,王程一有着出众的学习能力和敏捷的思维。在课程预训练模型实验进入瓶颈时,他指导王程一对近 5 年的相关论文做了详尽的调研和总结,从而切中肯綮地提出预训练对语音翻译的重要性。他们据此确定了解决方案,实验有了很大进展。

作为联培博士项目的大前辈,刘树杰也用自己的经历鼓励王程一。“程一从开始读博就有很多创新的想法,也做了很多努力,但最开始的几篇论文都没有被接收。” 刘树杰说,“这和我当年的经历很像,我一直到博士二年级结束还没有发表一篇论文,心里很着急,甚至有些轻微抑郁。现在想来,这个时候往往就是黎明前最后的黑暗。只要坚持下去,再努力一把,曙光就会出现。”

平日里,王程一和刘树杰都会直接用名字称呼对方。在导师和学生之外,刘树杰和实习生们在更多时刻保持了一种平等的合作关系。每当王程一所在的研究组发表了论文,刘树杰都会请全组的实习生吃饭。

酸了!她在MSRA实习短短半年时间内便完成了两篇入选顶级学术会议 AAAI、ACL 的研究..._第3张图片

王程一(右四)与 mentor 刘树杰(右二)及组内同事合影

作为一名毕业不久的年轻研究员,吴俣则为王程一提供了很多富有同理心的指导,有时甚至像一个“好消息贩卖机”。“平时聊天的时候,他总是时不时地给我一些正面的反馈,还会指出很多你独有的优点。”

吴俣也表示,自己更多地起到一个“实习生鼓励师”的作用:“我认为研究员不应该提供太细致的实验上的指导,这就和小孩子学骑车一样,家长不能老扶着,要让孩子自己摔一摔,疼一疼。在第一篇论文身体力行地指导之后,慢慢放手,可以让她更好地成长。”

在王程一的“风雨无阻”的坚持中,吴俣也发现了她的许多优秀品质,其中最为闪光的,就是“自我驱动”。在实验进展不顺利时,“每一天她都会呈现给你一个向前推进的新进度,虽然很多时候是失败的进展,但从不会和昨天一样。”吴俣说:“即使我不告诉她应该做什么,她也能竭尽自己全力,把自己能想到的,能做到的,付诸实践。这也是我觉得研究院实习生最需要的品质。”

除了 MSRA 的两位研究员,王程一和南开大学的导师杨征路教授也保持着紧密的联系。杨教授是那个程一在进行科研探索时,为她保驾护航、让她更有底气的人。“杨老师会经常与我分享领域内的前沿动态,他也鼓励我多关注计算机其他方向的研究进展。”王程一说,”每次投稿之前,他都会认真地帮我refine,从结构、语言等各个方面给出他的意见。” 杨教授的指导,让程一在论文写作上不断成熟,也让她的科研视野不断被拓宽。

桌游社与科研的趣味交点

2017 年,在“饭友”李潇(时任桌游社社长)的介绍下,王程一第一次参加了 MSRA 桌游社的活动。当时还是桌游小白的她,首次狼人局就通过“自刀狼”给伙伴们留下了深刻的印象。“虽然当时还不是很会玩,但是我在拿了狼牌后很大胆地自刀,被女巫发了银水,最后带领狼队获胜。”

酸了!她在MSRA实习短短半年时间内便完成了两篇入选顶级学术会议 AAAI、ACL 的研究..._第4张图片

王程一(左七)和“饭团”小伙伴合影

(“饭团”是当时 MSRA 实习生一起“约饭”的组织)

活泼开朗的王程一很快和桌游社的同学们打成一片。除了每周一次的狼人杀,他们还会组织剧本杀、密室逃脱,甚至更大型的“北京地铁逃脱”。“在组里的同事之外,我在 MSRA 认识的其他人几乎都来自桌游社。”王程一这样描述桌游社对她的价值。

2019 年夏天,李潇从 MSRA 毕业,他放心地将桌游社社长的担子交到王程一手中。

酸了!她在MSRA实习短短半年时间内便完成了两篇入选顶级学术会议 AAAI、ACL 的研究..._第5张图片

王程一和桌游社的伙伴一起“密室逃脱”

游戏与科研,两种看似截然不同的话语,在桌游社成员的互动中产生了充满趣味的交点。王程一还记得,桌游社的伙伴吴双志,也是她同组的师兄,曾经用狼人杀举例,教给她一个写论文的技巧:狼人杀是用严密的逻辑说服在座的人,写论文也同理,除了扎实的研究结果,也要特别注意写作的逻辑和行文。

桌游社不仅让王程一认识了一群志同道合的伙伴,她与男友也在这里结下了缘分。

王程一的男友古纾旸也是联培项目的博士生,对待科研,他总有一种独树一帜的乐观。在一次实验中,王程一用自己创新的方法,取得了成功的结果。可是,尝试了其他人的方法后,发现同样能取得好的实验结果。“自己付出很多时间、精力提出的方法,似乎并没有那么大价值,我会感到有点沮丧。”但男友的看法不同,“他觉得,当我有一个冥思苦想才解决的问题,看到别人也有很好的方法,我应该感到高兴,因为自己又学到了新的知识。”

在男友近乎偏执的乐观的影响下,王程一也慢慢击碎了那面自我怀疑的墙。

酸了!她在MSRA实习短短半年时间内便完成了两篇入选顶级学术会议 AAAI、ACL 的研究..._第6张图片

王程一(右六)与桌游社小伙伴合影

论文数量不是单一指标:合格博士生的再理解

在 MSRA 的科研氛围下,王程一逐渐有了一种对“合格博士生标准“的崭新理解。

刻板印象里,人们总会用论文数量作为评价博士阶段工作的最重要指标。在研究院接触到越来越多的研究员、实习生,王程一逐渐领悟到:“比论文数量更重要的,是培养自己作为一个合格博士生的能力,或者说,一个合格科研人的能力。”

这种再定义包含很多维度:对科研的敏感度,对知识的融会贯通,良好的写作能力和展示能力,阅读文献和记录实验细节的习惯……其中,王程一认为最重要的一点,是“独立”:“我希望自己可以独立地做研究,独立地找到问题并解决它。现在很大程度上,我还需要 mentor 的帮助。”

王程一是一个很谦虚的女孩,她擅长从每一个人身上发现优点。她将自己在 MSRA 遇到的很多人都视为榜样,无论是自己的 mentor,桌游社认识的志同道合的伙伴,还是是一些相交未深但读过他们故事的实习生。被优秀的人包围,很多人难免会感受到巨大的同伴压力,王程一却不同,她看到的是可以学习的闪光点,内化成不断向前的驱动力。

她的 mentor 吴俣发现,经过这两年各种好消息和坏消息,王程一成熟了,快乐和悲伤的阈值明显增高,成长得更“淡定”了。“虽然某种意义上来说,淡定的人再也不会像小孩子那样没心没肺的开心,但是淡定的人也能更好地处理人生的各种风浪。”

回忆在研究院走过的这两年,王程一说,自己最大的变化,是“变得更自信了”。在这里,她带着对科研价值感的执着追寻和强大的自我驱动,一点一点接近理想中的自己,慢慢成长为一个独立的科研人。而关于她的故事,也才刚刚开始。

酸了!她在MSRA实习短短半年时间内便完成了两篇入选顶级学术会议 AAAI、ACL 的研究..._第7张图片

王程一与实习生小伙伴一起去玩蹦床

Mentor 寄语

酸了!她在MSRA实习短短半年时间内便完成了两篇入选顶级学术会议 AAAI、ACL 的研究..._第8张图片

刘树杰

微软亚洲研究院

高级研究员

程一是一名非常优秀的实习生,她工作严谨,思维敏捷,性格开朗,擅长沟通与合作,具有突出的分析问题和解决问题的能力。同时,她也有很强的学习能力,面对全新的课题,程一能快速地把握问题的关键点,在半年的时间成功发表了两篇第一作者 A 类会议文章,我为她所取得的进步和成果感到开心。希望程一未来能够不断突破自己,再接再厉,在博士道路上继续求索,能够以优异的成绩毕业,成为一名优秀的科研工作者,继续为自然语言处理的发展做出突出的贡献。

酸了!她在MSRA实习短短半年时间内便完成了两篇入选顶级学术会议 AAAI、ACL 的研究..._第9张图片

吴俣

微软亚洲研究院

研究员

首先恭喜王程一同学最近好事连连,硕果累累,摆脱水逆。我相信这种“欲扬先抑”的博士生活,会让人飞速成长。正如松下幸之助所说:“人的一生,或多或少,总是难免有浮沉,不会永远如旭日东升,也不会永远痛苦潦倒,一浮一沉对于一个人来说,正是磨炼。”你在经历这些挫折之后,才发现博士的旅途并不是常人眼里的那样顺利和风光,也只有经历这些,你潜在的能力才会在困难中被激发出来。

我相信以后王程一同学在未来会做出更多有影响力的研究工作,见识更大的世界,因为她很聪明,很勤奋,而更重要的是完成了成功的必修课——失败。最后,我也很感谢王程一同学,我从王程一的代码里学习到了很多东西,也让我很有收获!

说个正事哈

由于微信平台算法改版,公号内容将不再以时间排序展示,如果大家想第一时间看到我们的推送,强烈建议星标我们和给我们多点点【在看】。星标具体步骤为:

(1)点击页面最上方深度学习自然语言处理”,进入公众号主页。

(2)点击右上角的小点点,在弹出页面点击“设为星标”,就可以啦。

感谢支持,比心

投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等

记得备注呦

推荐两个专辑给大家:

专辑 | 李宏毅人类语言处理2020笔记

专辑 | NLP论文解读

整理不易,还望给个在看!

你可能感兴趣的:(人工智能,微软,xhtml,编程语言,twitter)