清华姚班出身,95后博士生从网瘾少年到发表顶会论文的科学家

文末送六本价值百元机械工业出版社出版书籍

95后的理论计算机科学家来了!他正是MIT博士生、清华特奖,姚班学霸的陈立杰。而这位一路闪光、名声响彻科研圈的清华大神,远不止获奖这么简单。

清华姚班出身,95后博士生从网瘾少年到发表顶会论文的科学家_第1张图片

陈立杰 图源:清华大学

从网瘾少年到自学编程,而后拒绝谷歌的实习邀请

小学的时候,陈立杰的整体成绩其实并不算突出,唯独一门数学还算是不错。学习不上心,反倒是对信息技术特别感兴趣,说得通俗点就是喜欢玩游戏,而且还是个魔兽世界的小迷弟,小学就能自己制作魔兽世界的地图了。

当他意识到天天沉迷游戏,不如学点电脑知识后,便开始自学编程,并自告奋勇地去参加了不少信息学竞赛,但在众多科班出身的参赛选手当中,陈立杰半路出家的自学水平根本不够看的,所以他在编程初期,一直没取到什么好名次。

后来,那段时间成为了陈立杰人生中的第一个迷茫期,编程道路屡屡受挫,学习成绩又上不去,当时的陈立杰和“优等生”这三个字没有半毛钱关系,甚至就连他的爸妈都开始劝他放弃了,不停地暗示他换条路走。然而谁能想到这名十几岁的初中生有着如此坚定的信念,陈立杰不仅没有轻言放弃,还愈战愈勇,用成绩证明了自己。

功夫不负有心人,陈立杰挥洒在机房里的汗水没有白费,从他 15 岁那年开始,陈立杰仿佛跟开了挂一样,一鸣惊人,势不可挡。

2010年8月,全国信息学竞赛在线赛全场第2名;2010年11月,全国信息学联赛浙江赛区一等奖;2011年5月,亚太地区信息学奥林匹克竞赛金牌;2011年5月,中国队选拔赛,非集训队第2名;2011年11月,全国信息学联赛浙江赛区第1名;2013年2月,全国信息学冬令营全场第1名;2013年7月,国际信息学奥林匹克竞赛第1名。

不仅如此,高一刚开学不久,陈立杰就收到了清华大学的录取通知书,但这位大神表示并不着急,想跟着同学们一起读完高中再去上大学。

到了高三,陈立杰又收到了谷歌的实习邀请,但他觉得现在加入工作为时过早,甚至还会影响到他的学习,所以陈立杰委婉地拒绝了。

学霸也曾陷入过迷茫,从第一篇论文开启科研之门

2013年,陈立杰进入清华大学交叉信息学院,开始了大学生涯。但在进入清华大学之后,跟很多大一新生一样,陈立杰也陷入了迷茫。

“我作为曾经的信息学竞赛世界冠军,顶着光环、压力进入清华。在我的老本行算法竞赛,尽管我取得了一些成绩,但是当我站在领奖台上,我经常会想,这是我想要的生活吗?我也偶尔会去工业界实习,但是我依然无法达到我自己真的兴趣。”

清华姚班出身,95后博士生从网瘾少年到发表顶会论文的科学家_第2张图片

清华大学特奖答辩现场

与此同时,陈立杰的室友范浩强在大一军训期间,晚上靠“加班”完成了自己的第一篇学术论文,并最终发表在国际计算机视觉大会ICCV 2013 上(范浩强是清华姚班2013级另一位大神,后来成为旷视工号前十员工,此处不详述)。

室友范浩强的表现也给陈立杰带来影响,他苦恼的时候经常到紫荆操场独自散步,思考“我是谁”、“我要做什么”这种现在看起来是段子,但当时却让陈立杰始终无法悟透的哲学问题。

一次偶然的机会,他去旁听了唐平中教授给高年级学生讲的《博弈论》,没想到这门课程的课程论文给陈立杰打开了学术初探的大门,他也开始逐渐从竞赛状态转向科研状态。博弈论又被称为对策论(Game Theory),既是现代数学的一个新分支,也是运筹学的一个重要学科。

后来,在唐平中教授指导下,陈立杰完成了第一篇学术论文,是基于图灵机视角的对囚徒困境的探索,这篇论文成为了他探索科研的第一步。

作者在论文中研究了限制条件对无穷次重复博弈纳什均衡集的影响,证明了限制智能体的计算资源会导致新的纳什均衡。论文题为《受限图灵机的有限理性》(Bounded rationality of restricted Turing machines),后被AAAI 2017接收。

“完成论文之后我非常激动,我感到我的科研兴趣被点燃了,我想要尝试更多的科研方向。”陈立杰的科研努力和成果从此一发不可收拾。后来的事实证明,陈立杰选择的科研这条路走对了。

到了大二,在完成了姚班课程的同时,陈立杰也选修了一门非常高深的研究生课程《高等理论计算机科学》。这门课为全英文授课,要求选课同学有良好的数学基础、以及基本的理论计算机基础。

课程主讲人李建老师布置了很多非常有挑战性的问题,陈立杰每周要投入20个小时来研究,期末考试更是持续了整整24个小时,完成了十页的答卷。

最终的成绩下来,陈立杰取得了所有学员中唯一的最高分——100分,(该课程满分为80分,其中20分是Bonus)。

陈立杰大学成绩单

他成为了首位在计算机科学基础年会上发文的中国本科生,诚然兴趣是最好的老师。“我想,对,我是陈立杰,我要成为一名理论计算机科学家!”

到了大三,陈立杰开始取得了一些“微小的成就”,他首次在理论计算机科学领域顶级的国际会议COLT 2016上发表文章,同时也提出了一个关于相关问题的猜想,并前往纽约会场做了两篇口头报告。

陈立杰在COLT 2016上发表的论文

大三下学期,陈立杰前往MIT交换学习,师从量子信息著名学者Scott Aaronson教授。在MIT期间,陈立杰做了件非常了不起的事。

零知识证明(zero knowledge proofs systems)在密码学理论和复杂度理论中都有着非常重要的地位。具体来讲,在一个零知识证明系统中,一个证明者要向一个验证者在证明一个命题的正确性的同时,不能让验证者获得除了这个命题的正确性以外的任何信息。 而其中要求最苛刻的被称为统计零知识证明系统(statistical zero knowledge proofs systems,简称SZK)。

这个问题是也是陈立杰的导师Scott Aaronson教授从2002年就开始在思考,同时Scott Aaronson教授也有三位博士生在思考这个问题,但思考了一年也没有解决。

陈立杰对这个问题非常感兴趣,苦苦思考了两个星期,却一直没有进展。直到有一天,他在波士顿的街头漫步,突然看到天空中飞过一只白鸽,它以不同的方向穿越了天空。他突然灵光一闪,想到,对,为什么不使用新的方法呢?于是他立马冲回住处,思考了一个礼拜,终于解决了这个问题,cott Aaronson教授还专门发文章表演陈立杰。

陈立杰与合作者在论文中给出了一个统计零知识证明系统和PP的喻示分割(Oracle Separation),这代表了PP中没有一个黑盒算法(black box algorithm) 可以解决统计零知识证明系统中的全部问题。换句话说,他们证明即使有比量子计算(对应BQP)更强计算能力的计算机(对应PP),依然没有一种黑盒算法可以解决统计零知识证明系统中的所有问题。

论文最后被计算机科学基础年会(FOCS 2017)接收,陈立杰也成为首位在计算机科学基础年会上发文的中国本科生。

所在姚班有33个同学,共发表23篇paper

到大四毕业前,陈立杰就已经在国际会议上发表了四篇学术论文,一篇文章还获得ISAAC会议最佳学生论文奖。

2017年,陈立杰被麻省理工学院录取,攻读计算机博士学位,师从Ryan Williams副教授。Ryan Williams也是一位大牛,今年只有40岁,但已经做了五年斯坦福教授。

这之后,陈立杰又发表学术会议论文近10篇,并在多个学术研讨会做过学术报告。

更难能可贵的是,陈立杰非常愿意跟同学们一起讨论。在他的带领下,姚班有好几个同学都立志做理论计算机科学。当然,科研不是单打独斗,陈立杰跟很多姚班同学都有合作。在2016年清华特等奖的现场答辩中,陈立杰展示了一张”姚班论文合作网络“。

他说,在姚班,已经有33个同学发表了23篇paper!

在答辩评委提问环节,评委问他:你说想解决计算机科学领域的核心问题 P=NP ?

陈立杰:对,是这样子的!(掌声)

评委:你有想法了吗?现在为了解决这个问题提了很多方案,你有想法了吗?

陈立杰:是这样子的,这个问题已经困扰了计算机学界,可以说是从计算机这个领域一开始以来就有的问题。我现在作为一个大四的学生,可能确实暂时还没什么想法,但我相信随着我的知识的拓展,在我有生之年我能够看到这个问题的解决。(掌声)

姚班的开山鼻祖姚期智先生一句话,“现在是计算机科学的黄金时代,也是全人类的黄金时代”。

陈立杰说:“能够生在这样一个黄金时代里,我感到无比的荣幸,我梦想能够成为黄金时代浪潮中的一朵浪花,为人类的智慧添砖加瓦!”

来源:本文由"德先生"整理自清华大学、新智元、量子位、募格课堂。本文目的在于促进信息交流,并不代表本公众号赞同其观点或对其内容真实性负责,版权归原作者所有,如有侵权请告知删除。

—  —

视学算法为回馈老读者和新读者,包邮赠送机械工业出版社赞助的书籍《Python开发技术大全》* 6,经常阅读 & 经常转发本公众号文章,并且在本文章下留言即有机会获的机械工业出版社出版的精品技术图书.

开奖时间:2020.9.16 20:00

开奖时间后,留言区前 6 名自主添加微信领奖:872561826

清华姚班出身,95后博士生从网瘾少年到发表顶会论文的科学家_第3张图片

【内容简介】

本书从Python 语言的基础语法讲起,逐步深入地介绍了Python各种库,并且介绍了这些库的实战案例,重点介绍了爬虫开发, GUI应用程序开发,容器管理, Redis数据库操作以及数据处理和神经网络方面的内容。让读者不但可以系统地学习Python编程的相关知识,而且还能对Python在各个领域的应用有更为深入的理解。 

本书分为21章,涵盖的主要内容有Python语言基础和Python在多个领域的应用。重点介绍了多线程编程;GUI应用程序开发;web编程;爬虫开发;容器管理;数据处理以及神经网络上的应用。 

本书内容通俗易懂,案例丰富,实用性强,特别适合Python语言的入门读者和进阶读者阅读,也适合自动化测试人员、自动运维人员阅读。

你可能感兴趣的:(人工智能,编程语言,ai,etag,makefile)