做学术的典范:CMU浙大学长杨骏和他的研究体验
以前上数学建模课老听杨老师提起他这个到CMU读博的意门生,来这边就搜了下,
原来他都 到Facebook做研究去了。顺便附上他的研究体验。这些年我们系没有进
四大名校的博士,只不过是要喜欢学术的就要付出更多,这个学长也是读了 硕才
申到的。顺便说下到美国和加拿大,无论是交流还是攻读学位,学术和视野的收
获都绝对很大。新学期开始了,大家加油!
他的主 页 http://www.cs.cmu.edu/~juny/
他的Linkedin: http://www.linkedin.com/pub/jun-yang/4/695/b67 ----------------------------------------------
我的研究体验
作者:杨 骏(竺可桢学院96混合班)
写在前面
我不奢求我的一点研究体验能够引起广泛的共鸣,但只要有一个人读 了之后能有
所启发,并对他今后的学习工作产生积极的影响,我就将心满意足。同时,为了
让大家觉得我的感受有所参考价值,我先简要说一下我 的一些研究成果,因为“不
能让人致富的哲学是没有人听的” :-)
我在浙大计算机系读硕期间,在多媒体信息检索领域内发表了 近二十篇国际期刊
/会议论文,一项美国专利(申请中),曾在西门子、微软研究院短期实习,在香港
城市大学担任研究助理近一年。毕业后得到 了IBM Research Lab (Beijing),Carnegie
Mellon Univ (CMU)的计算机系等一些学校的 offer,如一切顺利将选择在CMU读
Ph.D。
选择方向
很多人都希望找到一个“容易”的方向。我的个人感觉是 的确有一些“容易写paper
”的方向,但没有特别“容易”的方向。每个方向上都有一些做得很出色的人物,从
这个意义上说也许所有的方向 都一样好。当然,每个方向有自身的特点,有的理
论化一些,对数学要求高一些(比如人工智能、计算机图形学);有的则接近应
用一些(比如我 做的多媒体),所以需要找到的是适合自己的方向,而不是盲目
听从别人那些“xxx太容易出成果了","xxx已经做到头了"。研究领域柳暗花明的
例 子很多,比如人工智能技术运用于数据库后改头换面成了数据挖掘(data mining
),又养活了一大帮人 :-)
很 多人都希望有人告诉他们一个方向。事实上,也许导师会给你指定一个大的
领域,小的方向大多是要自己去寻找的,办法就是reading!!! 我在 硕士期间读
过超过150篇专业论文。我的感受是当你开始读别人论文的时候,很自然地就会发
现许多问题和不足,有时作者自己也会谈及将来的 工作,这就成为你的研究的契
机。
还有如何寻找paper的问题。如果你开始进入一个陌生的领域,你可以咨询那
些 在该领域中有经验的人(比如师哥师姐),哪些paper是值得读的。CS专业的人
可以参考ResearchIndex网站(http://citeseer.nj.nec.com /), 那里对CS的paper
按方向进行了分类,大类下面还有小类,因此你可以选择你那个类的paper来读。
另一个诀窍是在开 始的时候选择综述性(overview)文章和引用次数很高文章(在
CS领域,引用几十次的文章就是经典了)。当你读过一些paper之后,通过 它们的
参考文献(reference)就可以辐射式地找到更多的paper。对于一篇已知作者和标
题的文章,大多数情况下通过 Google 就可以找到电子版,
如果没有则可以写email问作者要。
关于天赋和勤奋
关于程 序员有这样一种说法:一个有天赋的人通过不断努力会成为一个伟大的
程序员,一个天赋平平人通过不断努力也会成为优秀的程序员。根据我有限的观察
, 大多数成功的人都属于后一种类型。事实上,我几乎没有看到过天赋很高而又
很勤奋的人,相反却看到过不少天赋被浪费的例子,这也是我自信的源泉。因 为
我知道只要我日复一日地努力,总有一天会达到目标的。
我在香港城市大学做研究助理的时候,为了赶 paper deadline有过不间断工作
40-50个小时的经历。每次投会议的论文,我都会看看举办地,因为deadline基本
上 是以举办地的时区为准,一般比中国的时区都要晚一些,所以多出几个小时可
以修改(有一次是Hawii的会议,比中国晚18个小时,我开心死了)。 我经常在deadline
之前5分钟内在网上提交我的论文,为的就是尽可能地改得好一些。我在香港的导
师经常 说"Good papers are always submitted in the last 5 minutes"。他晚
上回家的时候车经 常是停车场上的最后几辆。
我3年前在微软研究院的时候,也常常在晚上11点之后在电梯里碰到老板。
看看我一个在 MIT读MBA的朋友写的一天流水账,对我有很深的触动,抄在下面
:
Last night I read case till 1am and I got up at 7:30 am this morning and
went to class from 8:30 to 10:00, then rush to library to finish a homework
due at 12:00 pm, then I had a teammeeting from11:30am to 1:00pm, then
I had class from 1:00 pm to 4:00 pm, then I have another teammeeting,
which we need to drive 40 minutes from Boston, so that last from 4:00
to 7:30, then I have a market research interview, from 7:45 to 10:00
pm,then I came back home....
then there's a fire alarm, which we need to go out of the building and
stand in the -10°C wind and I came back at 11:00 pm, starting reading
a case for tomorrow, which is 20 pages long, and I still have a homework
I need to look at ....the case will be discussed 10:00 am tomorrow.
...and the homework is due 1:00 pm tomorrow. I had my dinner when I read
the case. It's 00:49 am now...I will take a shower and start looking
at my homework.............
paper!!
首 先,绝对不要一稿多投,这个很显然的问题被人在BBS上问了太多次。也许你
做过很多次都没有问题,但一旦出问题可能是致命的。我们要像爱护自己的 眼睛
一样爱护自己的信誉。
其次,态度要认真。这几年来我自己审过超过50篇英文论文,其中大约十多篇
来自国 内。在这十几篇中,我记得除了一篇之外我都拒了,原因不是因为他们的
研究内容不够好(我甚至没能读懂他做了什么),而是语言实在是太差了。更让
人 痛心的是,不是主要因为作者的英语能力不够好,而是态度太不认真了,在title
中竟然有拼写错误(不要说你不知道Word会自动提示拼写错 误)。我甚至看到过title
中的一个"the"写成了"tHe",abstract中几乎找不到一句没有语病的句子。我不
相信作者的英 语差到这种地步,更有可能的是作者在写完之后连读都不愿意多读
一遍。再公正再有耐心的审稿人,读了这样的abstract之后也会准备开始拒了。
一 篇成功的paper中语言和研究内容的重要性大约各占50%,这并不意味者英语
水平一般的中国学生就不能写出好论文了。论文中语言的要求是清楚、 简洁、准
确,同时段落组织 合理,并不要求复杂的句式和单词。在写完之后,对论文反复
修改3-4次是绝对必要的,一定要打印出来一字一句 地修改(对着电脑难以发现错
误),每次修改之间最好隔一段较长的时间,以避免思维上的惯性。
在写头一两篇论文的时候最好 能有一个有经验的人帮你一起修改。我的第一篇
论文有幸是在微软研究院的一位研究员指导下进行的,短短的4页纸我改了近一个
星期。我至今还 记得他用Word的审阅功能把我的paper改的大红大绿,面目全非的
样子,很多是对用a还是the,用for还是of这些细节的修改。经过了那 次痛苦的经
历,我以后写paper就顺手多了,慢慢有了驾轻就熟的感觉。
还有投稿要持之以恒。我尽管发表和收录近20 篇论文,被拒的次数应该也差不
多这个数了,也许更多。比如CS领域的顶级会议的接收率在10-15%之间,也就是
平均投7篇才中一篇,更 何况你的竞争对手可能来自Stanford。就我自己而言,大
约投过6-7次顶级会议,投中过一次,符合统计规律:-) 所以被拒绝对不是什么丢
脸 的事,而是可以从中汲取很多建议的好机会。我有一篇被顶级期刊据的paper,
三个审稿人给的评语加起来超过了11页(A4纸),快有paper 本身的一半长了。
天外有天
我在申请PHD的时候尽管得到了一些好学校的offer,也被很多学校拒了,比如
Stanford, UC Berkeley, Cornell, MIT。 一位朋友对我被很多学校拒感到吃惊,
觉得凭我的简历应该是所向无敌的。我的感受恰好相反,我觉得能被CMU这样CS方
面顶尖的学校选中是 非常非常幸运的。因为这个世界上牛人实在是太多了 :-) 我
敢说CMU再多招50个人,其优秀程度(而非合适程度)是不会有丝毫逊色的!
INTEL 前总裁Andy Grove说过一句话我一直用来提醒自己 "Don't take yourself
tooseriously"。即便浙大也 绝对是一个藏龙卧虎的地方。我所认识的一些浙大
人,他们的知识绝对是上通天文地理,下晓人文历史,而他们的经历更让我只有
"景仰"二字形 容,而他们中的大多数为人处世都是比较低调的(这也是他们成功
的秘诀之一)。一位我一直把他当作大哥的朋友,在我现在的年纪就已经创办过
千 万级的软件公司,在美国工作过,周游过世界,同时精通登山、摄影、自行车
(7次西藏,曾从杭州骑车前往)、多项运动(体校出身),对历史、篆刻、 书法
、古典音乐也多有涉猎。此仁兄只不过是杭大(合并前)的一名普通本科毕业生
,为人极其谦和低调,对朋友也是两肋插刀(他肯定不想被人 提起名号,因此略
去)。
这些真正的强人让我为BBS上许多所谓“名校研究生”、“牛人”的狂妄言语而汗颜,
深感如芒 在背。另一方面,也让我觉得普通人凭借坚持不懈的努力同样能够做出
一番事业,因为这些强人的天资并无太多过人之处,就读的学校也很一般,他们
成 功的第一秘诀是勤奋。“王侯将相,宁有种乎”。我们每个人不管目前处于什么
状态,只要用功总是能做出一些事情的。
别看不起导 师和学校
BBS上说导师坏话的贴子要远远多于赞扬的。诚然,我们的导师们确实不尽如
人意,他们的研究工作未必都是第一流的,个 别在师德方面也有问题。但是,导
师们也可能在抱怨,他的学生中怎么就没有出几个杨致远(Yahoo创始人),S. Brin
和 L. Page(Google发明者),要知道他们几乎都是在课余完成大业的。牢骚太盛防
肠断!我见过太多的研究生,一边抱怨实验室的东西没意 思,一边每天把时间泡
在88灌水、看片上,最后一事无成。这样的人即使身处条件优越的实验室也未必
能有所成就。无论顺境逆境,我们每个人 都没有消磨时间浪费青春的权力。
我很幸运地拥有一个优秀的导师和感兴趣的方向。但是在3年前我也怀疑过我
的导师,也 觉得当时的方向很无趣。庆幸的是,我没有选择消磨时间,而是争取到
自己比较感兴趣的课题,并通过努力取得一些成绩。现在回头看看,当初的怀疑
更 多出自误解和缺乏沟通,现在我为做过他的学生而自豪。
还有很多人在抱怨学校,当然我也曾是其中一个。诚然,中国的大学普遍缺
乏 一个有效合理的system,我深信这是诸如研究水平低下、学术腐败、教师们不
安心于校园的深层次原因。比如在现有制度下,国内一个教授通过做学 术研究并
不能保证他拥有优越的生活水平,这就导致了热门专业的教授一窝蜂地开了公司
,学生成了廉价劳动力。去责怪教授的道德水平是没有实 际意义的,国外那些学
富五斗的教授到了这种制度下会做出同样的事!! 然而,中国特点决定了这些制度
的改善在目前只能是缓慢进行的,因为 每一步都会有来自许多既得利益者的阻力
。所以,作为学生,我更倾向于“穷则独善其身”,做好自己该做的事情,把你的
想法留到“达则兼济天 下”的那一天。
另一方面,就在这个离世界一流还相去尚远的浙大,也不断地产生着杰出人物
,即便是在落后得多的过去。一 个学校的成功最终依赖于学生的成功。过分关注
学校排名,为了浙大排在第4而不是第3 而耿耿于怀者,或者以为进了浙大就是高
人一等的名校 生者,一般都缺乏对自身能力的信任,真正是英雄的应该是“莫问出
处”的。作为我自己,最感到欣慰的成就(如果算得上成就的话)就是让浙大的名
字 出现在一些大陆学者没有或很少出现的学术会议和期刊上,也算对得起浙大给
我带来的许多机会。最后,改了美国总统J.F. Kennedy的那句名 言作为结束:
Ask NOT what your school can do for you, ask what you can do for your
school!
关于coding
计算机专业的不少学生很早就被灌输了"写程序完全是体力劳动,30岁之后还
写程序就没 出息"这样的思想。我所接触的一些计算机系本科和研究生coding的能
力之差到了令人吃惊的地步(甚至有完全不会的)!上面的这种观点是绝对错 误
的。事实上,至少在CS的研究领域,年薪十几甚至几十万美元的人中许多人都自
己编写程序,包括一些如雷贯耳的名字,比如 Gim Gray。此君因为不喜欢Seattle
的雨天,使得Bill Gates为拉他入Microsoft在San Francisco为其 新建了一座研
究院让他做院长。据说此君在一次学术会议上demo他的新程序,听众中有人提出
界面可以如何改进,此君竟然在讲坛上就打开 VC++开始改起代码来,然后给人看
新效果 :-) 在这一方面,我觉得国内的导师们是比较弱的,当然这和他们 从一
开始就不缺学生有很 大关系。
当然,我对coding重要性的认识比有丰富工作经验的人差很多。我的经验主要
是两方面:一、绝大多数CS 的研究必须以实验为基础(尽管很多国内学生并不这
么做),coding能力直接关系到研究的进展。二、coding可以加深我们对技术的
理 解,体会各种技术的优劣,使我们能更快更好开发出自己的系统。
结束语
就让这些文字作为我向母校默默的告别吧...... 七 年的校园生活已经给我打上了
浙大的烙印,我也将永远关注和祝福我的母校。
I love ZJU ! I love her so much ...
--