本文科研大匠综合整理自施一公科学网博客
转自 | 募格学术
近日,研究生新生已开始陆续开学,很多同学问:如何成为一名优秀的博士生?对这个问题,施一公院士曾进行深入的思考,他结合自己的亲身经历,专门写了两篇长篇博文进行总结,朴实精辟,流传甚广,得到很多导师及学长学姐们的极力推荐,以下为完整版,分享给大家。
序: 我从获得博士学位至今已经整整16个春秋,但博士阶段的感受仍然历历在目。我从指导自己独立实验室的第一个博士生到现在也已经13年了,其中的博士研究生和博士后中已经有11人在美国和中国的大学里担任独立实验室的PI。他们的成长过程差别极大,性格、能力也各有不同。应该说,没有任何一个学生可以简单地遵循另外一个优秀科学家的足迹脱颖而出。从这个意义上讲,科学家的成功是不可能复制的。但是,优秀科学家常常具备的共同特点应该对年轻学生有很大启发。
文主要来自我在清华大学研究生入学教育里一次2.5小时的讲座,又综合了一些随后的思考和总结。在那次讲座中,我一再强调,我的目的不是要求研究生完全按照我讲的去做,而是希望从根本上冲击、振荡一下研究生的思考角度,启发大家找到最适合自己的成才之路。
时间的付出
所有成功的科学家一定具有的共同点,就是他们必须付出大量的时间和心血。这是一条真理。实际上,无论社会上哪一种职业,要想成为本行业中的佼佼者,都必须付出比常人多的时间。有时,个别优秀科学家在回答学生或媒体的问题时,轻描淡写地说自己的成功凭借的是运气,不是苦干。这种回答其实不够客观、也有些不负责任,因为他们有意忽略了自己在时间上的大量付出,而只是强调成功过程中的一个偶然因素,这样说的效果常常对年轻学生造成很大的误导,因为有些幼稚的学生甚至会因此开始投机取巧、不全力进取而是等待所谓的运气;另外一些学生则开始寻找他们的运气,把相当一部分精力和时间用在了与科学研究无关的事情上面。说极端一点:如果真有这样主要凭运气而非时间付出取得成功的科学家,那么他的成功很可能是攫取别人的成果,而自己十有八九不具备真正在领域内领先的学术水平。
大约在十年前,著名的华人生物学家蒲慕明先生曾经有一封非常著名的email在网上广为流传,这封email是蒲先生写给自己实验室所有博士生和博士后的,其中的观点我完全赞同。这封email写的语重心长,从中可以看出蒲先生的良苦用心。我无论是在普林斯顿还是在清华大学都把这封email转给了我实验室的所有学生,让他们体会。其中的一段是这样说的:
“The most important thing is what I consider to be sufficient amount of time and effort in the lab work. I mentioned that about 60 hr working time per week is what I consider the minimal time an average successful young scientist in these days has to put into the lab work……I suggest that everyone puts in at least 6 hr concentrated bench work and 2+ hr reading and other research-related activity each day. Reading papers and books should be done mostly after work.”
我认为最重要的事情就是在实验室里的工作时间,当今一个成功的年轻科学家平均每周要有60小时左右的时间投入到实验室的研究工作......我建议每个人每天至少有6小时的紧张实验操作和两小时以上的与科研直接有关的阅读等。文献和书籍的阅读应该在这些工作时间之外进行。
蒲慕明
有些学生读完蒲先生的email后告诉我,“看来我不是做学术的料,因为我真的吃不起这份苦。”我常常回复道,“我在你这么大年纪的时候,也会觉得长期这样工作不可思议。但在不知不觉之中,你会逐渐被科学研究的精妙所打动,也会为自己的努力和成绩骄傲,你会逐渐适应这种生活方式!”这句话表面上是劝学生,实则是我自己的经历与体会。
我从小就特别贪玩,并不喜欢学习。但来自学校和父母的教育与压力迫使自己尽量刻苦读书;我高中就读于河南省实验中学,凭借着比别人更加刻苦的努力,综合成绩始终名列前茅。1984年全国高中数学联赛我获得河南赛区第一名,保送进入清华大学。大学阶段,我保持了刻苦的传统,综合成绩全班第一并提前一年毕业。但这种应试和灌输教育的结果就是我很少真正独立思考、对专业不感兴趣。大学毕业时,我本没有打算从事科学研究,而是一心一意想下海经商。阴差阳错之间,我踏上了赴美留学之路。
可想而知,留学的第一年,我情绪波动很大,内心浮躁而迷茫,根本无心念书、做研究,而是花了很多时间在中餐馆打工、选修计算机课程。第二年,我开始逐渐适应科研的“枯燥”,并开始有了一点自己的体会,有时领会了一些精妙之处后会洋洋得意,也会产生“原来不过如此”的想法,逐渐对自己的科研能力有了一点自信。这期间,博士研究生的课程全部修完,我每周五天、每天从上午9点做实验到晚上7、8点,周末也会去两个半天。到了第三年,我已经开始领会到科研的逻辑,有点儿跃跃欲试的感觉,在组会上常常提问,而这种“入门”的感觉又让我对研究增加了很多兴趣,晚上常常干到11点多,赶最后一班校车从霍普金斯医学院回Homewood campus(我住在附近)。1993年我曾经在自己的实验记录本的日期旁标注“This is the 21st consecutive day of working in the lab.”(这是我连续第21天在实验室工作。)以激励自己。其实,这多少有作秀之嫌,因为其中的一个周末我一共只做了五、六个小时的实验。到第四年以后,我完全适应了实验室的科研环境,也不会再感受到枯燥或时间上的压力了。时间安排完全服从实验的需要,尽量往前赶。其实,这段时期的实验时间远多于刚刚进实验室的时候,但感觉上好多了。
研究生阶段后期,我的刻苦在实验室是出了名的。在纽约做博士后时期则是我这辈子最苦的两年,每天晚上做实验到半夜三点左右,回到住处躺下来睡觉时常常已是四点以后;但每天早晨八点都会被窗外纽约第一大道(First Avenue)上的汽车喧闹声吵醒,九点左右又回到实验室开始了新的一天。每天三餐都在实验室,分别在上午9点、下午3点和晚上9、10点。这样的生活节奏持续11天,从周一到第二个星期的周五,周五晚上做灰狗长途汽车回到巴尔地摩(Baltimore)的家里,周末两天每天睡上近十个小时,弥补过去11天严重缺失的睡眠。周一早晨再开始下一个11天的奋斗。虽然体力上很累,但我心里很满足、很骄傲,我知道自己在用行动打造未来、在创业。有时我也会在日记里鼓励自己。我住在纽约市曼哈顿区65街与第一大道路口附近,离纽约著名的中心公园(Central Park)很近,那里也时有文化娱乐活动,但在纽约工作整整两年,我从未迈进中心公园一步。
求学时期的施一公,图源:互动百科
我一定会把自己的这段经历讲给每一个我自己的学生听,新生常常问我:“老师,您觉得自己苦吗?”我通常回答,“只有做自己没有兴趣的事情时候觉得很苦。有兴趣以后一点也不觉得苦。” 是啊,一个精彩的实验带给我的享受比看一部美国大片强多了。现在回想起当时的刻苦,感觉仍很骄傲、很振奋!有时我想:如果自己在博士生、博士后阶段的那七年半不努力进取,而是不加节制地看电影、读小说、找娱乐(当时的互联网远没有现在这么内容丰富),现在该是什么状况?
做一个优秀的博士生,时间的付出是必要条件。
方法论的转变
要想在科学研究上取得突破和成功,只有时间的付出和刻苦,是不够的。批判性分析(critical analysis)是必须具备的一种素质。
研究生与本科生最大的区别是:本科生以吸取学习人类积累的知识为主、兼顾科学研究和技能训练;而博士生的本质是通过科学研究来发掘创造新知识,当前和以往学习的知识都是为了更好地服务于科学研究。在以学习知识为主的本科生阶段,提出问题固然重要,但答案往往已经存在,所以问题是否critical没有那么关键。博士生阶段则完全不同,必须具备critical analysis的能力,否则不可能成为优秀的科学家。这一点,我称之为方法论的转变。
其实,整个大学和研究生阶段教育的实质就是培养critical analysis的能力,养成能够进行创新科研的方法论。这里的例子非常多,覆盖的范围也非常广,在此举几个让我终生难忘的例子。
01
正确分析负面结果(negative results)是成功的关键
作为生命学科的一名博士生,如果每一个实验都很顺利、能得到预料中的正面结果(positive results),除个别研究领域外,一般只需要6-24个月就应该可以获得博士学位所需要的所有结果了。然而实际上,在美国,生命学科的一个博士研究生,平均需要6年左右的时间才能得到PhD学位。这一数字本身就说明:绝大多数实验结果会与预料不符,或者是负面结果(negative results)。大多数低年级的博士生对负面结果的看法很消极,直接影响了他们critical analysis能力的培养。
其实,只要有适当的对照实验(control experiments)、判断无误的负面实验结果往往是通往成功的必经之路。一般来说,任何一个探索型课题的每一步进展都有几种、甚至十几种可能的途径(hypothesis),取得进展的过程基本就是排除不正确、找到正确方向的过程,很多情况下也就是将这几种、甚至十几种可能的途径一一予以尝试、排除,直到找到一条可行之路的过程。在这个过程中,一个可信的(conclusive)负面结果往往可以让我们信心饱满地放弃目前这一途径,如果运用得当,这种排除法会确保我们最终走上正确的实验途径。从这个角度讲,负面的实验结果不仅很正常、也很有益于课题的最终成功。
非常遗憾的是,大多数学生的负面结果并不令人信服,经不起逻辑的推敲!而这一点往往是阻碍科研课题进展的最大阻碍。比如,按照一个常规的 protocol操作时不能得到positive control的相应结果,或者缺乏相应的对照实验,或者是对可信的实验结果在分析和判断上产生了失误,从而做出“负面结果”或“不确定”(inconclusive results)的结论,这种结论对整个课题进展的伤害非常大,常常让学生在今后的实验中不知所措、苦恼不堪。我告诫并鼓励我所有的学生:只要你不断取得conclusive的负面结果,你的课题就会很快走上正路;而在不断分析负面结果的过程中所掌握的强大的逻辑分析能力也会使你也会很快成熟,成长为一名优秀的科学家。
我对一帆风顺、很少取得负面结果的学生总是很担心,因为他们没有真正经历过科研上critical analysis的训练。在我的实验室,偶尔会有这样的学生只用很短的时间(两年左右,有时甚至一年)就完成了PhD论文所需要的结果;对这些学生,我一定会让他们继续承担一些富有挑战性的新课题,让他们经受负面结果的磨练。没有这些磨练,他们很难真正具备critical analysis的能力,将来也很难成为可以独立领导一个实验室的优秀科学家。
所以,不要害怕负面结果,关键是如何从分析负面结果中获取正确的信息。
02
耗费时间的完美主义阻碍创新进取
Nikola Pavletich是我的博士后导师,也是对我影响最大的科学家之一,他有着极强的实验判断力和思维能力,做出了一系列包括p53、Rb、CDK complex、SCF complex、BRCA1等在内的里程碑式的研究工作,享誉世界结构生物学界,31岁时即升任正教授。
施一公博士后导师 Nikola Pavletich
1996年4月,我刚到Nikola实验室不久,纯化一个表达量相当高的蛋白Smad4,两天下来,蛋白虽然纯化了,但结果很不理想:得到的产量可能只有应该得到的20%左右。见到Nikola,我不好意思地说:产率很低,我计划继续优化蛋白的纯化方法,提高产率。他反问我:(大意)
Why do you want to improve the yield? Don’t you have enough protein for crystallization trials?
你为什么想提高产率?已有的蛋白不够你做初步的结晶实验吗?
我回敬道:
I do have enough protein for crystallization screen. But I need to optimize the yield first so that I can accumulate more materials.
我有足够的蛋白做结晶筛选,但我需要优化产率以得到更多的蛋白。
他不客气地打断我:
No. The yield is high enough. Your time is more important than yield. Please proceed to crystallization.
不对。产率够高了,你的时间比产率重要。请尽快开始结晶。
实践证明了Nikola建议的价值。我用仅有的几毫克蛋白进行crystallization screen,很快意识到这个construct并不理想,需要通过protein engineering除去其N-端较flexible的几十个氨基酸。而除去N-端几十个氨基酸的蛋白不仅表达量高、而且生化性质稳定,纯化起来非常容易,根本不用担心产率的问题。
在大刀阔斧进行创新实验的初期阶段,对每一步实验的设计当然要尽量仔细,但一旦按计划开始后对其中间步骤的实验结果不必追求完美,而是应该义无反顾地把实验一步步推到终点,看看可否得到大致与假设相符的总体结果。如果大体上相符,你才应该回过头去仔细地再改进每一步的实验设计。如果大体不符,而总体实验设计和操作都没有错误,那你的假设(或总体方向)很可能是有大问题的。
这个方法论在每一天的实验中都会用到。比如,结构生物学中,第一次尝试纯化一种新的蛋白不应该追求每一步的产率,而应该尽量把所有纯化步骤进行到底,看看能否拿到适于结晶的蛋白。第一次尝试limited proteolysis,不应该刻意确定protease浓度或追求蛋白纯度,而是要关注结果中是否有protease-resistant core domain。从1998年开始自己的独立实验室到现在,我告诉所有学生:切忌一味追求完美主义。
我把这个方法论推到极限:只要一个实验还能往前走,一定要做到终点,尽量看到每一步的结果,之后需要时再回头看,逐一解决中间遇到的问题。
03
科研文献(literature)与学术讲座(seminar)的取与舍
Nikola Pavletich博学多才。在我们许多博士后的心目中,他一定读很多文章、常常去听seminar。没想到,我最大的惊讶出现在我笃信无疑的这一点。
在我的博士生阶段,我的导师Jeremy Berg非常重视相关科研文献的阅读,有每周一次的组内journal club,讨论重要的科研进展。刚到Nikola实验室,我曾试图表现一下自己读paper的功底、也想同时与Nikola讨论以得到他的真传。
施一公博士生导师 Jeremy M. Berg
2016年起担任Science杂志主编
96年春季的一天,我精读了一篇《Nature》article,午饭前遇到Nikola,向他描述这篇文章的精妙,同时期待着他的评述。Nikola面色有点尴尬地对我说:对不起,我还没看过这篇文章。噢,也许这篇文章太新,他还没有来得及读。过了几天,我因故阅读了一篇几个月前发表的《Science》research article,又去找Nikola讨论,没想到他又说没看过。几次碰壁之后,我不解地问Nikola:
You know so much. You must read a lot of papers. Why is it that you didn’t read the ones I read?
你知识如此渊博,一定是广泛阅读了大量文献。你为什么恰好没有读我提到的这几篇论文呢?
Nikola看着我说:
I don’t read a lot.我阅读不广泛。
我反问:
If you don’t read a lot, how can you be so good at research? And how can you reference so many papers in your own publications?
如果你不广泛阅读,你的科研怎么会这么好?你怎么能在自己的论文里引用这么多文献?)
Nikola的回答让我彻底意外:(大意)
I only read papers that are directly relevant to my research interests, and I only read more papers when it comes to writing my own papers
我只读与我的研究兴趣有直接关系的论文。并且只有在我写论文时才会大量阅读。
我做博士后的单位Memorial Sloan-Kettering Cancer Center有很好的系列学术讲座(Institute Seminar Series),常常会请来各个生命科学领域的大牛来演讲。有一次,一个诺贝尔奖得主来讲Institute seminar,并且点名要与Nikola交谈。在绝大多数人看来,这可是一个不可多得的好机会去接近大人物、取得好印象。Nikola告诉他的秘书:请你替我转达我的歉意,seminar那天我恰好不在。我们也为Nikola遗憾。让我万万想不到的是,诺贝尔奖得主seminar的那天,Nikola把自己关在办公室里,早晨来了以后直到傍晚一直没有出门,当然也没有去听讲座。当然,这也许是巧合 – Nikola取消了他的出行计划;但以我们对Nikola的了解,他十有八九是在写paper。后来,我们也意识到,这样的事情发生在Nikola身上已经见多不怪了。
在我离开Nikola实验室前,我带着始终没有完全解开的谜,问他:
如果你不怎么读papers,又不怎么去听讲座,你怎么还能做一个如此出色的科学家?
他回答说:(大意)
我的时间有限,每天只有10小时左右在实验室,权衡利弊之后,我只能把我的有限时间用在我认为最重要的事情上,如解析结构、分析结构、与学生讨论课题、写文章。如果没有足够的时间,我只能少读文章、少听讲座了。
Nikola的回答表述了一个简单的道理:一个人必须对他做的事情做些取舍,不可能面面俱到。无论是科研文献的阅读还是学术讲座的听取,都是为了借鉴相关经验、更好地服务于自己的科研课题。
在博士生阶段,尤其是前两年,我认为必须花足够的时间去听各相关领域的学术讲座、并进行科研文献的广泛阅读,打好critical thinking的基础;但随着科研课题的深入,对于文献阅读和学术讲座就需要有一定的针对性,也要开始权衡时间的分配了。
04
挑战传统思维
从我懂事开始,就受到教育:凡事失败都有其道理,应该找到失败的原因后再重新开始尝试。直到1996年,我在实验上也遵循这一原则。但在Nikola 的实验室,这一基本原则也受到有理有据的挑战。
有一次,一个比较复杂的实验失败了。我很沮丧,准备花几天时间多做一些control实验找到问题所在。没想到,Nikola阻止了我,他皱着眉头问我 (大意)
Tell me why you want to figure out why your experiment failed?
告诉我你为什么要搞明白实验为何失败?
我觉得这个问题太没道理,理直气壮地回答:
I need to know what went wrong so that I can get it to work next time.
我得知道哪里错了才能保证下一次可以成功。
Nikola马上评论道:(大意)
You don’t need to. All you need to do is to carefully repeat your experiment and hopefully it will work next time. Many times figuring out why your previous experiment failed will take much longer time than simply repeating your experiment. For a sophisticated, one-time experiment, the best solution to a failed experiment is to repeat it carefully.
不需要。你真正要做的是把实验重复一遍,也许下次就可以做成。与其花大把时间搞清楚一个实验为何失败,不如先重复一遍。面对一个失败了的复杂的一次性实验,最好的办法就是认认真真重新做一次。
后来,Nikola又把他的观点升华: (大意)
It is a philosophical decision whether to figure out why an experiment failed. The conventional wisdom of understanding every glitch may not represent the best approach.
仔细想想,这些话很有道理。并不是所有失败的实验都一定要找到其原因,尤其是生命科学的实验,过程繁琐复杂;大部分失败的实验是由简单的操作错误引起的,比如PCR忘记加某种成分了,可以仔细重新做一遍;这样往往可以解决问题。只有那些关键的、不找到失败原因就无法前行的实验才需要刨根究源。
我选择的这些例子多少有点“极端”,但只有这样才能更好地起到震荡大家思维的作用。其实,在我自己的实验室里,这几个例子早已经给所有学生反复讲过多次了,而且每次讲完之后,我都会告诉大家打破迷信、怀疑成规,而关键的关键是:
Follow logic!跟着逻辑走!
我每天在实验室里注定会重复讲的一句话就是:Follow logic!每天对不同的学生讲,加在一起至少有5遍以上吧。而我自己每次与博士生讨论课题也总是遵循严密的逻辑,用推理、排除法找到实验的下一步解决方案。
严密的逻辑是 critical analysis的根本。
下载一:中文版!学习TensorFlow、PyTorch、机器学习、深度学习和数据结构五件套!
后台回复【五件套】
下载二:南大模式识别PPT
后台回复【南大模式识别】
说个正事哈
由于微信平台算法改版,公号内容将不再以时间排序展示,如果大家想第一时间看到我们的推送,强烈建议星标我们和给我们多点点【在看】。星标具体步骤为:
(1)点击页面最上方“深度学习自然语言处理”,进入公众号主页。
(2)点击右上角的小点点,在弹出页面点击“设为星标”,就可以啦。
感谢支持,比心。
投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。
方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。
记得备注呦
推荐两个专辑给大家:
专辑 | 李宏毅人类语言处理2020笔记
专辑 | NLP论文解读
专辑 | 情感分析
整理不易,还望给个在看!