两种不同的科研模式

两种不同的科研模式_第1张图片

昨天(周六)上午有幸在中山大学中山医学院参加了他们的第十届学术节。早上听了几位教授的讲座,觉得学校做科研还真和我们有些区别。

首先,在学校里教授们一般都会围绕某一个具体的主题来深入开展。比如,围绕某一个RNA、某一个基因、某一个代谢通路或者某一个离子通道等,然后对它提出一两个具体的生物学问题或者是医学和生物学相结合的问题,比如piRNA/PIWI是影响男性不育的生物学原因,或者氯离子与高血压之间的关系之类。接着是做出自己的假设,再制定验证这个假设的研究思路,接着是层层往下深入研究。经常是一个问题嵌套着另一个问题,一点一点地深入进去,直到最后得到问题的解。这是一种纵向的科研模式。

而且随着研究的深入,甚至可能由此引出一个全新的领域,也有可能最后发现花费了大量的时间却什么也没有,完全是一个死胡同,只能回头重来。

在听这些讲座的时候,我感觉犹如是在看一个画家作画一般,随着问题的步步深入和解决,整幅画的轮廓就越来越清晰了。

而我们平时所做的基因组学研究则跟这样的模式有着一定的区别,这是第二个模式,我想可以称之为横向科研模式。

在进行组学研究的时候,我们倾向于不做任何前提假设——不以单一的检测为基础,而是会提一个大(泛)的研究方向,比如“揭示中国人的群体遗传学特征”,“寻找在某个人群中存在着自然选择差异的基因”,“寻找高海拔人群和低海拔人群的遗传差异”,“组装一个基因组然后挖掘出该物种的遗传特点”,或者“寻找阿兹海默疾病病人的致病因素”。很少会非常具体地提出假设,制定一个围绕该假设的研究路径和目标,比如我们不会直接说,研究HHV6与阿兹海默疾病的关系,也不会说研究FADS2基因和肥胖的关系等这一类比较细致的目标,而是更倾向于先编织一张网,然后往海里的某个方向撒下去,再收上来,看看找到了什么。

具体而言就是先收集大量的基因组数据以及表型数据,然后利用统计学和计算机算法知识大规模地去扫描和分析。虽然有一个大目标,但是这种大数据的研究,最终会得到怎么样的结果,我们是不会事先做太多假定的,往往是结果出来之后,再逐一去进行质控和验证。最后可能还会发现一个和原先设想或者传统认知所不一样的东西。

这两种不同的模式,能说谁比谁更加好吗?在做出判断之前,我觉得我们可以尝试来分析一下它们各自的优缺点。

两种不同的科研模式_第2张图片

先说第一种的纵向模式,我觉得它出研究成果的风险是比较大的,试错成本高昂。运气好的话,一下子抓到了本质,一个研究课题可能1-3年甚至几个月就做出来了;运气差的话,一个研究课题下来,可能十年都没有结果,最后发现走在了弯路上。

所以从事第一个模式研究的时候,如何提出一个正确的问题就显得尤为重要了。这时有经验的导师和领域带头人就显示出了他们的重要性了,因为他们有着非常丰厚的领域经验和研究积累,能够结合自身以及同领域关系网络中的研究者们的观点,提出很好的问题,在一定程度上判断一个课题的方向是否可行,或者是否值得探索下去。

这样的模式好处是很明显的,那就是研究者们往往可以把问题和机制研究地非常彻底,而且很多后来者也有机会在前人的基础之上,更上一层楼,更进一步也会促进科学共同体的形成。

我觉得饶毅教授平时所看重和倡导的应该是这个类型的研究模式,他也更加认可这样的研究人员才可以称之为科学家,不过对于这一点不同的人可能也有不同的看法。

接着我们说 第二个的横向模式,我觉得它的风险相对来说会更小,只要大方向没有错,这种大数据广撒网的形式,试错成本不会很高昂,而找到有意义研究结果的可能性会高很多。从这个角度来说,从事这个类型研究的科学工作者,不一定需要一个很资深的大导师或领域带头人——甚至可以说大数据在一定程度上就充当了导师的作用,只要做这个研究的人能够比较好地掌握一套如何进行科学研究的思路,以及了解当前领域的研究进展和方法——避免只是做一个数据的“土豪”,那么往往都是可以出成果的——这其中不乏很不错的成果。而且更多的人也能够参与进来,特别是更具有创新精神、精力旺盛的年轻人,这也可以让更多的人获得成长。这是它的一个好处,但是坏处也很明显,那就是,产出成果的稳定性不一定有保证。

因为没有经验丰富的导师或者学术带头人的参与,一个课题的研究可能会难以做得足够深入,甚至浅尝辄止。有时即便是碰到了非常好的数据和研究切入点,如果团队经验不足或者对前沿了解不深入,甚至可能根本就意识不到研究中出现的某个发现的重要性或者碰到问题束手无措,最后错过重大成果的发现。

我觉得这个横向的模式似乎是现在世界上很多基因组学机构所选择的一个模式——也可能这是一个必然的趋势,华大基因肯定是其中的一个典型代表——在没有PI的带领下,一群年轻人就敢于各自去做各种前沿的项目,有些失败了,有些成功了,也有些是重做了之前几乎要失败的项目,最后获得了成功。

但是科学研究中一定要有经验丰富的带头人吗?我不确定,就像我前面提到的,有时候大数据在一定程度上也具有PI的作用。不过如果条件允许有PI从旁指导或者交流应该会使得研究课题进行地更加顺畅。但也有可能由于上一辈研究者在思维方式上的固化,导致研究难以突破。这样的例子在科学史上也是有的,比如上个世纪物理学上几乎所有的重大成果都是年轻人所做出的。

这两个模式谁更适合当今的形势就见仁见智了,不过我个人更加偏向第二种模式——因为更加充满一种“确定性”的惊喜,因为,只要方向对,方法得当,我就觉得一定能够发现些什么,这种确定性往往也会让人更加心安。然后如果研究者能够再积极和第三方有经验的学术带头人沟通交流,交换看法,取长补短,那么研究起来还会更顺畅。

另外,是否有可能把纵和横这两种方式结合起来。首先是横向模式先行,撒网探路,抓到鱼之后,接上纵向研究模式,死磕这个抓到的“鱼”尝试更加彻底地剖析它们。这样是不是可以在降低第一种模式风险的同时也弥补第二种模式中可能出现的遗憾?那是不是说产业和科研天然就应该好好结合?


如果喜欢更多的生物信息和组学文章,搜索并关注我的微信公众号“碱基矿工”(ID: helixminer)

两种不同的科研模式_第3张图片
碱基矿工

你还可以读

  • GATK4全基因组数据分析最佳实践 ,我以这篇文章为标志,终结当前WGS系列数据分析的流程主体问题

  • 第一作者解读 | 我们这篇14万中国人基因组学研究的Cell文章都讲了什么?

  • 一篇文章说清楚什么是“插入片段”?

  • 样本量重要,还是测序深度重要? 生物信息工程师可以分为多少种类型?

你可能感兴趣的:(两种不同的科研模式)