12月15日,把生命数据化第一人、基因组学教父级科学家、人类长寿公司CEO克雷格•文特尔(J. Craig Venter)在北大基础医学院院长论坛上介绍了关于生命数据化及应用过程中的最新进展。
文特尔在会上传达了三个极为重要的信息:
1.目前其公司已经完成了对10545个人的全基因组测序,平均覆盖度为30X~40X,在测序过程中发现的1.5亿个基因变异,将帮助我们了解人类基因型表型及性状之间的关系,将带领我们进入健康科技时代。
2.将数据信息化,完成了基因组大数据搜索引擎——“Open Search”的构建。开放1万个全基因组测序数据样本,包含超过2亿个基因变异信息。科研人员可通过访问其网站HLI-OpenSearch.com进行相关查询。
3.其公司通过与阿斯利康、Genentech等生物医药企业的合作将临床信息样本与基因组数据相结合,运用大数据分析解读手段,实现对于生命健康趋势的预测和管理。
这样的消息着实令人振奋,它意味着人类对于生命的认知与解读又有了更为深刻的理解,使人类通过干预手段延缓衰老,达到健康长寿的目标又进了一步!
文特尔和他的人类长寿公司
提起文特尔,我们认为它是当之无愧的把生命数据化的第一人,也就是让每一个人通过一个平台能够浏览自己的各种生命数据,包括基因组数据、医疗纪录数据、生理数据等不同维度的数据。这个海量的生命解码数据库,让医疗健康变得更智能,并开启医学从“治疗”到“预防”的时代。
这个能够让生命进入数据化时代的项目,便是“人类长寿公司”(Human Longevity, Inc., HLI)的使命和愿景。
众所周知,人类基因组计划是由美国科学家在1985年率先提出,于1990年正式启动。在人类基因组计划启动8年后(1998年),创建了塞雷拉基因组公司(Celera),同时向人类基因组计划提出挑战。他宣称自己的公司比这个由“联合国”组成的国际性项目还要快4年完成人类基因组测序。而这个公司的名字Celera一词,在拉丁语中意为“快速的”。
然而,最后的赢家是科学。两个机构的竞争将人类基因组计划的完成时间提前了数年。文特尔的公司测得的基因组,其实绝大部分就是文特尔本人。为了更快、更好地完成任务,人类基因计划组不得不与Celera公司合作,采用文特尔更为先进的测序技术,并与文特尔共同分享成果。
文特尔通过商业的手段推动了科学的发展,打下了一场漂亮的仗,然而却付出极大的代价。2015年,《自然》(Nature)上的评论文章《人类基因组计划:大生物学的二十五年》(Human Genome Project: twenty-five years of big biology)完全没有提到文特尔的名字。这篇文章的作者包括现已成为美国国立卫生研究院(NIH)的主席的柯林斯、因发现 DNA 双螺旋结构而享誉全球的詹姆斯•沃森(James Watson),后者曾公开将文特尔比作希特勒。在人类基因组计划竞争赛结束以后,文特尔被公司解雇。
把生命应用化
在他的书《光速生活》里面,文特尔提到“我们在首个合成细胞问世的过程中,遇到的种种困难。政府通常不愿赞助这类研究,因为解决其中问题需要花很长时间,我也曾怀疑自己无法说服执行委员会,让他们相信这些问题终将解决。但我一直坚信它们会被解决,惟有成功能证明一切。”
这里面的提到的合成细胞,便是让文特尔东山再起的一家公司:“合成基因组公司”(Synthetic Genomics,Inc.,SGI)。这家公司试图理解并重写生命的基本原理,想要创造出能够生产燃料、化合物以及药物的新型有机体。让生命数据化如果是文特尔理解生命的开始,那么合成生命便是他将生命数据应用化的开端。
目前,文特尔的合成基因组公司已经将合成细菌细胞升级到更复杂的人体细胞上。为了让人类能够受益于这种合成技术,文特尔提出从改造猪的基因组开始,让猪的器官具备人类器官的特征,他说,“我们在改写猪的基因组,让猪的器官可以用于人类器官移植。”
不仅仅是“全基因组检测服务”
任何不以盈利为目的的商业模式都是耍流氓。“左手”组建文特尔研究院,“右手”创办生物科技公司。这位疯狂的企业家信奉现代实验生理学创始人克劳德•纳德(Bernard Claude)的一句格言:艺术是自己的,科学则是大家的(Art is I,Science is we)。用“科学”来收揽人才,用“企业”来实现利益,作为科学家“下海”的文特尔,深知和科学家合作的秘诀,他的见解是:“我认为长远来看,人们能够在我创造的环境中不断进步,部分原因是我们没有设终身职位。我们不像政府机构或高校,不会用这种奖励让一些人过早放弃奋斗。我们都知道,超越昨天的自己才是正道。真正优秀的人不会为获得安全感而奋斗,他们奋斗的动力是在学术上取得突破。”
2013年年末,文特尔和另外两位合伙人(PeterDiamandis和Robert Hariri)共同创立了“人类长寿公司”(Human Longevity, Inc., HLI),初衷是为了建立世界最大的人类遗传和医学信息数据库(类比中国发改委依托深圳华大基因研究院组建的国家基因库),进而实现把生命数据化,最终让人类寿命向三位数延伸。
2014年上半年,Human Longevity公司获得了8000万美金的A轮融资。2016年4月4日,HumanLongevity公司完成发行总价值超过2.2亿美金的B轮优先股。
有了“粮食弹药”的Human Longevity公司,开始了一系列将“生命数据化”的行动。
2015年10月,HumanLongevity公司在总部开放了一个称为“Health Nucleus“的中心。这是世界上一个将基因组数据和健康数据结合起来的中心,客户不仅能够得到全基因组测序数据,还能够得到肠道微生物测序数据、生理数据、解剖数据和行为数据等各个维度的生命数据。这一系列通过非侵入式的检测,也许正是文特尔提出来将生命数据化的第一步,他相信这些检测能够改善人类的健康,能够对人类健康进行管理。
为了将来这些数据都能够和大量的医学信息结合起来,文特尔首先让Human Longevity公司变成世界上最大的人类基因测序机构,从Illumina公司哪里买来了24台新型的HiSeq X测序仪(国内只有诺禾致源能够和Human Longevity公司的测序能力相匹配),成为了Illumina最大的客户。
光有测序能力是远远不够的。就在Human Longevity公司获得A轮融资的第二年,文特尔就宣布收购生物标志物开发企业Cypher Genomics。这家被收购的公司主要是提供人类基因组分析软件,其中的主打产品Mantis软件是用来解释基因组测序数据,以识别临床上显著的变异。此外,该公司还开发了一款发现生物标志物的产品,叫做Cypher's Coral™。这家公司同时也是英国10万基因组计划中的生物信息分析提供商。Human Longevity公司通过对Cypher Genomics的收购,将其14名员工收编旗下,包括联合创始人兼CEO Ashley Van Zeeland,这位前CEO将领衔Human Longevity公司的儿童基因组业务。
这家已经融资近3亿美金的公司,目前已经积累了超过2万个基因组及表型数据,成立了以基因组研究为导向的健康研究中心,开始收集已有基因组数据志愿者的生理健康信息。文特尔的目标是在2020年前获得100万例生理健康记录。这些数据都能够成就文特尔建立起世界上最大、最完整的生物信息数据库,这些信息转化成知识库的能力,也是文特尔公司具备的能力。所有这些,都让文特尔的公司不仅仅只提供“全基因组测序服务”,而且能够提供“全基因组健康管理”(国内奇云诺德也是首家提供类似的全基因组健康管理服务)。目前”Health Nucleus“的整套健康管理服务售价是25,000美金。随着参与者不断购买加入,数据库和服务内容都在不断更新升级,文特尔追求“长生不老”的旅途也许能够找到一些答案。
打造全球范围的“健康俱乐部”
文特尔在奇点大学的医学会议上表示,目前基因组学的发展仍然停留在数量上的扩张,这是一件令人遗憾的事情。如果我们看看截至目前的基因组数据,就会发现全球范围内已经完成了超过22.5万个基因组测序数据。文特尔估计在2020年这个数目将达到500万。
基因数据的爆发,带来的是下游数据分析产业的崛起。特别是生物信息技术和互联网技术的结合,带来了基因大数据和健康大数据的交集。然而国家政策对于基因大数据崛起的影响,一直以来都没有停止过。2012年10月31日中国政府网公布了《人类遗传资源管理条例(征求意见稿)》,如果我们仔细研究条例的内容,能够得到一个信息,国家开始对于人类遗传资源(含有人体基因组、基因及其产物的器官、组织、细胞、核酸、核酸制品等资源材料及其产生的信息资料)开始进行管制了。从2016年3月7日开始,这个管理条例逐步进行实施,国家不仅对于基因样本资源会有规范,对于基因信息资源也会逐步出台相关的政策。
这意味着,中国人的基因数据,需要在中国境内和被中国企业进行消化、转化和应用。我们的“测序武器”可以进口,“测序技术”可以进口,但是“测序数据”出境和挖掘却受到管制。这个基因大数据和互联网大数据相比,除了生物信息技术的门槛以外,又蒙上了一层政策风险。