基于阿里云混合云架构的华大基因的BGIOnline,让基因检测从千年到21小时

【云栖社区】在接到华大基因的感谢信之后,4月22日,阿里云总裁胡晓明发出全员信:我们在践行阿里云的使命——计算,为了无法计算的价值。

下述报道来自新浪微博:《基因检测“进化史”:从千年到一天》。


21小时47分12秒,这组数据被定格为了千人全基因测序的“中国速度”。

4月20日,来自“华大基因”的公号发出了一则消息:“华大基因、阿里云和安徽医科大学在深圳、杭州、合肥共同宣布,基于华大基因开发的新一代基因元计算平台BGIOnline,在21小时47分12秒内完成了1000例人 类全外显子组数据的分析。”40年前,人类若想对埃希氏大肠杆菌进行全基因组测序,需要1000年的时间。此次“千人基因组”项目共处理了1000份人类全外显子组数据,总数据量达2TB。整个分析全程无人值守、无 命令操作,仅仅点击了4次鼠标就启动了11000多项分析任务。

一跃千年

相比较人类基因缓慢的进化速度,有关基因组测序速度和能力的进化在这短短的20年内可谓“天翻地覆”。

1977年,当剑桥大学的F.Sanger等人发明了利用DNA聚合酶的双脱氧链终止原理测定核苷酸序列的方法之后,研究人员发表了第一个进行全基因组测序的噬菌体的基因组PhiX174(全长5375个碱基),那时在一年内可 对1000个碱基对进行测序。研究者预计:若按照当时的测序方法若是对人类进行全基因组测序,则需花费一百万年的时间。

2001年,6个国家的科学家花了11年的时间、30亿美元,共同发表首个人类基因组工作草图,两年后,全世界最早的人类全基因组参考序列公布。

到了2006年,全基因组测序的花费降至了2000万美元;2007年,二代测序技术诞生,并将全基因组测序的花费进一步降低至200万美元;2008年,在二代测序技术的推动下,全基因组测序成本降至20万美元;2010年降 至1万美元以下,彼时,进行全基因组测序的时间成本已经从11年下降到了数周时间。

从2005年第一代测序仪Roche454单次产生400MB的基因序列文件,到2010年第二代测序仪IlluminaHiseq2000单次产生200GB的基因序列文件,基因测序的速度在短短五年内就提升了500倍。

“其实在2008年之前,由于进行全基因组测序的花费高、耗时长,二代测序的市场我们常常称之为科研市场,也就意味着这项技术在那时是不具备普及性和临床使用价值的。”Illumina大中华区总经理赵瑞林表示

商业化破局

作为全球测序设备的“鼻祖”,测序设备生产商Illumina借着基因检测的浪潮在近几年异军突起,股票价格由2001年的15.94美元上涨至如今的140美元,最高峰时期涨幅达到了24倍,市值高达205亿美元。

而对于Illumina来说,近几年最值得他们骄傲的当数IlluminaHiseqX10测序系统,对于这套系统,业内有个很生动的比方:就好比汽车工业里的10万元家庭轿车,从此开启了测序市场的井喷时代,它将单次全基因组 测序的成本降至了1000美元以下。

“X10的诞生意味着全基因组测序市场真正进入了临床时代,事实上,Illumina现在也希望可以借此从一家纯粹的科研仪器公司转型变为一家临床公司。”赵瑞林表示。

从公共信息可知,HiseqX10是一套共10台超高通量测序仪,专为大规模人类全基因组测序而打造。一套设备至少10台起买,每台HiseqX10价格均超过为100万美元。在2014年,一套IlluminaHiseqX10可在3天时间内, 测出180个人的全基因组,前不久刚刚完成私有化的药明康德就曾在2014年购入过一套HiseqX10系统,希望借此布局自身的基因检测业务。

“在基因检测领域的下一个兵家必争之地就是癌症和产前筛查。事实上,早在2015年,中国就已经变成了仅次于美国的第二大测序市场,其中很多客户都来自于民营企业。”赵瑞林表示。

在前端测序市场,尽管目前三代测序还未在国内得到发展,但更多企业已经将目光放至了更为先进的四代测序市场。

相比于前面三代测序技术,第四代测序技术是真正实现单分子检测和电子传导检测相结合的测序方法,完全摆脱了洗脱过程、PCR扩增过程。作为最有希望实现1000美元基因组甚至100美元基因组的技术,纳米孔技术 具有超高读长、高通量、更少的测序时间和更为简单的数据分析,实现了从低读长到超高读长、从光学检测到电子传导检测的双重跨越。

在2014年6月,罗氏公司以3.5亿美元价格收购了涉及四代测序概念的美国纳米孔测序公司GeniaTechnologies;与此同时,罗氏公司联合风投再次共同投资美国纳米孔测序公司StratosGenomics1500万美元。罗氏公司 还与IBM公司共同研发固态纳米孔技术。而Illumina和Lifetech也在着力发展或投资纳米孔测序技术。

回归国内,去年华大基因曾在全球发布了一款基因组数据分析云计算平台服务产品——BGIOnline,并携手阿里云合作。据了解,该平台的主要功能定位为对海量的新一代测序数据进行分析、存储和共享。阿里云高级 专家孟方介绍,BGIOnline平台通过阿里云提供的混合云部署模式可以解决华大内部客户高速低延时的数据传输需求,并使得华大基因的数据存储、分析计算可以降低成本。

“我们的目标是使用具有自主知识产权的测序仪和云端分析平台,在24小时内完成一个人从全基因组测序、分析到解读的全过程。虽然面临着不小的挑战,但生命的价值值得我们为之努力。这样的努力势必会使中国

在未来数十年在生命科学、生物产业获得持续增长的强劲动力。”华大基因股份有限公司CEO尹烨表示。

你可能感兴趣的:(基于阿里云混合云架构的华大基因的BGIOnline,让基因检测从千年到21小时)