原创:谭婧
他回答道,“我们已经在一线驻场了”。
阿里巴巴达摩院算法专家,顾斐博士在微信中回复我的询问。他口中的一线指的是——浙江省疾控中心。
疫情肆虐,阿里巴巴达摩院科学家们已经奔赴到战斗的最前线。
他说,“差不多用一天时间,阿里巴巴团队就已经搭建出针对新型冠状病毒的全基因组检测分析平台。”
大疫当前,争分夺秒。
科技部网站2020年1月29日发文透露,近日曾下发通知,要求各有关攻关项目承担单位及其科研人员勇挑重担、敢于担当,把研究精力全部投入到各项攻关任务上来,把论文写在抗击疫情的第一线,把研究成果应用到战胜疫情中。
这个通知的全名是《科技部办公厅关于加强新型冠状病毒肺炎科技攻关项目管理有关事项的通知》。
科技攻关,众志成城。
中国疾控中心,分秒必争。他们已成功分离病毒,而疫苗研发和药物筛选仍在继续。新药和疫苗研发期间,需要进行大量的数据分析、大规模文献筛选和科学超算工作。敢问科技企业谁能支援?
从新中国历史上最清冷的春节中醒来。
2020年1月29日,阿里云宣布,将与合作机构向全球科学共同体免费开放相关药物研发资源,共同加速针对新型冠状病毒的药物研发。
2020年1月30日,百度研究院宣布,将向各基因检测机构、防疫中心及全世界科学研究中心免费开放算法资源以及结构预测网站,以提升新型冠状病毒 RNA 空间结构预测速度。
科研工作在和死神抢时间,各个战区都在努力完成属于自己的任务。
全球健康药物研发中心(Global Health Drug DiscoveryInstitute)也参与进来,它是由比尔及梅琳达·盖茨基金会、清华大学和北京市政府共同创立和建设的一个公益型科研创新机构。
全球健康药物研发中心正与阿里云合作开发人工智能药物研发和大数据平台,针对SARS/MERS等冠状病毒的历史药物研发进行数据挖掘与集成,开放相关临床前和临床数据资源,计算靶点和药物分子性质,并跟进新型冠状病毒最新科研动态,实时向科学界和公众公布,为新型冠状病毒科学研究提供重要支撑。
需要补充了解的背景知识是,
此次引起武汉肺炎的新型冠状病毒(2019-nCoV)与“非典”病毒、艾滋病毒、埃博拉病毒、流感病毒一样,都属于 RNA 病毒,其单链结构导致病毒更容易变异,这也就意味着,疫苗开发,不易。
不仅如此,新型冠状病毒比2003年的“非典”病毒潜伏期长。一边潜伏,还能一边传染。防控工作难上加难。
除了时间紧迫之外,病毒也很狡猾。RNA病毒有丰富的蛋白结构,决定病毒功能。传统上,蛋白质二级结构预测需要复杂度更高的算法。
也就是说,如果序列长度翻一倍的话,需要花费的计算时间指数级上升。
计算 RNA 病毒基因组这样的超长序列(例如艾滋病毒有约 1 万个碱基,埃博拉病毒有约 2 万个碱基),科学家们需要花费更长的时间用来计算。冠状病毒家族包括了非典病毒和新型冠状病毒(2019-nCoV),冠状病毒家族的基因组又是所有 RNA 病毒里最长的(之一)。
回到杭州市滨江区信诚路630号,浙江省疾控中心。
顾斐博士透露,现在的算法既包括经典算法,也包括自研算法,但是,目前困难来自算法、算力以及平台各方面。
他这次奔赴一线的工作任务,主要是分析浙江省疑似病例的实际样本,通过全基因组测序的方法,这有别于普通核酸检测的方法。
当被问到“此次任务科技含量最高的地方在哪”时?
他回答说,“算得快,算得多”。
算得多是指,不仅能计算基因序列、蛋白结构等,还能做序列拼接,以及帮助发现新病毒。
算得快是指,使用阿里云分布式计算,并行计算技术。此次,阿里云提供强大的AI算力,支持病毒基因测序、新药研发、蛋白筛选等工作,帮助科研机构缩短研发周期。
疫情当前,阿里巴巴集团旗下云计算及人工智能公司能做的工作有很多,
第一、用分子动力学HPC应用算病毒、蛋白质、药物结构,靶点作用模拟和设计药物筛选的实验,以及使用QD量子动力学等做药物研究。
第二、对病毒植株和染病者的染病DNA提取,进行基因组计算、基因组学计算。
第三、在MD,MM,QD基础上做虚拟筛选。
他坚定地告诉我,“虽然浙江省疾控中心的现场只有他一人,但是背后还有几十人的团队在默默支援。”
江湖传闻,阿里云办公室里贴有这样的一副对联,“代码成就万世基积沙镇海,梦想永在凌云意意气风发”。回忆起2019年8月,顾斐博士曾经和我谈起,美国哈佛大学生物信息博士后毕业之后,他的选择有很多,可以做医学研究,也可以留校任教,只是想不到自己会变成阿里云达摩院算法专家。
这里没有烽火、没有硝烟,却是抗击病毒的最前线。阿里巴巴将阿里云达摩院的科学家派往战区,在危难中执行科研任务。
顾斐博士告诉我,“出发时,他没有犹豫过”。
(完)
更多阅读,请点击:
5000字深度丨阿里巴巴用AI破局孕妇糖尿病
支持原创,请点「在看」