细胞分析 | 分子图谱 | IND
生物识别 | 基因测序 | AlphaFold
在细胞分析、视觉识别、生物识别、基因测序、IND、AlphaFold快速发展的大背景下,各项造福于人类的新兴技术开始展现。近日,《麻省理工科技评论》“十大突破性技术”20周年主题峰会在杭州余杭区未来科技城成功举办。
中国科学院院士、浙江大学发展委员会主席、浙江大学教授杨卫,中国工程院院士、清华大学环境学院教授贺克斌,中国工程院院士、清华大学智能产业研究院(AIR)院长张亚勤等近百位国内外顶尖科学家、行业领袖、商界精英应邀出席。
此次发布的突破性技术包括:新冠口服药物、实用型聚变反应堆、终结密码、AI蛋白质折叠、PoS权限证明、长期电网储能电池、AI数据生成、疟疾疫苗、除碳工厂和新冠肺炎变异追踪。
自新冠疫情全球爆发以来,全球各大制药企业和科研机构一直在致力于开发可有效预防新冠病毒感染的疫苗以及新冠的有效治疗药物。
据数据统计,截至五月初全球在研新冠药物共有1200余个,IND及以上研发阶段的项目占比近50%,提交上市申请15个,涉及企业1000余家;目前全球已有50余款药物(含疫苗)获批新冠适应症,其中包括12款小分子化药,30余款生物药。
从作用机制上来看,已获批小分子化药中,RdRp抑制剂(RNA以来的RNA聚合酶抑制剂)共有3款,分别为吉利德的瑞德西韦、富山化学的法匹拉韦、默沙东的molnupiravir;此外,还包括辉瑞的3CL蛋白酶抑制剂Paxlovid 、COVID19复制酶多蛋白1a抑制剂组合药物奈玛特韦+利托那韦,Incyte的JAK抑制剂巴瑞替尼等。
生物药大类中,作用机制为COVID19刺突糖蛋白调节剂的药物数量占比最高(约为50%);从疗法类型来看,除疫苗以外,中和抗体占多数,包括sotrovimab、卡西瑞单抗+伊德单抗、巴尼韦单抗等,此外,tozinameran、elasomeran、ZyCoV-D等核酸类药物也被批准用于新冠治疗。
目前,全球已上市的新冠口服小分子特效药有两个,默沙东的Molnupiravir和辉瑞的Paxlovid。国内共上市10余款新冠药物(含疫苗),包括口服药物法匹拉韦、奈玛特韦+利托那韦,中和抗体安巴韦单抗+罗米司韦单抗等,其中多数为紧急使用授权/附条件批准。
相较于需要注射给药的瑞德西韦和中和抗体药物,口服小分子药物具有更多优势,也因此成为了全球新冠药物研发的热门赛道。
新冠口服小分子特效药的优势:
1、患者耐受性高,依从性好,便于在患者感染早期就抑制病毒的增殖,避免转化为重症
2、价格低廉,莫匹那韦在美国的定价为700美元/人,仅为中和抗体的三分之一
3、便于运输,易于分发。相较于需要静脉注射的抗体药物,口服小分子药物无疑方便许多,在疫情严重、医疗条件落后的不发达国家,口服小分子抗病毒药物更为实际
从国内企业竞争情况来看,目前国内共有100多家企业参与新冠药物研发,涉及研发项目150余个。国产在研的新冠口服药有阿兹夫定、VV116、普克鲁胺、SIM0417、RAY003等10余款,涉及的上市企业包括君实生物、开拓药业、先声药业、众生药业等。
从药品研发进度看,有6款处于临床试验阶段,其中进程最快的三款为真实生物的阿兹夫定、君实生物的VV116、开拓药业的普克鲁胺。首款国产新冠口服小分子特效药基本锁定在这三款药物中。
一、研发“超速”的VV116
VV116是一款新型口服核苷类抗SARS-CoV-2药物,为一款RdRp抑制剂,可抑制SARS-CoV-2复制。目前已在乌兹别克斯坦获得紧急使用授权,这是继默沙东、辉瑞新冠口服药获批之后,全球又一个获批上市的新冠口服药。由中国科学院上海药物研究所、中国科学院武汉病毒研究所、中国科学院新疆理化技术研究所、旺山旺水生物医药有限公司、中国科学院中亚药物研发中心共同研发。
据君实生物发布消息称,VV116在一项对比奈玛特韦片/利托那韦片(即Paxlovid)用于轻中度新型冠状病毒肺炎伴有进展为重度包括死亡的高风险患者早期治疗的III期注册临床研究(NCT05341609)达到方案预设的主要终点和次要有效性终点。并发布公告称将于近期与药物监管部门沟通递交新药上市申请事宜。
其研究结果发布后,业内关于VV116临床试验的讨论和质疑也蜂拥而至。原因是其临床试验的研发过程太快了,业内认为其研究直接转到三期临床严格意义上不合规,且与从2020年就开始研究的普克鲁胺相比,VV116研发的时间相对较短。除了研发进程“超速”以外,VV116在安全性和专利方面等方面也引发了一些争议。
虽然有所争议,但君实生物表示研究已达到临床方案预设的主要终点,至少从持续临床恢复的时间这点看,VV116的疗效不亚于PAXLOVID。总的来说,其陆续公开的实验数据提振了市场对VV116后续开发的信心。
二、未批先火的阿兹夫定
阿兹夫定原本是治疗艾滋病的药物。2021年7月获批上市用于与核苷逆转录酶抑制剂及非核苷逆转录酶抑制剂联用,治疗高病毒载量的成年HIV-1感染患者,成为我国首款真正拥有自主知识产权的抗艾滋病病毒药物。
新冠疫情爆发后,真实生物开展了阿兹夫定治疗新冠肺炎的研究。从作用靶点来看,阿兹夫定作用于RdRp(RNA聚合酶),与辉瑞的Paxlovid作用于3CLpro(3C-like protease)不同,但与默沙东的Molnupiravir相似。
4月中旬,真实生物方面发布了阿兹夫定用于抗新冠病毒的部分数据。从II期临床和一部分III期临床的结果看,阿兹夫定核酸转阴时间为3-4天,平均用药时间为6-7天,平均出院时间为9天。重症与轻症治疗效果类似,对使用其它药物无效的患者同样有效,而且不像Paxlovid需要在感染新冠的早期服用。
5月12日,君实生物首次对外披露价格,据媒体报道VV116在乌兹别克斯坦的售价为185美元,约合人民币1243元。而在抗新冠病毒临床试验结果尚未发布的情况下,真实生物已为阿兹夫定敲定了三个生产经销商(华润双鹤、新华制药、奥翔药业),因此也被业内戏称“一女三嫁”。
三、一波三折的普克鲁胺
普克鲁胺原本是开拓药业用于治疗前列腺癌的第二代AR拮抗剂,新冠疫情发生后,临床试验证实该药对新冠具有治疗作用。2021年初,普克鲁胺在巴西的三期临床试验中,可将重症新冠患者的死亡风险降低92%,一度被视为“人民的希望”。后来因该项III期临床试验的中期分析未达到统计学显着性,而引起不小争议。
2022年4月,开拓药业又公布临床三期试验关键数据,特别指出“普克鲁胺有效降低新冠患者的住院/死亡率,特别是对于服药超过7天的全部患者,以及伴有高风险因素的中高年龄新冠患者达到100%保护率,具有统计学显著性”,从临床失败到100%有效,普克鲁胺在群雄竞赛中能否逆风翻盘,值得期待。
除此之外,仍处于研发早期的在研国产新冠药物还有:前沿生物-U(688221.SH)的FB2001、先声药业(02096.HK)的SIM0417、歌礼制药-B(01672.HK)的ASC10和ASC11、广生中霖/药明康德(603259.SH)的3CL蛋白酶抑制剂、众生睿创的RAY003等。
Commonwealth Fusion Systems 的研究人员对一块10吨重的D型磁铁缓慢充电并提升场强,直到超过20特斯拉(T)。这是同类磁铁的一个新记录。该公司的创始人说,这一壮举解决了开发一个紧凑、廉价的聚变反应堆过程中所面临的主要工程挑战。
几十年来,核聚变发电一直是物理学家的梦想。在远高于1亿摄氏度的温度下,就像在太阳中一样,核子融合在一起,在此过程中释放出大量的能量。如果研究人员能够在地球上以可控和持续的方式实现这些反应,那么它就可以利用几乎无限的燃料来源,提供廉价、持续、无碳的电力来源。
在其中一种方法中,磁铁被用于将离子和电子的气体,即所谓的等离子体,限制在甜甜圈形状的反应器内。更强大的磁铁意味着更少的热量损失,从而使得更多的核聚变反应可以在一个更小、更便宜的设施内发生。这种改变不仅仅是一点点:磁场强度增加一倍,产生相同能量所需的等离子体的体积就会减少16倍。
尽管过去数十年的研究已经耗费数十亿美元的投资,但还没有人建造出一个产生能量比反应堆的消耗更多的核聚变工厂。但是,Commonwealth Fusion Systems 及其支持者充满希望,其他聚变初创公司和研究工作也报告了最近的进展。
Commonwealth Fusion Systems 正在建设一个工厂,以大规模生产磁铁,并为原型反应堆奠定基础。如果一切如愿,这家初创公司计划在21世纪30年代初期向电网提供聚变能源。
单一的长期使用的密码会给自身的财产带来危机,这也是安全研究人员鼓励大家经常更换密码,且尽量为不同设备设定不同密码的原因。然而有人会说,密码设多了容易忘记,那怎么办呢?就是在这种情况下,生物识别技术应运而生。
虽然生物识别技术对提高安全性非常有用,但其变革性的好处不止于此。由于无需记忆繁琐的密码,生物识别技术可以显著改善客户体验。随着企业开始认识到基于知识的身份验证所带来的安全风险和糟糕的用户体验,多模式生物识别和验证将会被应用。
尽管如此,事情还是没这么简单的。早在2014年,德国黑客Jan "Starbug" Krissler就通过不同人的手的高分辨率照片演示了指纹是如何被伪造的,进而强调了该技术存在的潜在漏洞。
无独有偶,在苹果iPhone 5s发布后的24小时之内,Stargbug立马登上了热搜,因为他成功“欺骗”了苹果的TouchID传感器,解锁了该款手机。据了解,是通过屏幕上存在的污点,提取了指纹,进而解锁了手机。
不只是指纹识别,其实语音识别也存在一定的风险。比如,有不法分子或者黑客会有意识的记录受害者的声音,然后以此来躲开认证的控制。或许,不久之后我们还会看到一个人的脸被“逆向工程”(reverse-engineered;一种算法,只需要一些2D的图像即可完成),然后在3D打印机的帮助下,骗子们就可以带着受害者的面具四处走动,甚至从ATM机中取走数千美元。
在作者看来,也不是所有的生物识别技术的缺陷都是由外部来源发现的,与其他技术相似,随着技术的采用越来越多,越来越广泛,本质上的缺点就会变得清晰起来。举个例子,尽管在匹配准确性方面的会有所提高,但是误报仍会困扰着其实现,这是在开发、配置以及部署技术过程中很难去避免的。
但也正是在警界出现的这种误判,敦促我们要停下来思考。也许,这项技术最大的缺陷在于生物识别的细节是静态的。如果密码被盗,还有修改的机会,但是当一个饱含信息的数据库被破坏的时候,个人的指纹、虹膜或者其他面部特征是不能再被替换的。
因此,尽管生物识别技术是一项令人兴奋的新技术,但它的使用必须以一种冷静的、有计划和战略性的方式实施。比如,验证身份时,生物识别技术至少要使用其中两项;当帮助3警察追查犯罪嫌疑人时,必须要经过人类分析师来确认结果,而且,更重要的是,所有的生物识别数据必须做好存储。
日前,计算生物界的大明星AlphaFold,再度取得重大突破。它已经能够预测超过100万个物种的2.14亿个蛋白质结构,几乎涵盖了地球上所有已知蛋白质。AI的出现极大改变了蛋白质预测的模式和效率。目前各高校、企业都有相关布局,而我国相关创业公司在2017年至2021年呈现出爆发式增长,且大多都已获高融资。
在不久前,互联网巨头Meta,更新蛋白质大模型ESMFold。它可直接从单序列语言模型表示中预测完整的蛋白质结构,准确性与AlphaFold相媲美,推理速度快了一个数量级。彭健带队的国内AI创新药公司华深智药,也实现了最新突破:OmegaFold用单条序列搞定蛋白质3D结构,即便是人工设计蛋白质,也可以通过AI预测3D结构确定其功能。
一、国内计算生物学2017年-2021年呈现出爆发式增长
计算生物,本质来讲就是通过计算手段来解决生物学问题。具体来说,就是根据不同类型的生物数据(比如浓度、序列、图像等)来构建算法和模型,从而理解生物系统本身(比如分子、细胞、组织和器官等),并推进相关研究及应用的学科。
而从应用划分,目前主要落地领域包括序列分析、结构和功能分析、生物分子动力学、系统建模、进化和群体基因组学、相关性网络……
以AlphaFold2为例,它是基于基因序列预测蛋白质结构,属于结构和功能分析范畴。
可以看到的是,计算生物学属于工具性质的学科。某种程度上这决定了市面上尚不存在严格意义上的计算生物学公司,而是以AI制药、组学、精准医疗等名义出现。这一点在我国尤为明显。
目前,国内以AI制药为核心场景。不光高校机构(西湖大学生命科学研究院、北大前沿交叉学科研究院等)、互联网大厂(阿里、百度、华为等)有相关研究和布局。相关创业公司在2017年-2021年呈现出爆发式增长,且都已获高融资。这种情况同样也体现在国外。
据浦发硅谷银行《医疗健康行业投资与退出趋势》报告显示,2021年投向计算生物学公司的金额达到59亿美元(即397亿元)一年增长高达3倍,超过非计算生物学公司投资的两倍。
从商业模式上看,整个行业以2B为主导,主要为算法授权、生物资产和软件使用。我国主要为前两种,但鉴于软件平台和先锋项目能够形成技术及业务迭代闭环。
在出现大量优势自研算法后,软件平台所占比重将有明显上升。国外已开始通过打包订阅、按照使用量计费等方式对外商用其计算生物学服务。
二、AI或者深度学习的出现给计算生物带来了转机
如今这一赛道爆火的原因:首先和深度学习近年来的爆发式增长有关;其次是最近兴起的AI for Science概念,让AI在生物学领域落地的象征——计算生物学成为一种趋势。AI和传统科研结合带来的巨大潜能,有望带来一场全新的科学革命;最后是对于生物学本身,传统的实验和分析手段已难以充分开发海量生物数据,确实需要计算生物学这种跨学科,同时兼顾多个细分领域的综合性工具来解决问题。
那么,计算生物学具体能给生物学带来什么价值呢?《计算生物学深度产业报告》认为,分成科研和应用两大块。
在科研方面计算生物学最直接的作用,就是对实验的替代,甚至超越。与操作水平、 实验器具、观察水平等精度有限的传统生物实验相比,基于计算机的计算生物学不仅成本更低、速度更快,在理论上也拥有无限的计算精度和高度可复制性。在将过往经验内化在AI模型中后,计算生物学能够自动化、规模化和并行化地提出假设,让科研人员无需依赖少数天才,同时降低下游进行开发的门槛,而这将有望对行业格局带来重大影响。其次是开辟“先假设-再验证-最后优化假设”的新方式,让研发效率得到数倍提升。
早在1991年,Nature上有观点就提出,新的生物学研究方式的出发点应该是科学家先从理论推测出发,再返回到实验里去,追踪或验证理论假设。计算生物学恰好能够基于干湿循环实验,开辟“假设-验证-优化假设”的新方式,提升整体生物研发效率。
具体来说,一方面,实验室通过高通量的湿实验,在快速验证AI预测的同时,为AI模型提供大量可用的训练数据,提升AI预测模型的精度。另一方面,AI将基于自身的数据处理能力,提供能够在湿实验中验证的假设(高参考价值、甚至可实用),两者共同迭代加速。
三、精准医疗将成为计算生物学长期的重点发力方向
在AI制药领域,智能实验室已成为公司长久竞争力的重要体现。在应用方面的价值,可以按流程划分为三大类:
1、计算推演生物性质及原理
蛋白质结构预测、致病机理研究、蛋白质相互作用预测(PPI)、抗体和抗原的表位预测、基于基因组学寻找疾病成因或寻找新型的生物标志物等。
2、搭建预测及判断模型
AI制药中基于靶点的化合物性质预测(主要涉及小分子药物开发),疾病诊断/监控/治疗建模,涵盖细胞/器官/人体的生物模拟器等。
3、对生物体进行控制改造
新疗法/药物开发、精准医疗和生物制造(以合成生物学为代表)。其中新疗法/药物开发是目前落地最成熟的场景。精准医疗将成为计算生物学长期的重点发力方向,这是由于C端市场的消费意愿更为明显,且使用人体广泛、产品形态相对直接。
在这个方向上,国外已出现了基于多组学的多家布局,而国内布相关公司相对较少,且均基于基因组学进行,存在一定差距。
四、如今计算生物学瓶颈
可以预见的是,计算生物学未来的产业链将会是以数据提供商为底层支撑+上层各类相关从业公司(包括提供计算平台和软件、分子建模/机器学习框架、算力以及智能实验室的企业)的结构构成。
《计算生物学深度产业报告》认为,眼下,要想实现以上期待,年轻的计算生物学还有着以下几大关键瓶颈待突破——有的问题为该行业独有,也有的是整个AI科学领域都存在的:
1)对生物底层原理的明确
目前,我们还有大量关于生物学本身的底层机制待研究透彻,在进行模型构建、生物验证及人体落地时,需要引入这次知识来减少不符合领域认知的偏差,保证准确率。
2)统一的计算和数据框架
基于微观手段,一些生物学上的特定问题能够得到解决,但要最终落地,所需的模型需要能够覆盖多组学数据、多环节及功能并行。此外,需要保证计算生物学中的多种异构数据,例如图像、视频、分子图谱、DNA 代码、基因表达、电信号等,有明确的标准和通用格式,以便在不同算法和平台之间互操作。
3)消费级数据的获取
在分析师看来,基因组学相关的计算生物学,其关键的产业发展阶段是数据采集达到了消费级水准。
4)工程落地能力
目前学术上有很多机器学习算法和模型已经相当成熟,关键是如何在具备底层数据的情况下,加入对生物学的具体理解,进行精细地调整。最后就是数据隐私的问题,以及如何让相关模型具备可解释性,取得这一特殊行业的信任问题。
像比特币这样的加密货币需要使用大量的电力。2021年,比特币网络消耗了超过100太瓦时,比芬兰的年度能耗还要多。
权益证明提供了一种建立不需要耗能太多的网络的方法。如果一切按计划进行,世界第二大加密货币、运行各种应用程序的以太坊将在2022年上半年过渡到这种模式。预计这一转变将减少99.95%的能源使用。
加密货币在区块链上运行,通过交易产生的数字账本,其安全性必须得到保证,防止作弊者、欺诈者和黑客入侵。比特币和以太坊目前使用工作量证明算法来确保安全:“矿工”解决加密难题,从而竞争验证新交易区块的权利。成功的“矿工”会获得加密货币作为他们工作的奖励。工作量证明意味着寻找数学难题的解决方案,这需要大量的计算能力,因此也需要电力。
有了权益证明,验证者不必相互争夺并在能源和计算硬件上投入巨大。相反,他们的加密货币缓存或权益,允许进入一个抽奖活动。那些被选中的人获得了验证一组交易的权力(并因此获得更多的加密货币)。在一些网络中,表现出不良行为的验证者会受到惩罚,从而失去一部分权益。
2021年4月,一个阳光明媚的下午,可再生能源打破了加州主要电网的记录,提供了足够的电力来满足94.5%的需求。这一时刻被誉为低碳化道路上的一个里程碑。但是,当太阳落山,微风停止,会发生什么?
处理可再生能源带来的波动式电力生产需要廉价的存储,时间为数小时甚至数天,新型的铁基电池可能能够胜任这一任务。
总部位于俄勒冈州的ESS公司,其电池可以储存4至12小时的能量,它在2021年推出了其第一个电网规模的项目。总部位于马萨诸塞州的 Form Energy 公司在2021年筹集了2.4亿美元,其电池可储存电能长达100小时,它的第一次安装将是在明尼苏达州的一个一兆瓦的试验工厂,预计将在2023年完成。
这两家公司都选择使用铁基电池,而铁是地球上最丰富的材料之一。这意味着他们的产品最终可能比其他电网存储候选者,如锂离子电池和钒系液流电池更便宜。
Form Energy 公司表示,其电池最终的成本可能仅为每千瓦时 20 美元,甚至低于未来几十年对锂离子电池的乐观预测。
但是,仍有一些挑战需要解决。铁基电池的效率通常很低,这意味着投入其中的相当一部分能量无法被回收。另外,副反应也会随着时间的推移而使电池退化。但是,如果铁基电池能够以足够低的成本被广泛部署,它们可以帮助更多人使用可再生能源供电。
在疫情成为新常态的大背景下,如何投资技术,成为企业管理者关切的问题。时值年末,市场调研机构Gartner即会就来年的“重要战略科技趋势”发表预测,为其最重要的年度报告之一,告知企业管理层、IT从业者和政府人员应对未来的投资动态和技术风险,同时指导技术和投资方向。
人工智能(AI)在Gartner给出的技术趋势预测中颇具分量,涉及到AI工程化(AI Engineering)、超级自动化(Hyperautomation)、生成式AI(Generative Artificial Intelligence)、自治系统(Autonomic Systems)等。
其中,生成式人工智能技术位列Gartner技术趋势预测的首位,是最引人注目和的人工智能技术之一。Gartner预计到2025年,生成式人工智能将占所有生成数据的10%,而目前这一比例还不到1%。
所谓生成式AI,Gartner解释称,通过各种机器学习(ML)方法从数据中学习要素,进而生成全新的、完全原创的、真实的工件(一个产品或物品或任务),这些工件与训练数据保持相似,而不是复制。
生成式AI的好处是什么?市场调研机构Gartner高级研究总监高挺解释,生成式AI不仅仅可以判断、还可以创造,实际上AI当前最大的用途就是判断,意味着AI的用途将有结构性变化。
“以前我们是让AI不停的去做判断、去做分类。比如说:AlphaGo,你告诉我下一步棋该怎么走?叫它做判断。或者把一张照片给一个AI的模型说:你帮我分辨一下这是不是张三,或者是这张照片是不是一张猫的照片。”高挺告诉界面记者,“是我们会发现,在未来的这段时间里面,它很多时候是需要AI不再去进行判断,而是说,“来帮我生成一段代码,这个代码所做的事情是从‘1’加到‘100’,那么AI也能自动生成这个代码了。”
高挺还举例称,可以利用已有的数据做出一个模型之后可以生成更多的“合成数据”,这些合成数据就像人脸一样,从肉眼角度看不出这张人脸有任何问题,但是其实这个人是目前世界上60亿人口里面不存在的一个、看上去跟真人一模一样的人。
Gartner称,生成式AI从数据中学习内容或对象,并运用数据生成全新、完全原创的新内容,可以下一代的自动编程、药物开发、视觉艺术、社交、商业服务、工程设计与流程。同时,它可以被用来检测欺诈、虚假信息和身份盗窃。但此外,尽管谷歌、Meta、微软等科技公司投入最多资源在生成式 AI,但也必须防范诸如深度伪造(Deepfake)的滥用。
生成式AI外,Gartner还指出,在明年,AI工程化这一趋势也将得到产业关注。人工智能的工程化即是将数据搜集、数据处理、建模、分析,到报表产生全部以SOP(标准作业程序)方式处理,看似简单的工作却对数据科学家带来极大帮助。
“AI工程化其实并不只是一个技术问题,它很多时候是一个流程性的问题。”高挺称,根据统计,数据科学家在处理数据工程时最费时的工作是数据处理,占比75%,只剩下25%时间可以定义与解决问题,大幅降低企业解决陌生问题的能力。最新的AI工程可以融入产业专业知识(Domain Know-How)。Gartner认为,直到2025年,约有10%运用AI工程的企业能在业务上取得3倍以上回报率。
“在2020年、2021年,经济都受到了不同程度的影响。在如今疫情变成新常态的状况下,很多CEO都希望在2022年他们企业的业绩会有一些反弹,或者说是能够所谓‘赢回’他们损失的收入。”高挺引用Gartner的一份CEO调查报告称,"增长"、“数字化”和“效率”将是来年企业管理者的三个关键词,因此,新一年的技术趋势均与此有关,AI技术外,新的技术趋势还包括隐私增强计算、云原生平台等。
“如果说去年的技术主线是‘新冠疫情的影响下世界发生了怎么样的变化’,今年的则是新冠疫情差不多已经过去了或者说已经成为一种新常态了,如何应对这种新常态,不管是中国还是西方,区别只是大家处理的方式不一样。”高挺表示,在新常态下,居家办公成为主流,在此情况下,企业需使用技术手段追回疫情下损失,以及如何在新常态下创造出新模式,保证企业长久生存,成为来年技术叙事的主要逻辑。
RTS,S是首款获得世界卫生组织批准的疟疾疫苗,自2021年10月起在非洲疟疾传播的中、高风险地区5月龄以上儿童中使用。
疟疾是严重危害人类健康的全球三大传染病之一。随着青蒿素等各类抗疟药的临床耐药性问题日益增长,目前全世界仍有近一半人口面临疟疾感染风险,致死性最强的恶性疟疾原虫每年造成两三亿的感染病例。21世纪以来,全球每年约有10个疟疾疫苗项目获批开展临床试验,约150项已完成或提前终止临床试验。
迄今为止,疟疾疫苗RTS,S是唯一被证明可降低疟疾患儿临床发病率和死亡率的疫苗。疟疾疫苗RTS,S仅在接种4剂后的一年内对5—17月龄儿童具有较高的保护率,随后免疫保护率快速下降,接种一年半后平均保护率已低于30%。作为疟疾疫苗研究领域零的突破,疟疾疫苗RTS,S具有重大的现实意义,世界卫生组织预期在未来每年可以挽救数万名5岁以下非洲儿童的生命。
疟疾疫苗RTS,S并没有达到世界卫生组织官方标准,即保护率大于50%,保护时间大于一年,因此如何有效遏制疟疾在热带、亚热带等国家和地区的流行与传播,依然是全球疟疾研究人员亟需解决的科学问题。
由于疟原虫生活史包括肝(细胞)内期、红(细胞)内期和蚊期等复杂的生长时期,恶性疟原虫具有高度变异的抗原蛋白和多变的免疫逃逸策略,这既限制了国内外疟疾疫苗的研发,同时也导致疟疾疫苗RTS,S并不完美的主要原因。
近年来,随着多种新型基因编辑技术在恶性疟原虫关键生物标志物功能鉴定中的广泛应用,研究人员针对恶性疟原虫不同生长时期设计多价疫苗成为可能。同时与传统疫苗相比,新兴的信使核糖核酸疫苗技术、疫苗佐剂和抗原递送系统的技术革新,也将为疟疾疫苗研究提供更多的潜在方案,使新一代高效疟疾疫苗研发有望在未来5—10年内取得关键性突破。
工业革命以来,人类活动大量排放二氧化碳(CO₂)等温室气体,温室效应持续加强,导致全球平均气温不断升高。
实际上,即使全世界达到了碳中和,由于工业革命以来人类已经排放了超过万亿吨的CO₂,如果仅仅依靠自然过程,大气中CO₂浓度降低至工业革命前的水平也将是一个非常缓慢的过程。
作为一项利用工程系统从大气中去除CO₂的技术,直接空气碳捕获(Direct Air Capture,DAC)技术的大规模应用对于有效降低大气中CO₂浓度,遏制气候变化具有重要意义。该技术主要利用引风机将空气抽入,通过吸附、吸收或膜分离装置捕集CO₂,并将CO₂排回大气,而捕获的CO₂可以进行封存或利用,整个过程可以理解为一种工业“光合作用”。
不同于针对工业固定源的CO₂捕获技术,DAC技术可以部署在世界上任何有电力供应的地方,选址更灵活,且可以模块化建设。
DAC技术在除碳方面具有明显的技术优势,但目前高昂的运行成本仍是限制其大规模应用的关键因素。近期,美国加州大学伯克利分校的研究人员对其发展前景进行了展望,并提出了适于该技术发展的政策路线图。他们认为DAC技术的全球推广不能依赖市场杠杆效应,而应通过持续的“财政激励+强制部署”政策推进其大规模部署。从技术角度来看,DAC技术发展的关键在于高效低成本的碳捕集材料与工艺系统的研发,其商业化应用仍然需要依靠技术进步来大幅降低运行成本。
近年来,欧美发达国家已陆续开展DAC技术的研发与应用,通过材料与技术的进步不断降低运行成本。2021年8月,美国能源部宣布拨款2400万美元支持DAC技术,一些比二氧化碳捕获工厂Orca更大型的“除碳工厂”也正在建设中。这些先行工作可能使发达国家更早掌握前沿技术和核心知识产权,并为未来获取经济效益抢得先机。
新冠肺炎病毒仍在全球蔓延,在所有对 COVID-19呈阳性反应的鼻拭子中,约有两百个被送到基因测序机中进行额外分析。这样做的目的是为SARS-CoV-2病毒的基因组创建一个新的地图,并看看有什么变化。这个地图共有30000个左右的字母组成。
这样的基因监测使科学家能够迅速发现并警告新的变体,如阿尔法(a)、德尔塔(δ)
和最近的奥密克戎(Omicron)。这是一项史无前例的工作,它使SARS-CoV-2成为历史上被测序最多的生物体,超越了流感、HIV,甚至我们自己的人类基因组。像GISAID和 Nextstrain这样的开放数据库已经显示了超过700万个病菌的基因图谱。
Omicron是迄今为止变异程度最高的变种。2021年11月,南非的一个实验室在其测序仪发现了一个有50多个变异的病毒基因组,并首次发出警告信号。几乎在瞬间,西雅图、波士顿和伦敦的计算机都在使用这些数据进行预测:Omicron是个麻烦,它是一个可能逃避抗体的变种。
测序仪还不能告诉我们的一件事是,SARS-CoV-2接下来究竟会如何演变。这就是为什么有人说我们应该更密切地追踪这个病毒。大部分的序列是在英国、美国和丹麦等地产生的,但是在没有测序能力的地区,病毒仍然可以在不知不觉中演变。幸运的是,南非在发现Omicron和追踪其传播方面的快速工作为全世界提供了早期预警。
一、案例概述
某药学院初始于2021年,药物分子研发是一个非常复杂且非常耗时的过程,药物分子筛选只是前期流程中的一个环节。如寻找跟蛋白病毒酶结合的小分子,由于存在不同种类或研究机构的配体(小分子)库,配体(小分子)库数量巨大,每个配体库的配体数量成千上万(甚至更大),通过实验方式测试验证是不切实际的。通过计算机数值模拟进行筛选,对不同配体的结合效果进行打分,筛选出分数高且结合模式合理的一些配体作为候选药物进行实验验证,能够有效的加速药物研发进程。
由于配体库数量巨大,在有限时间内完成筛选,同样挑战巨大。例如,配体库有10000个候选配体,每个配体平均处理时间为1.5小时,总共需要15000 个小时(625天)。因此,为在规定时间内算完,需要具备以下条件:
1)拥有强大算力的计算平台
2)大容量存储,用于存放处理数据和计算结果
此外,为了保证筛选计算能够高效、顺利完成,还需要计算服务,包括:
1)集群软件运行环境,保证在多机环境软件下运行,以及数据访问
2)能够支持多任务在多机环境下并发处理的并行方案
除计算平台外,药物筛选还需要高性能应用软件。药物筛选模拟计算包括Docking和分子动力学计算:其中Docking 耗时相对较小,常用于大量配体的初步筛选,主要软件有dock6、Autodock Vina、Glide等。分子动力学模拟计算比较耗时,测试作用的时间变化,用于对Docking初选结果进一步分析,主要软件有Gromacs,Namd,Amber等,使用GPU加速效果一般比较明显。
二、方案与价值
药物小分子研发需要强大算力的高性能集群,获取这些计算资源和服务成为当下的重中之重。清华大学药学院搭建了四台A100液冷服务器、9台CPU服务器、两台高通量液冷服务器,为高性能计算环境提供基础的计算平台。
使用DOCK6 处理配体(小分子)库的对接案例时,在一个文件夹中,如mol2,存放大量的小分子文件,每个小分子处理流程是一样的,均需要与相同的受体(如病毒蛋白酶)进行计算。这时需要在短时间内提供大量GPU和超算产品,以及全天候的技术支持。搭建开放共享平台,使用高性能计算集群,用于药物研发的分子对接、分子动力学模拟、深度学习模型训练,把需要几天的计算工作缩短到几小时,速度提升8到20倍。同时为各研发老师创建不同的子账户,实现计算资源共享和数据共享。为高性能计算环境提供基础的计算平台,要实现高效的药物筛选,还需要高通量任务解决方案。
三、总结
该药学院药物研发需要强大算力的高性能计算集群,如药物筛选需要进行大量小分子的Docking处理。药学院老师可以利用蓝海大脑高性能液冷服务器,快速构建高性能集群,获取高性能的计算实例,满足算力的需求。同时提供高通量任务处理的解决方案,使得药物筛选在多计算节点、多核上并发处理,降低任务整体执行时间。