AlphaGo姐妹篇AlphaFold

在AlphaGo成功之后,我以为DeepMind的下一步动作是进军游戏产业,制作一个能打败所有顶尖游戏选手的程序,毕竟这个能做出来也很拉风。但是,没想到他下一步的动作是AplhaFold,用来预测蛋白质的三维结构,运用人工智能技术来助力科学发现。

在Community Wide Experiment on the Critical Assessment of Techniques for Protein Structure Prediction(简称CASP)中,AlphaFold取得了第一名的成绩,这个比赛是1994年成立,每两年举行一次,是一个全世界范围的蛋白质结构预测比赛。今年的比赛结果可以再这里看到。

那么蛋白质结构到底有什么用?我们都知道蛋白质是维持生命所必须的分子,几乎人体执行的每一项功能都可以追溯到蛋白质的移动和变化。而对于给定的蛋白质,它能做什么是依赖于其三维结构。例如,构成人体免疫系统的抗体蛋白是Y型的,类似于独特的钩子,通过锁定病毒和细菌,来检测、标记引起疾病的微生物,然后消灭他们。另外,蛋白质结构可以让我们了解它在体内的作用,帮助我们诊断和治疗由蛋白质堆叠错误引起的疾病--帕金森症、阿尔兹海默症等。但是从纯粹的基因序列中找到蛋白质结构是一项复杂的任务,蛋白质越大,其结构就越复杂。过去科学家使用冷冻电子显微镜、核磁晶体共振,X射线晶体学等手段来确定蛋白质结构。但是上述方法都需要大量反复的实验,这要花费数年的时间和大量的金钱。所以,生物学家才将目光转向AI,希望可以解决这个问题。

AlphaFold采用深度神经网络来预测氨基酸对之间的距离和连接这些氨基酸化学键的角度。他们训练了一个神经网络来预测蛋白质中每对残基距离的单独分布。 然后将这些概率组合,进而评估所提出蛋白质结构的准确度分数。 还训练了一个单独的神经网络,使用汇总的所有距离来计算预测结构与正确答案之间的接近程度。有了这些评分函数,就可以搜索蛋白质结构进行预测。

AlphaFold使用两种不同的方法来预测蛋白质的结构的物理性质,达到了高度的准确性。他们的第一种方法建立在常用的结构生物学中技术上,用新的蛋白质片段反复替换蛋白质结构的片段。 同时训练了一个生成神经网络来发明新的片段,不断提高所提出的蛋白质结构的得分。第二种方法通过梯度下降优化得分, 该技术应用于整个蛋白质链而不是在组装之前必须单独折叠的碎片,从而降低了预测过程的复杂性。

 

如果有写的不清楚的地方,请大家浏览原文。以免误导大家。

原文连接:https://deepmind.com/blog/alphafold/

 

你可能感兴趣的:(机器学习)