图机器学习的任务可以分为四个类型:
典型的图机器学习任务有:
n o d e l l e v e l nodel\ level nodel level应用实例: P r o t e i n F o l d i n g Protein\ Folding Protein Folding
蛋白质有一些列氨基酸组成,氨基酸之间相互作用,在局部形成类似螺旋、薄片的形状,这些形状折叠起来称为更大尺度的三维蛋白质结构。
所以需要做的是:仅基于蛋白质的氨基酸序列,来预测蛋白质的三维结构。
这一直以来都是一个难以完成的任务;最近 A l p h a F o l d AlphaFold AlphaFold的提出,解决了 P r o t e i n F o l d i n g Protein\ Folding Protein Folding问题。
其关键思想是:构建 S p a t i a l g r a p h Spatial\ graph Spatial graph
通过对 S p a t i a l g r a p h Spatial\ graph Spatial graph的学习,搭建深度学习模型,预测节点(蛋白质氨基酸序列)在空间中的位置,从而预测蛋白质的三维结构。
e d g e l e v e l edge\ level edge level应用实例: D r u g S i d e E f f e c t s Drug\ Side\ Effects Drug Side Effects(药物副作用)
在现实生活中,许多病人会同时复用多种药物以治疗疾病,不同的药物之间相互复用可能会导致一些副作用。然而因为有很多的药物,所以很多药物组合的副作用还未知晓。
所以需要做的是:给定一对药物,预测其可能的不良副作用。
现有的研究已有通过 B i o m e d i c a l G r a p h L i n k P r e d i c t i o n Biomedical\ Graph\ Link\ Prediction Biomedical Graph Link Prediction对该问题进行了求解。
其思想是构建一张只包含两种类型的异构网络图:
如下图:
对于某两个药物,如 S i m v a s t a t i n Simvastatin Simvastatin和 C i p r o f l o x a c i n Ciprofloxacin Ciprofloxacin,我们可以预测一起服用时,分解肌肉组织的可能性有多大。其实就是这两个药物之间存在 r 2 r_2 r2边的可能性;如下图:
S u b g r a p g − l e v e l Subgrapg-level Subgrapg−level应用实例: T r a f f i c P r e d i c t i o n Traffic\ Prediction Traffic Prediction(交通预测)
如地图软件上的到达目的地的路线长度、耗时的预测。
此问题可以将公路网络作为一张图:
G r a p h l e v e l Graph\ level Graph level应用实例: D r u g D i s c o v e r y Drug\ Discovery Drug Discovery(药物发现)
一些抗生素可以表示为一些小的分子,而分子可以表示成一张图:
接下来搭建一种图神经网络图分类模型,输入一组候选分子结构图,从候选分子中预测有希望是抗生素的分子。
即通过 G r a p h Graph Graph来判断该分子是否含有某种属性,如判断该分子结构图中是否有两个环。
G r a p h g e n e r a t i o n Graph\ generation Graph generation应用实例: G e n e r a t i n g n o v e l m o l e c u l e s Generating\ novel\ molecules Generating novel molecules(生成新分子)
如构建一个图生成模型,学习现有的分子模型,从而生成一个新的具有某种属性的新分子(如耐高温属性)
G r a p h e v o l u t i o n Graph\ evolution Graph evolution应用实例: P h y s i c a l s i m u l a t i o n Physical\ simulation Physical simulation
通过构建一整物理模拟图:
接下来构建一个模型,根据例子当前的位置、领域粒子的关系,来预测图将如何演变。