温馨提示,扩散模型公式比较复杂,若没有基础可以先参考blog或者deep_thoughts老师的视频
本文是由蒙特利尔学习算法研究所唐建团队于2022 ICLR 发表的一篇论文。在这篇论文中,作者受热力学粒子扩散模型的启发,提出了新的生成模型GEODIFF。GEODIFF将每个原子视为一个粒子,并学会直接逆转扩散过程。在多个基准上的实验表明,GEODIFF优于或可与现有的最先进的方法相媲美,特别是在大分子上。作者还在理论上证明了具有等变马尔可夫核的马尔可夫链可以设计出不变分布,并进一步提出了马尔可夫核的构造块来保持理想的等方差特性。
目前的方法主要通过利用中间几何变量(如原子距离、键和扭转角)来避免直接建模原子坐标,这些中间几何变量是旋转平移不变量。 因此,他们能够实现非常引人注目的性能。然而,由于所有这些方法都寻求间接建模中间几何变量,它们在训练或推理过程中都有固有的局限性。因此,理想的解决方案仍然是直接建模原子坐标,同时考虑旋转平移不变性。
作者思路
作者从理论上证明了由旋转平移不变先验分布出发,以旋转平移等变马尔可夫核演化的马尔可夫过程可以诱导出旋转平移不变密度函数。进一步提供实用的参数化来定义旋转平移不变先验分布和强加等方差约束的马尔可夫核。此外,还导出了分子构象条件似然的一个加权变分下界,该下界同时具有旋转平移不变性,可以有效地优化。
该方法有几个关键的优点:
分子构象生成任务本质上是条件生成问题,作者的目标是对于给定的分子图G生成稳定的分子构象C。
图1:GEODIFF扩散和反向过程示意图
根据固定的方差 β , . . . . , β T \beta ,...., \beta_T β,....,βT将其定义为马尔可夫链
从噪声粒子 C T p ( C T ) C^T~p(C^T) CT p(CT)开始, 给定特定的分子图 g g g, 目标是学习从白噪声 C T C^T CT中恢复构象 C 0 C^0 C0。
建立对旋转和平移变换不变的密度 p θ ( C 0 ) p_θ(C^0) pθ(C0), 形式上,设 T g T_g Tg为元素 g ∈ S E ( 3 ) g \in SE(3) g∈SE(3)的旋转平移变换,得到如下表述
Proposition 1.
这命题表明,从不变的标准密度出发,沿着等变高斯马尔可夫核的动力学可以产生不变的密度。在此基础上,给出了一种实际的基于扩散去噪框架的GEODIFF算法
Invariant Initial Density
在这种情况下,各向同性高斯显然是围绕zero CoM的旋转的不变性。通过考虑CoM-free系统,将粒子移至zero CoM可以始终确保转化不变性。
Equivariant Markov Kernels
CoM-free高斯函数保证了马尔科夫核的平移不变性。因此,为了实现命题1中定义的等变性质,只关注旋转等方差。
因此,为了保证 μ θ ( g , C t , t ) μ_θ(g,C^t,t) μθ(g,Ct,t)是旋转-平移等变的 w . r . t C t w.r.t C^t w.r.tCt。作者考虑 μ θ μ_θ μθ的以下参数化:
将问题转化为构造 ϵ θ \epsilon_\theta ϵθ为旋转平移等变,GFN以节点嵌入 h l ∈ R n × b h^l \in R^{n \times b} hl∈Rn×b(b为特征维数)和对应的坐标嵌入 x l ∈ R n × 3 x^l \in R^{n \times 3} xl∈Rn×3为输入,输出 h l + 1 h^{l+1} hl+1和 x l + 1 x^{l+1} xl+1如下
在生成过程和模型参数化之后,开始反向训练目标。由于直接优化对数似然是很困难的,通常做法是最大化变分下界((ELBO)。
下面是公式4的参数化形式:
为了使得ELBO过程具有所需要的等变性,作者提供两种方式修正观测噪音信号。第一种是alignment方式,还有一种chain-rule的方式。
下面是整个采样过程的伪代码。它逐渐地将先前的噪声位置移向平衡态,采样过程本质上是马尔可夫链。
CVGAE,GRAPHDG和CGCF等六种最新的模型作为基线。
为了测试不同模型所生成构象的质量和多样性。作者评估了建立在两原子坐标矩阵的Frobenius范数基础上的四项指标。
结果显示,GEODIFF在所有的数据集和所有的指标上都比其他的模型表现的要好。
作者使用force field(FF)对结构进行优化,并与同样使用FF进行优化的RDKIT模型进行比较,结果如表3所示。
结果表明GEODIFF+FF有着优越的多样性(Recall metrics)同时显著地提高了准确率(Precision metrics)。