Prototype-Based Compound Discovery Using Deep Generative Models

Shahar Harel,Kira Radinsky
Molecular Pharmaceutics 2018
IF = 4.7

简介
一般情况下,条件生成指传统上给定一些外部属性来确定一个条件分布,然后从分布中采样生成。在文章设计的PDDN模型中,模型并不取决于外部属性,而是希望研究者能够为模型提供一个已知的原型分子,代表所需的外部属性,并依靠这个原型来进行条件生成。

分子生成的目标是创建一个不同于原型分子的分子m。文章希望能探索原型分子周围的化学空间,因此,在生成过程中,文章模型引入了一个多样性分量,该分量用来噪声处理对隐藏向量z进行采样的多维高斯参数。这一过程由多样性层(diversity layer)实例化,多样性层以编码器的输出为中心加上一个较大的方差来采样。若编码器输出为均值向量μ和标准差向量σ,从参数为D的多维高斯分布 [n∼N(O,D)]采样的随机噪声样本n,那么多样性层的输出为:


最终的模型结构如图,相比于原始的VAE模型,PDDN模型主要的改变就是这个多样化层。在训练期间,多样性参数D被设置为1。因此,z实例是从计算参数所建议的非多样性分布中抽取的。在生成时调整此参数允许模型探索原型周围的空间。


在生成过程中,首先输入一个原型分子,而不是从先前的直接从高斯分布中进行采样。这样从具有参数化多样性的原型特征分布中取样,形成原型隐表示,作为解码器的输入,最终生成的分子在具有和原型分子较为接近的性质的同时也具备较高的多样性。
个人总结
使用原型分子取代传统的条件生成,减去优化调整隐空间向量的麻烦;多样性层的实现可以提升模型生成分子的多样性。

你可能感兴趣的:(Prototype-Based Compound Discovery Using Deep Generative Models)