Conditional Molecular Design with Deep Generative Models

Seokho Kang,Kyunghyun Cho
Journal of Chemical Information and Modeling 2019
IF = 4.72

简介
给定分子x及其属性y,现今的分子设计模式主要有以下4种:

  • a. 传统的方法是建立一个预测模型来估计给定分子的性质。通过这个预测模型,筛选出一组可能的候选分子,然后选择具有期望性质的分子。
  • b. 这种方法将分子映射到潜在空间,再从这个空间中随机生成新的分子,这些新分子与原始集合中的分子类似。这些随机生成的分子可以作为候选分子,通过a中方法那样的单独的属性预测模型进行筛选。
  • c. 在b的基础上,把分子生成方法扩展到条件分子设计,通过使用属性预测模型找到一个密切反映目标条件的潜在表示来实现,来生成性能接近预定目标条件的新分子。
  • d. 这是同时进行性能预测和分子生成的方法,这时潜在空间和分子性质是相关的,直接在和分子性质相关的潜在空间中采样就能得到满足目标性质的新分子。这就是文章模型使用的模式。


文章建立了一个基于SSVAE的条件分子设计模型,同时进行性能预测和分子生成。预测器q(y|x)根据分子x预测其性质y,编码器q(z|x, y)得到隐向量z,解码器p(x|y, z)重构分子x。编码器和之前的无监督式模型的区别在其输入不单单是分子x,还多了x对应的性质y,解码器和之前的无监督式模型的区别在其初始输入是y和z而非初始的token和z。这样给定一组特定的属性,条件分子设计是通过直接从条件生成分布中取样新分子来完成的,而不需要任何额外的优化过程。


与VAE模型相比,SSVAE模型生成分子的效率更高,其生成的分子有效性和新颖性更高,重复率更低。
个人总结
文章使用了条件分子设计,和之前的方法不同,直接在解码过程中结合了分子的性质信息,这样省去了通过优化算法根据目标性质调整隐空间向量的步骤。另外,SSVAE模型中的y对应于分子的一组性质而不是单一性质,可以极大提高分子设计的效率,避免多目标优化的麻烦。

你可能感兴趣的:(Conditional Molecular Design with Deep Generative Models)