使用rcdk进行化合物结构聚类处理

使用rcdk进行化合物结构聚类处理

rcdk, 是在R下面集成了CDK工具包,以此来通过CDK生成的化学性质数据进行更深层次的统计分析,下面来看看在rcdk中如何进行多个化合物结构的聚类。

首先需要在R下面安装rcdk程序包,然后就可以进入命令行,进行如下操作:
>library("rcdk")   //加载包
>mols <- load.molecules("mymols.sdf")  //读取sdf文件
> fps <- lapply(mols, get.fingerprint, type="extended")  //生产fingerprint值
> fp.sim <- fp.sim.matrix(fps, method="tanimoto")   //建立矩阵
> fp.dist <- 1-fp.sim
> clustering <- hclust(as.dist(fp.dist))
> plot(clustering)

执行到这里,我们就得到了结果,如下图:

这里我选择的是50个化合物结构进行处理。是不是很方便~:)

你可能感兴趣的:(使用rcdk进行化合物结构聚类处理)