关于SDF介绍

来源:“分子动力学”公众号

链接:https://mp.weixin.qq.com/s/kMwnIbuiTE-LsXGYQonedQ

简单来讲,SDF文件就是一个化学表格文件。

文件扩展名:.sd,.sdf。格式类型:化学文件格式

SDF是MDL开发的一系列化学数据文件格式之一;它专门用于结构信息。“ SDF”代表结构数据文件,而SDF文件实际上包装了molfile(MDL Molfile)格式。多个化合物由由四个美元符号($$$$)组成的线分隔。SDF格式的一个功能是它包含关联数据的能力。关联的数据项表示如下:

第一行:一般作为分子名字,如 Levetiracetam
第二行:注释,ChemDraw06111413562D
第三行:一般是空行
第四行:是原子个数 键的个数等的起始行。
M END所在行结束原子个数 键的个数等信息。接着就是
属性1 属性1值

空行

属性2 属性2值

空行 (以四个美元符号结束一个分子的信息存储。)

具体例子:

Levetiracetam
  ChemDraw06111413562D

 12 12  0  0  0  0  0  0  0  0999 V2000
   -1.4405   -0.4285    0.0000 O   0  0  0  0  0  0  0  0  0  0  0  0
   -0.7260   -0.8410    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
   -0.0116   -0.4285    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    0.7029   -0.8410    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    1.4174   -0.4285    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
   -0.0116    0.3965    0.0000 N   0  0  0  0  0  0  0  0  0  0  0  0
   -0.7260   -1.6660    0.0000 N   0  0  0  0  0  0  0  0  0  0  0  0
    0.6559    0.8814    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    0.4009    1.6660    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
   -0.4241    1.6660    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
   -0.6790    0.8814    0.0000 C   0  0  0  0  0  0  0  0  0  0  0  0
    1.4405    0.6265    0.0000 O   0  0  0  0  0  0  0  0  0  0  0  0
  1  2  2  0      
  2  3  1  0      
  3  4  1  1      
  4  5  1  0      
  3  6  1  0      
  2  7  1  0      
  6  8  1  0      
  8  9  1  0      
  9 10  1  0      
 10 11  1  0      
 11  6  1  0      
  8 12  2  0      
M  END
>  <Catalog Number> (1)
A1198

>  <Item Name> (1)
Levetiracetam

>  <Formula> (1)
C8H14N2O2

>  <MolWeight> (1)
170.21

>  <CAS Number> (1)
102767-28-2

>  <Target> (1)
Cancer Biology

$$$$

某些可以导入SDF文件的程序(例如ISIS / Base)要求分子数据之后的第一个数据字段(在上面的示例中为Unique_ID)是每个记录的唯一标识符。

多行允许有多个数据项。[需要澄清] MDL SDF格式规范要求将硬回车字符插入内容超过200个字符的任何文本字段中。由于许多SMILES和InChI字符串超过该长度,因此在实践中经常违反此要求。

你可能感兴趣的:(仿真模拟,lammps,仿真,SDF,分子动力学)