可从文献、图片、PDF等提取化学结构的开源软件

我们经常会遇到需要从文献、图片、专利中提取化学结构的情况,要是自己一个一个去画比较费劲,参考网上资料有几个开源的软件可供大家选择使用。

  1. OSRA
    这是第一个可识别90多种的图形格式的软件,将其转换为smiles或SD格式。参考文献https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2889020/

    该软件很贴心的提供了在线预测服务,网址:https://cactus.nci.nih.gov/cgi-bin/osra/index.cgi
    使用方法:打开文档,点击submit,识别的图片会出现在右边,当然有时候识别不准确,需要手动修改,修改好后保存SMILES或SD格式。
    可从文献、图片、PDF等提取化学结构的开源软件_第1张图片
    当然也提供了源码跟Windows和linux版本的,但Windows和linux版收费,没有特别需求可以使用在线预测服务。

  2. Imago
    这款软件可以下载windows或linux的有GUI或命令行模式的,下载地址为https://lifescience.opensource.epam.com/download/imago.html
    下载后使用我自己感觉不如上款软件,大家看自己喜欢用哪个吧。
    可从文献、图片、PDF等提取化学结构的开源软件_第2张图片

你可能感兴趣的:(可从文献、图片、PDF等提取化学结构的开源软件)