bioconvert:各种各样的生物信息数据格式转换工具

今天找计算测序覆盖度的时候发现了这个工具,github 主页是https://github.com/bioconvert/bioconvert;帮助文档的链接是 https://bioconvert.readthedocs.io/en/master/

关于各种各样的文件格式 可以参考下图

image.png

看帮助文档的时候还发现他可以直接下载测序数据

下面我们尝试一下

内容主要来自 https://bioconvert.readthedocs.io/en/master/tutorial.html

首先是安装

使用conda 先新建一个虚拟环境

conda create -n bioconvert

启动环境
conda activate bioconvert

安装

conda install python==3.6

pip install bioconvert

这里遇到了报错,忘记截图了,我是把pandas安装了一下
conda install pandas

然后运行pip命令

pip install bioconvert==0.4.3 -i https://pypi.tuna.tsinghua.edu.cn/simple

这边应该是安装成功了

查看帮助文档bioconvert --help

报错

查了一下是python版本需要大于3.6,我刚好安装的是3.6
重新安装一下python

将整个虚拟环境删除然后重新安装

conda remove -n bioconvert --all

重新安装

conda create -n bioconvert python=3.7
conda activate bioconvert
pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install bioconvert==0.4.3 -i https://pypi.tuna.tsinghua.edu.cn/simple

这下没有报错,但是遇到了很多警告信息,暂时不管了

试一下,NCBI下载了一个genbank文件,线板fasta格式的序列提取出来 https://www.ncbi.nlm.nih.gov/nuccore/FN433596

bioconvert genbank2fasta staphylococcus_aureus.gb

使用命令的时候会跳出来很多警告信息

接下来又尝试了 from sources 的安装方法

image.png

这套命令运行下来 依然有一个警告信息,但是比之前少了很多

image.png

帮助文档里还提到了使用conda直接安装,但是我这边就一直没有成功,暂时不知道什么原因

最后再试一下gb文件中提取fasta文件

bioconvert genbank2fasta sequence.gb output.fasta

image.png

这次成功了 输出的HHH是哈哈哈哈的意思吗 哈哈哈哈

欢迎大家关注我的公众号

小明的数据分析笔记本

小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!

你可能感兴趣的:(bioconvert:各种各样的生物信息数据格式转换工具)