refgenie:参考基因组下载商店

http://refgenie.databio.org/
Here we provide a web interface and a RESTful API to access genome assets for popular reference genome assemblies.

  • refgenie提供了人、鼠等常见物种的参考基因组以及注释文件等信息(fasta、gtf...)以及常用fastq比对工具的(star、hisat2...)索引文件。


    部分物种
  • refgenie不仅提供了网站点击下载方式,也可以通过linux命令行的方式,下载并且管理我们的参考数据,在下载以及使用中大大提高了效率。以下简单总结下,基于命令行的下载、管理refgenie参考数据的用法。


    部分参考数据类型

1、安装

pip install --user refgenie
#or
conda install refgenie

2、准备

mkdir ~/refgenie
refgenie init -c ~/refgenie/genome_config.yaml
#之后下载的数据基本都要使用 -c参数 用于指定genome_config.yaml文件路径

#列出所有的genome/asset
refgenie listr -c ~/refgenie/genome_config.yaml
#列出指定物种类型的所有数据类型
refgenie listr -g hg38 -c ~/refgenie/genome_config.yaml

3、pull下载指定的genome/asset

refgenie pull hg38/fasta -c ~/refgenie/genome_config.yaml
refgenie pull hg38/gencode_gtf -c ~/refgenie/genome_config.yaml
refgenie pull hg38_cdna/salmon_index -c ~/refgenie/genome_config.yaml

#列出本地已经下载的参考数据
refgenie list -c ~/refgenie/genome_config.yaml
refgenie list -g hg38 -c ~/refgenie/genome_config.yaml

#返回已经下载的genome/asset的路径,这在批量化的脚本文件中十分有用
echo $(refgenie seek hg38/fasta -c ~/refgenie/genome_config.yaml)

refgenie还可以建立比对索引文件,就不深入学习了,详见帮助文档:http://refgenie.databio.org/en/latest/

你可能感兴趣的:(refgenie:参考基因组下载商店)