生信软件9 - 多公共数据库数据下载软件Kingfisher

简介

kingfisher是一款专门用于高通量测序数据下载的工具。支持从公共数据库(ENA、NCBI、SRA、Amazon AWS 和 Google Cloud)获取序列文件及其元数据注释。其输入可以是一个或多个“Run" accession(例如DRR001970),或一个 BioProject accessions(例如PRJNA621514或SRP260223)。

软件主要两种主要模式:get 模式用于下载序列数据,annotate 模式用于下载元数据。在 get 子命令中,Kingfisher 会从一系列冗余源下载数据,直到其中一个有效数据源。下载的数据根据需要转换为SRA/FASTQ/FASTA/GZIP 文件格式,相比于NCBI的SRA工具包下载速度和提取速度更快

安装

Kingfisher可以通过conda/bioconda以通常的方式安装,例如

conda install -c bioconda kingfisher
kingfisher get -r SRR12118866 -m ena-ftp aws-http prefetch

Github地址

1. annotate 查询SRR数据

# 简略信息
kingfisher annotate -r SRR11181996 -f tsv -o ./SRR11181996.srr.list

你可能感兴趣的:(生信软件实战集合,数据库)