DDBJ数据库:宏转录组测序数据下载

导读

1. DDBJ数据库简介

  • DDBJ(DNA Data Bank of Japan)是与NCBI的GenBank,EMBL的EBI数据库齐名的世界三大DNA 数据库之一。DDBJ由日本研究机构于1983年建立。DDBJ数据库不仅已经收录了20多万个研究的600多万样本的测序数据,而且现在还保持每日更新。
    DDBJ数据库地址:https://www.ddbj.nig.ac.jp/index-e.html

2. DDBJ数据库收录的数据有:

  • 人、动物、植物、土壤、水体等样本的基因组、转录组、表观组、外显子组、宏基因组、宏转录组等多组学数据。


    1.png

如何从DDBJ中获取宏转录组测序数据?

  • 方法一:进入DDBJ寻找任意感兴趣的组学数据(不做介绍)。
  • 方法二:根据文章中提供的DDBJ DRA编号进行数据检索和下载,过程如下:

1. 第一步:

  • 在宏转录组相关研究的文章中的Data availability处找到metatranscriptome data的DDBJ DRA编号,例如:


    2.1.png

    2.2.png

2. 第二步:

  • 打开DDBJ数据库,点击进入Sequence Read Archive (DRA)。


    3.png

3. 第三步:

  • 点击进入Search。


    4.png

4. 第四步:

  • 在Accession中输入DRA编号(例如:DRA006303),点击Search。


    5.png

5. 第五步:

  • 选择一个Run (如:DRR110568),点击进入该Run的FASTQ目录,右键鼠标复制DRR110568_1.fastq.bz2和DRR110568_2.fastq.bz2的下载链接。


    6.png

6. 第六步:

  • 在Linux环境中下载,解压fastq文件。

6.1 下载

nohup wget ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/fastq/DRA006/DRA006303/DRX103657/DRR110568_1.fastq.bz2 &
nohup wget ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/fastq/DRA006/DRA006303/DRX103657/DRR110568_2.fastq.bz2 &
7.png

6.2 解压

nohup bzip2 -d DRR110568_1.fastq.bz2 &
nohup bzip2 -d DRR110568_2.fastq.bz2 &
8.png

结束语

这样我们通过DDBJ数据库获得了一个样本的宏转录组测序的fastq文件。

\color{green}{原创文章,码字不易,转载请注明出处}

你可能感兴趣的:(DDBJ数据库:宏转录组测序数据下载)