上传序列数据到SRA

笔记内容:

  • SRA是什么,点解要向它上传序列数据
  • 上传之前的准备
  • 如何上传

SRA是什么,点解要向它提交序列数据

SRA官方document.
Sequence Read Archive (SRA) 存储了NCBI上各研究所用到的序列数据。许多文献都可以看到一个SRAID,根据这个ID可以找到并且下载文章数据的原始序列。这里是讲如何上传数据。

上传到SRA,使研究的原始数据得以共享,有利于研究的重复及新发现的挖掘。一般文章中只要用到了高通量测序得到的数据,要需要将数据提交到SRA,并获得一个SRA编号。

上传之前的准备

包括注册BioProject和Biosamples, 上传SRA metadata等

注册一个NCBI账号,登录:SRA Submission Portal Wizard,
新建一个submission, 参考这个连接逐步上传。

在 Submission Portal总览提交各个步骤的信息,如下所示:

上传模板参考这个连接:

templates

如何上传

  1. Submitter (contact information of submitter)
  2. General info (general information of submission)
  3. Project info (project title, public description, registered or not)
    project-info
  4. BioSample type (best description of sample type; 16S rDNA as follow)
biosample-type
  1. Biosample attributes (attributes table according to sample type selected in step 4)
biosample-attr
  1. SRA metadata (metadata of your data, see instructions in templates)

    sra-metadata

  2. files (upload sequence files)

file-upload

Also there are options to preload data could be found here.

注意:

  • 选择 preload 如果需要提交超过10GB的数据或超过300个文件。所有要提交的东西必须在一个文件夹里。
  • 如果有超过1000个samples需要提交,则建多个submissions来提交,只要在同一个Bioproject下就可以。
  1. Review & submit

上传完成后,注意查收SRA官方的反馈邮件。而且可以在提交的protal page: manage section中管理自己的提交。

manage-data

附:
SRA Submission Portal Wizard
: https://submit.ncbi.nlm.nih.gov/subs/sra/

SRA official document
: https://www.ncbi.nlm.nih.gov/sra/docs/submitportal/

Submitting data to the NCBI Sequence Read Archive
: https://rachaellappan.github.io/SRA/

Submitting Read Data to NCBI SRA
: https://github.com/faircloth-lab/protocols/wiki/Submitting-Read-Data-to-NCBI-SRA

你可能感兴趣的:(上传序列数据到SRA)