文献SRA序列号序列下载界面的一些信息

在阅读文献是看到一些SRA原始数据号码及其对于网址,那么这些原始数据该如何下载呢。


文献SRA序列号序列下载界面的一些信息_第1张图片
文献中的原始数据SRA数据库的sra号码

点击相应的链接即可进入NCBI网站SRA数据库,如下图:

文献SRA序列号序列下载界面的一些信息_第2张图片
SRA数据库中要下载数据的界面

如上图所示,下载界面分了几类以及相应的编号,这其中就涉及到了提交SRA数据时的一些信息了。
SRA 是 Sequence Read Archive 的首字母缩写。SRA 与 Trace 最大的区别是将实验数据与 metadata(元数据)分离。metadata 是指与测序实验及其实验样品相关的数据,如实验目的、实验设计、测序平台、样本数据(物种,菌株,个体表型等)。metadata可以分为以下几类:

Study:accession number 以 DRP,SRP,ERP 开头,表示的是一个特定目的的研究课题,可以包含多个研究机构和研究类型等。study 包含了项目的所有 metadata,并有一个 NCBI 和 EBI 共同承认的项目编号(universal project id),一个 study 可以包含多个实验(experiment)。
Sample:accession number以 DRS,SRS,ERS 开头,表示的是样品信息。样本信息可以包括物种信息、菌株(品系) 信息、家系信息、表型数据、临床数据,组织类型等。可以通过 Trace 来查询。
Experiment:accession number 以 DRX,SRX,ERX 开头。表示一个实验记载的实验设计(Design),实验平台(Platform)和结果处理 (processing)三部分信息。实验是 SRA 数据库的最基本单元,一个实验信息可以同时包含多个结果集(run)。
Run:accession number 以DRR,SRR,ERR 开头。一个 Run 包括测序序列及质量数据。
Submission:一个 study 的数据,可以分多次递交至 SRA 数据库。比如在一个项目启动前期,就可以把 study,experiment 的数据递交上去,随着项目的进展,逐批递交 run 数据。study 等同于项目,submission 等同于批次的概念。

你可能感兴趣的:(文献SRA序列号序列下载界面的一些信息)