SRA数据库的各种编号

S R A 数据库, 最初的命名为Short Read Archive,现已改为SequenceRead Archive。

SRA 数据库的组织架构
1,meta 数据是指与测序实验及其实验样品相关的数据, 如实验目的、 实验设计、 测序平台、 样本数据(物种, 菌株,个体表型等),在SRA数据库中,meta数据分如下层次来存储:
(1)研究课题(study)。 在 SRA 数据库中, 研究课题的检索号(accession number)以前缀 DRP, ERP 或S R P 开头。 
(2)样本信息(sample)。 样本的检索号以前缀 DRS, ERS 或 SRS开头。 样本信息可以包括物种信息、 菌株(品系)信息、 家系信息、 表型数据、 临床数据, 组织类型等。 

(3)实验信息(experiment)。实验的检索号以前缀DRX, ERX 或 SRX 开头。 实验是 SRA 数据库的最基本单元, 就像 PubMed 数据库的每一篇文献是 PubMed数据库的基本单元一样。 一个实验隶属于某个研究课题, 对一个或多个样本进行测序, 产生的测序数据以 r u n s 的形式存储于 S R A 。 

2,序列数据
包括序列及其质量信息等, 在 SRA 数据库中以run 为单元存储。 run 的检索号以前缀 DRR, ERR 或SRR 开头。 

3, S R A 数据库中的测序数据来自四个测序平台
分别为: Roche_LS454,Illumina,ABI_SOLID和HELICOS。

 



你可能感兴趣的:(RNAseq)