TCGA barcode -- TCGA ID 中每段字符代表什么?

开门见山,直接上图


TCGA barcode

TCGA barcode 是TCGA项目中生物样本数据的主要标识符,接触过TCGA数据的人想必对这一串由数字、字母和短横线所组成的字符并不陌生,那么这一串数字的每一部分到底代表着什么呢?

接下来结合上下这两张图我们来看一下每一部分到底代表什么?

Creat barcode

TSS

样本机构来源,大学或其他研究组织,详见 Tissue Source Site Codes。

BCR

BCR Batch Codes (BCR: Biospecimen Core Resource),有点像项目类型或者说癌症类型,一个编号对应一个项目类型的样本集。

Participant

项目参与者,指样本来源于该项目的哪个人,每个人都有唯一的编号,所以TCGA-xx-xxxx就是代表病人水平的ID。取任何字母数字值。

Sample

代表样本组织来源类型,肿瘤类型为01-09,正常类型为10-19,对照组为20-29。有关示例代码的完整列表,请参见 Sample type。

Vial

应该是把样原始本分成了若干份,每份也都有编号。取 A 到 Z。

Portion

100-120毫克样品份的顺序,额。。可能又把每份样本又分为几份吧,之后就用于具体的测序了。取01-99。

Analyte

分析物,是分析DNA还是RNA等,详见 Portion / Analyte Codes。

Plate

96孔板序列中板的顺序。取4位字母数字值

Center

将接收等分样品进行分析的测序或表征中心,详见 Center Codes

参考: TCGA Barcode、TCGA Code Tables


觉得有用的老铁麻烦点个小爱心~

你可能感兴趣的:(TCGA barcode -- TCGA ID 中每段字符代表什么?)