生信体系课 · 上篇 // 段位(1) 挑
模块 01:芯片数据来源与下载
第一节:芯片基础知识
芯片实验平台、原理与步骤简介
基因芯片:是固定在某种介质上(比如玻璃或石英平面、微粒等)的一系列微小特征序列的(通常是 DNA 探针)的集合,它们可以被用于定性或者定量检查样品内特异核酸分子的成份。
学习重点:
碱基互补、中心法则
在中心法则上,芯片的制备和使用涉及到 DNA 复制,DNA 转录出 RNA,以及 RNA 逆转录到 DNA。待检核酸样本与探针结合遵循碱基互补配对原则。
目前的商业芯片都还会再把 cDNA 转录为 cRNA 进行检测,这样再进行一次转录有 2 个意义:
第一,RNA 与DNA 间的互补结合,较两条 DNA 链间更为牢固,我们使用的是 DNA 探针,则 DNA 和 cRNA 结合的敏感性高于 DNA 和 cDNA;
第二,在体外,DNA 到 RNA 的大量转录非常简单,所以从 cDNA 到 cRNA,使得待测核酸又进行了大量扩增,即使原来低丰度的 mRNA 也更好检测。
Affymetrix 芯片特点
芯片设计、灵敏度高、重复性高,稳定性好、产品线丰富、表达谱芯片覆盖物种广泛、通用性
Affymetrix 公司表达谱芯片的制作芯片采用的是光蚀刻技术,光蚀刻引导短探针合成,多位点设计。
做表达谱的芯片,也就是测 RNA 表达量的芯片,探针的长度是 25 个碱基,
做 SNP 分型的芯片,探针的长度是 30 个碱基。
-
传统的3’IVT 芯片:
用Oligo dT引物和T7逆转录酶来得到cDNA 链的
得到的 cDNA 主要是靠近 mRNA 3’位末端的 cDNA
探针也主要针对每个基因的最后一、 二个外显子来进行设计
-
新一代的全转录组 WT 芯片:
用随机引物和 T7 逆转录酶来得到 cDNA 的
得到的 cDNA 会覆盖转录本上更多的区域
它的探针也是针对基因的整个转录本来进行设计的
每一 张芯片上又划分出 650-680 万个小格子,被称为一个“Feature” ,即探针合成点或探针检测单元,上面会通过高密度点阵技术和光蚀刻技术生长出几百万个具有相同序列DNA链,也就是探针。
一个通光孔对应一个 Feature,有少数通光孔是通光的,则那些对应的 feature 是亮的,被称为 deprotected features,即“失保护 features”。通光的 feature 是允许添加一个新的核苷酸的。
接头分子“L”:添加第一个 DNA 核苷酸的起点
光敏阻断分子:是一种阻止 DNA 延长反应的保护剂分子,用红色小三角形表示。
当这个阻断分子作为一个保护基团在 DNA 链上时,则不能向链上添加新的核苷酸;
这些保护基团是对光敏感的,也就是说光可以去除这些保护基团或阻断分子;
每一个新添加的核苷酸分子都加了这种保护基团的修饰。
Affymetrix 表达谱芯片检测的基本原理与步骤
3’IVT 芯片为例:
加入提取的待检测的转录组 RNA→先通过逆转录得到第一链的 cDNA→紧接着就通过复制合成第二链的 cDNA变成双链 cDNA 之后,这个双链 cDNA 就可以作为接下来转录的模板了。
用掺有生物素标记的 UTP 的 4 个单核苷酸的混合物,进行体外转录,转录得到 cRNA(转录出来的 cRNA 片段是带有生物素标签的)。
cRNA 打成片段后再依照碱基互补的原则与芯片上的探针进行杂交,将未结合的 cRNA 片段洗脱后,用标记了藻红蛋白的链霉亲合素 (SAPE)对芯片进行染色。可发出红色荧光, 有一步荧光信号放大过程。最后进行激光扫描,得到一张有着密密麻麻光点的图片,这张图片也就是荧光信号的矩阵。
光点的 X、Y 轴的位置,也就是探针的 ID 号。
光点的 (光)强度,也就对应着被杂交到的 cRNA 的量反映了对应基因的 mRNA 的表达量。
3'端表达谱芯片3´IVT:缺点:①很多同源基因是区分不开的;②不能区分转录本,所以不能用于研究基因可变剪接。③价格上没有优势。
全转录组芯片WT:①结果准确;②全转录本表达谱;③可变剪接的分析;④检测长链非编码RNA(LncRNA)
Tiling 芯片:叠瓦式芯片、嵌合芯片,用于寻找和发现新转录本以及结合染色质免疫共沉淀实验研究蛋白和基因互作。目前分辨率最高的基因芯片类型,可以用作全转录组分析。
SNP 芯片:常用来做 GWAS(读作 G-was)研究。
CNV 研究: SNP 芯片,还可以使用 OncoScan 和 CytoScan 系列。
定制芯片:石蜡标本芯片(X3P Array)
甲基化芯片:都被经典的 Illunima 的 850K 和 450K 霸占了
illumina beadchip 表达谱芯片
优势:
1)上样量低
2)重复性高且检测通量大
3)特异性高
4)数据准确性高
5)检测的费用相对低廉。
Illumina beadchip 表达谱芯片制备的基本原理与步骤
Illumina的芯片分两种,:SAM和右边的 Sentrix BeadChip,表达谱芯片一般为Sentrix BeadChip,它由硅片和二氧化硅微珠两部分组成。通过微机电系统技术等离子蚀刻,在硅片上蚀刻出许多个排列整齐的小孔。
Agilent 的基因芯片
专家认为把芯片扫描技术带入到 临床质量标准 是将全基因组染色体分析的优势 推广到临床领域的一个重要里程碑。
Agilent 的基因芯片应用的是喷点式化学原位合成技术(SurePrint 技术),检测原理也是基于3’IVT原理。
优点:
1)独特的 SurePrint 原位合成技术、
2)灵活方便的定制服务、
3)cRNA 链上直接标记 Cy5 荧光基团,检测过程快、
4)检测线性范围更大、
5)60-mer 长探针,特异性好、
6)样本用量少,节约珍贵样本、
7)可选择双色(通道)芯片检测
如何选择芯片?
3’IVT:
第一个问题,Affymetrix 的 U133 系列、PrimeView 和 Agilent 的 SurePrint G3 都是 3’IVT
第二个问题,转录本水平的检测或可变剪接的研究选择什么芯片?
第三个问题,研究LncRNA用什么芯片?
对于其他要求,比如定制化芯片、双色芯片等,肯定优先选择 Agilent。
如果样品珍贵,建议选择Agilent的SurePrint G3 Human Gene Expression v3 8x60K Microarray和Illumina的Human HT-12 V4,上样量相对较小。
追求性价比,也建议选择Agilent的SurePrint G3 Human Gene Expression v3 8x60K Microarray 和 Illumina 的 Human HT-12 V4。
其他芯片
总结
首先 RNA-Seq 的技术优势是: 1)不需要物种或转录本特异性探针;
2)它可以检测新的转录本、基因融合、SNPs(包括突变)、INDELs(小插入和缺失)以及芯片无法检测到的其他未知的变化,而芯片是个相对封闭的系统,即只能对已知的序列进行检测;
3)有更宽的动态范围;如果选择测序,还要注意:一是建库类别,即全基因组还是全外显子组测序,二是测序深度
芯片的优势:
芯片进行定量会更为准确,而测序具有一定的偏好性;
研究低丰度转录本(基因)或者样本为石蜡包埋组织(RNA 降解严重),同样价位测序深度不高时,芯片较为合适;当然不同的芯片的准确度和适用情况也不同,也需要做好筛选;
一张芯片可以同时对多组学(如编码基因表达、LNCRNA 和 mRNA)进行检测,而测序则由于建库方法的限制,一般要对它们进行分別检測芯片的实验周期通常约为测序的一半时间或者更短;
根据研究材料、目的和性价比选择最合适的方法