双端测序、DNA甲基化及CPG岛、转录组分析名词

关于Illumina的双端测序,最重要的理解一点是在进行单端测序结束后,再继续通过桥式PCR扩增出反向互补链进而第二次测序,而这第二次测序的序列就是原来哪条序列的真实序列,第一次测序的是互补链的序列。

表观遗传学认为在不改变DNA序列的情况下,通过DNA和组蛋白的修饰来调控基因的表达,而其中DNA甲基化最为常见(DNA methylation).在人类的表观遗传学中,CpG岛的甲基化修饰最为常见,

CpG岛的甲基化修饰主要过程是在CpG甲基化结合蛋白(Methyl-CpG Binding Proteins.MBDs)和DNA甲基化转移酶(DNA methyltransferases.DNMTs)的作用下,使得CpG二核苷酸5’端的胞嘧啶转变为5’甲基胞嘧啶。

目前研究发现,在正常人类的DNA中,约有3-6%的胞嘧啶被甲基化。在哺乳动物中,约有50,000,000个CpG二核苷酸,其中70%的被甲基化。而那些可被甲基化的CpG 二核苷酸并非随机的分布于基因组序列中,相反,在基因组的某些区域中,通常是基因的启动子区域,5’端非翻译区和第一个外显子区,CpG序列密度非常高,超过均值5倍以上,成为鸟嘌呤和胞嘧啶的富集区,称之为CpG岛(CpG Islands, CGIs)

最近,为了排除那些Alu重复序列,提出了更严格的标准:长度至少500碱基对,GC含量超过55%,CpG比值大于0.65。        据研究估计,哺乳动物基因组中的CpG岛约有4万个。在健康人的基因组中,CpG岛中的CpG位点一般处于非甲基化状态,而CpG岛外的CpG位点通常是被甲基化的。


双端测序、DNA甲基化及CPG岛、转录组分析名词_第1张图片
DNA甲基化改变影响

如图1左所示,在正常细胞中,位于抑癌基因启动子区域的CpG岛处于低水平或未甲基化状态,此时抑癌基因处于正常的开放状态,抑癌基因不断表达抑制肿瘤的发生。而在肿瘤细胞中,该区域的CpG岛被高度甲基化,染色质构象发生改变,抑癌基因的表达被关闭,从而导致细胞进入细胞周期,凋亡丧失,DNA修复缺陷,血管生成以及细胞粘附功能缺失等,最终导致肿瘤发生。同样,如图1右所示,对于在正常细胞中处于高度甲基化的一些基因和重复序列,如果其甲基化水平降低,这些基因将表达和重复序列将激活,从而导致基因印记丢失,细胞过度增长,不合适的细胞特异性表达,基因组脆性增加,以及内寄生序列(endoparasitic sequence)的激活,最终也导致肿瘤发生。

由于CpG岛的局部高度甲基化要早于细胞恶性增生,故其甲基化的检测可用于肿瘤的预测,而全基因组水平的低水平甲基化状态,则随着肿瘤恶性程度的增加而进一步降低,使其可用于肿瘤的诊断以及分级。

最后关于甲基化测定方法详见http://www.lifeomics.com/?p=18458

其中遇到一个很重要的概念基因组印迹:经典孟德尔遗传学认为所有父系及母系等位基因有同等表达,但随着对遗传学研究的深入,人们发现了一种称为基因印记的非孟德尔遗传现象,它指在配子或合子的发生期间,来自亲本的等位基因或染色体在发育过程中产生专一性的加工修饰,导致后代体细胞中两个亲本来源的等位基因有不同的表达方式,又称遗传印记或配子印记。它是一种伴有基因组改变的非孟德尔遗传形式,可遗传给子代细胞,但并不包括DNA序列的改变。

Alu序列:Alu重复序列是哺乳动物基因组中SINE家族的一员,约有50万份拷贝。也就是说平均4~6 kb中就有一个Alu序列。Alu序列一般散在分布,少数呈簇状分布。在细胞遗传学水平上观察,Alu重复序列集中在基因转录最活跃的染色体区段内。在所有已知的基因内含子中,几乎都发现了Alu序列。这种DNA序列中有限制性内切核酸酶Alu的识别序列AGCT,所以称为Alu重复序列

转录组分析之名词解释:http://mp.weixin.qq.com/s/YTJC5cv4xshKyD6lqPsWog

你可能感兴趣的:(双端测序、DNA甲基化及CPG岛、转录组分析名词)