内容提纲
表观基因组学(Epigenomics)
定义:在核苷酸序列不发生改变的情况下,研究基因组上的化学修饰和空间结构变化如何影响基因功能和表达调控的一门学科
研究内容:
1)化学修饰:DNA、RNA、蛋白质
2)空间结构:核小体(Nucleosome)、染色质(chromatin)、基因组
表观特点:DNA序列不变、可逆、可遗传、动态变化
引起表观基因组变化的因素:Lifestyle and enviroment factors
癌症表观基因组(Cancer Epigenome):
1)cancers are caused by chanes in the epigenome as well as the genome. Changes in the epigenome can switch on or off genes involved in cell growth or the immune response. These changes can lead to uncontrolled growth, or to a failure of the immune system to detory tumors(肿瘤).
2) In a type of brain tumor called glioblastma, doctors have had some success in treating patients with the drug temozolomide, which kills cancer cells by adding methyl groups to DNA. Glioblastoma patients whose tumors have such methylated genes are far more likely to response to temozolomide than those with unmethylated genes.
3)Studies in the cancer genome atlas(TCGA) are comparing the genomes and epigenome of normal cells with those of cancer cells. Understanding all the changes that turn a normal cell into a cancer cell will speed efforts to develop new and better ways of diagnosing , treating and preventing cancer.
DNA修饰--甲基化(Methylation): 给碱基戴帽子
甲基作为一个化学基团(-CH3)能够结合在DNA上某些特定部位。甲基和DNA结合的过程就加甲基化,甲基从DNA上脱落的过程就叫去甲基化。DNA甲基化能引起染色质结构、DNA构象、DNA稳定性及DNA与蛋白质相互作用方式的改变,从而控制基因表达。(目前研究的比较多的、定量比较成熟的DNA甲基化形式是N5-mC(胞嘧啶))
“第五碱基”学说:5甲基胞嘧啶(5mC)是表观遗传最重要的一种修饰,由于与基因的表达调控密切相关,因此又被誉为“第五碱基”,但是我们要清楚的是甲基化修饰是不影响复制过程中碱基配对的,同样的也不影响转录过程中的碱基配对,因此,DNA修饰不能被看作新碱基。
***DNA甲基化是可以遗传的(2013年基因组所刘江老师发表的一篇cell得到的推论),但是在表观层面暂时还没有发现
5mC测序:Bisulfite(重亚硫酸盐)处理能够将基因组中未发生甲基化的C碱基转换成U,进行PCR扩增后变成T,与原本具有甲基化修饰的C碱基区分开来,再结合高通量测序技术,可以绘制单碱基分辨率的全基因组DNA甲基化图谱。
DNA甲基化测序:芯片适合大规模测序、全基因组甲基化测序适合探索性研究
DNA甲基化的建立和维持:主要是与DNA甲基化转移酶(DNA methytransferase 简称DNMT)有关。DNMT3A和DNMT3B能够使胞嘧啶(C)发生从头甲基化。并且在DNA复制的过程中,DNMT1甲基化转移酶会识别半甲基化的CpG,并催化形成5mC。
DNA甲基化的去除:
1)主动去甲基化:通过酶(TET)进行去甲基化;通过DNA损伤修复去甲基化
2)被动去甲基化:在复制过程中,DNMT1催化产生问题,导致DNA甲基化不能被维持
DNA甲基化的功能:
1)调控表达:在大多数情况下启动子区域的甲基化与表达呈负相关
2)调控剪切:机制尚未明确,不同基因甲基化对剪切的影响也不同
3)抑制转座:能抑制新转座元件的额转座,防止其对物种产生有害影响
***利用DNA甲基化能够精准预测实际年龄,总体误差小于三年
DNA甲基化:基因组印记(基因表达具有亲本特异性的表观遗传现象)
在生物学和疾病中是非常重要的,他会导致亲本特异性表达就是通过DNA甲基化的获得和丢失来产生的。Imprinted genes have major on development,growth and survival, as well as on adult phenotypes. Many imprinted genes are expressed in the brain and affect diverse aspects of behaviour from birth onwards, from infant feeding to sleep and adult social behaviour. Abnormal experssion of imprinted genes is a contributory factor in human diseases.
RNA修饰
主要有7种化学修饰,他们具有不同的分布偏好性。
mRNA修饰能够参与基因表达调控;能够影响重要生物学进程
ncRNA修饰也有重要的生物学功能
RNA编辑:是一种转录后加工过程,通过碱基替换、插入和缺失等修改RNA序列
1)C - to - U:主要参与酶是APOBEC1
2)A - to - I(指的是腺嘌呤脱氨形成的次黄嘌呤核苷):主要参与酶是ADAR2
蛋白质修饰
翻译后修饰(Post-Translational Modification, PTM):是共价化学反应过程,由蛋白酶水解或修饰基团添加到一个氨基酸上。PTM的主要作用是改变氨基酸的化学性质或结构,扩阔蛋白质的功能,是细胞信号介导中的重要组成部分。蛋白质修饰可以发生在翻译过程中或翻译后,但大部分发生在翻译和折叠之后,因此统称为PTM。到目前为止已经发现了350多种PTMs,他们通过改变大多数真核生物蛋白质的活性、定位、降解以及与其他蛋白质的相互作用从而调节蛋白功能。PTM是增加蛋白质多样性的关键机制
翻译后修饰的类型
常见的修饰包括:磷酸化(最多)、甲基化、乙酰化、酰胺化
根据蛋白质分子是否全部被修饰、同一个氨基酸的修饰种类、修饰的稳定新,制定了以下分类和描述:
1)部分修饰(partial):细胞中某一蛋白的部分分子被修饰
2)可变修饰(alternate):同一个氨基酸位点含有多种修饰类型
3)瞬时修饰(transient):不稳定的修饰状态
磷酸化修饰
指的是磷酸基团转移到氨基酸上的过程,他是真核细胞和原核细胞信号转导的关键机制。磷酸化可以发生在细胞质和细胞核内。磷酸化可以发生在三界物种(真核和原核)。磷酸化修饰的主要功能是调控蛋白质活性,影响多种重要生命过程,如细胞周期。
组蛋白修饰(蛋白质上修饰研究最多的一种)
组蛋白(Histone):是包装DNA的一类蛋白质,能够改变DNA的结构;真核生物细胞染色质与原核生物细胞中的碱性蛋白质,和DNA共同组成核小体(Nucleosome :是染色质基本结构单位)结构。存在五个主要的组蛋白家族:H1/H5、H2A、H2B、H3和H4,其中H2A、H2B、H3和H4被称为核心组蛋白(Core histone),H1/H5被称为连接组织蛋白(Linker histone)
组蛋白修饰:是组蛋白翻译后发生的共价修饰,包括甲基化、磷酸化、乙酰化、泛素化、类泛素化等。组蛋白与DNA是染色质的稳定成分,非组蛋白与RNA的含量则随细胞生理状态的不同而发生变化。组蛋白修饰的作用主要包括改变与DNA及其他核蛋白的相互作用、改变染色质结构和活性、调控基因表达。
组蛋白修饰及其命名规则
组蛋白甲基化:在细胞核内,组蛋白甲基化将影响DNA的转录活性,激活或抑制基因的表达。
三维基因组学(3D genomics)
为什么要研究三维基因组?
答:科学家们发现,调控元件在空间结构上并不是在染色体上呈线性的一字依次排开,这些离散的调控元件并不能有效的解释很多基因的调控结果和机制,由此猜测其与基因组的三维空间结构相关。
三维基因组基本实验技术:
1)荧光显微实验方法:荧光原位杂交技术(FISH),后续又发展出了2D-FISH、3D-FISH
2)染色质构想捕获:通过消化和重连空间上接近的染色体片段来确定不同位点之间的空间交互
Chromosome Conformation Capture(3C)
Chromosome Conformation Capture on Chip(4C)
Chromosome Conformation Capture Carbon Copy(5C)
High-throughput Chromosome Conformation Capture(Hi-C)
Chromatin Interaction Analysis by Paired-End Tag sequence(ChIA-PET):加入了免疫共沉淀技术,鉴定特定蛋白介导的染色质交互和空间结构
染色质三维空间结构
从大到小依次为染色体疆域、区室、拓扑关联结构域和染色质环
染色体疆域(Chromosome Territories):指每条染色体都占据着一个独特的区域,同一染色体上的交互频率高于不同染色体之间的交互频率。交互频率随着基因座之间的线性距离增加而呈指数级下降
区室(Compartments A/B):根据互作图谱,能够将基因组近似分为A(常染色质-转录活跃区域),B(异染色质-转录非活性区)。A/B区室在染色体上相间分布,并且在不同细胞状态下可以相互转变
拓扑关联结构域(Topologically Associating Domains ,TAD):是区室下的亚结构,长度为300kb-1Mb,具有TAD内部互作频率高,TAD间互作频率低的特定。其边界富集CTCF、持家基因、tRNAs、SINE反转录转座子等DNA元件。
染色质环(chromatin loop):也可以称为交互峰(interaction peaks),由染色体上相距较远的两个片段构成,其在线性空间中虽相距较远,但在三维空间结构中却具有显著的近距交互作用。调控元件(如增强子)便可以通过这种结构远距离调控基因的表达。