3. DNA和RNA的结构

课程内容

3.1.核酸的物理化学性质

3.2. 核酸的一级结构

3.3. 核酸的二级结构

3.4. DNA supercoil

3.5 RNA二级结构

C主要知识点

专业名词

Tm; C0t

Hoogsteen 碱基对

四链DNA quadruplex DNA

DNA复性 DNA Renaturation

DNA变性DNA Denaturation

DNA超螺旋 DNA supercoil

C值 C-value

A-型双螺旋 A-DNA

B-型双螺旋 B-DNA

Z-型双螺旋 Z-DNA

拓扑异构酶 Topoisomerase

核酶 Ribozyme

核酸的分子杂交

二代测序技术 (Next generation sequencing)

理论与实验

1) Sanger测序的原理

2)  二代测序的方法

3) 影响DNA变性的因素

4)   C-Value Paradox

从本次课到第8次课,均是讲述DNA相关的知识。核酸的结构开始,到DNA如何组装为染色体,基因组学(5-6),DNA复制(7-8)。

3.1. 核酸的物理化学性质

学习该部分,希望同学们掌握描述DNA或是RNA时,常用的理化参数或者名词有哪些;还有就是关于核酸的常识。

当我们谈到核酸时,一般会关注GC含量、Tm值、大小(长度)。

1). GC含量。一个核酸分子中,鸟嘌呤和胞嘧啶所占的比率称为GC含量。在DNA中,GC含量愈高,DNA的密度也愈高;形成的双链愈稳定,因此热及碱不易使之变性。根据这一特性,可进行DNA的分离或测定。此外,对生物的基因组DNA来说,GC含量是一个固定值。

2). Tm值。

与此相关的是核酸的变性和复性。


DNA的变性和复性

DNA在物理或化学因素作用下(如加热、酸碱或紫外线照射),可以导致两条DNA链之间的氢键断裂,而核酸分子中的所有共价键(如磷酸二酯键、糖苷键等)则不受影响,称为DNA变性 (DNA denaturation or DNA melting)。凡能破坏双螺旋稳定的因素(如加热、极端的pH、有机试剂如甲醇、乙醇、尿素及甲酰胺等)均可引起核酸分子变性。比如,PCR中,会使用90度以上的高温让DNA变性;分析RNA时,会用65度进行RNA的变性;Southern blotting中,会用0.4N的NaOH对凝胶中电泳分离的DNA进行变性。

Tm值,就是让一半的DNA分子发生变性时的温度。DNA的Tm值由以下几个因素决定:(1)GC含量,在一定条件下Tm高低与DNA分子中的GC含量成正比,G-C含量高时,Tm值比较高,反之则低。这是因为G-C之间的氢键较A-T多,解链时需要较多的能量之故。(2)DNA长度。DNA所处的溶液条件,影响因素包括离子浓度、pH值和有机溶剂。

DNA复性。复性(renaturation),也称退火(annealing),就是两条单链DNA分子之间依据Waston-crick碱基互补配对的规则,变成双链的过程。复性的最佳温度一般在比Tm低25度左右。此外,如果将DNA高温变性后,立刻放在冰上降温,DNA会保持变性的单链状态,(称为淬火,quelling)。同DNA变性一样,影响DNA复性的因素包括:DNA浓度、复性的时间、DNA序列的复杂度等。鉴于DNA的复性的时间与DNA复杂度有关,因此可以通过用C0t值来描述DNA序列的复杂度。序列复杂度低,重复序列多,复性就快,C0t值低;复杂度高,复性慢,C0t就高。

DNA的变性和复性是许多实验的基础,比如PCR和分子杂交实验。例如我们在PCR中遇到高GC含量的模板时,DNA变性可能不完全,会利用一些添加剂来降低Tm值,提高PCR效率。这次课的作业就是与此有关。

另外就是经典的分子杂交实验。分子杂交:指两条单链核酸分子间复性变为为双链的过程。分子杂交技术,利用DNA变性、复性来检测核酸的技术。分子杂交可以发生在DNA单链之间,也可以是DNA单链和RNA之间,或者RNA之间都可以进行分子杂交。2)复性的两个DNA或RNA单链之间,序列可以不完全一致。比如DNA引物与模板之间有一个错配,实际上也能结合为部分双链(如DNA二级结构中的R型环突,R-loop)。

Southern blotting(Southern印迹)

1975年由英国人southern创建,是检测DNA和绘制DNA图谱的基本技术。其基本原理是:具有一定同源性的两条单链核酸在一定的条件下,可按碱基互补的原则特异性地杂交形成双链。其中一条链是固定在支持物上的待检测DNA,另一个是用同位素标记(或其他方式标记)的DNA单链(即探针)。在实际操作中,一般利用琼脂糖凝胶电泳分离经限制性内切酶消化的待检测的DNA样品,将胶上的DNA变性并在原位将单链DNA片段转移至尼龙膜或其他固相支持物上,经干烤或者紫外线照射固定,再与序列已知的探针进行杂交,用放射自显影(或酶反应显色)来检测探针是否与目标样品结合,从而检测样品中是否具有和探针同源的序列。

Southern杂交一般用来检测目标DNA序列(基因)在待分析的样品中是否存在。例如转基因作物的检测。同时还可以知道目标序列经酶切后的大小,从而绘制目标DNA区段的图谱(DNA指纹)。

另外还有,Northern blotting (Northern 杂交),用DNA或者RNA探针检测RNA分子。过程和原理与Southern blotting一样。

3). DNA大小

核酸的大小主要用碱基对(base pair,bp)来表示。常用的单位有Kb (kilo base pairs),Mb (mega base pairs),Gb (giga base pairs) 等。在这部分中,需要了解C-值悖论。


不同生物基因组大小的比较

不同生物,基因组DNA的大小差异非常大,从只有几千bp的病毒到十亿以上碱基对的植物、动物。一般将单倍体基因组总DNA的含量可作为一个物种的特征,称为C值。按照常理推断,DNA的碱基多,携带的信息就多,基因的数目就多,能够完成的生命活动也会更复杂。在低等生物中的确存在这样的规律,一个物种的DNA多,往往编码的基因就多,能够适应更复杂的自然环境。但在真核生物中,DNA含量的和它编码基因的数目是没有严格的关联,和生物进化的复杂性也没有严格的对应关系。比如,青蛙的基因组是人的7倍;在植物种,拟南芥基因组只有100多Mb,水稻是400Mb左右,玉米和小麦是Gb以上,但这几种植物的复杂性、进化的程度,其实是等同的。这就引出了C值悖论(C-value paradox),即一个物种的C-值与它的进化没有严格的对应关系。

要完整的回答C-value paradox,可能等大家学完基因组学以及后面的课程,才能系统地解释出现C-值悖论地原因。简单的说,C-值大地物种中可能有大量的非编码DNA,还有就是大量的重复序列(如转座子),因此C值虽大,但并没有包含更多地基因(或是编码更多的蛋白)。那是不是这些非编码DNA和重复区域就是不需要的,是基因组上的“垃圾DNA”,这个问题不容易回答。我们在研究中确实发现有些DNA区域,或者一些有些不表达的重复基因,去掉以后对植物没什么影响。但大家回忆一下第一次课的小幽默。遗传学家将“安全带”去掉,正常情况对汽车的行驶不会由任何影响,只有在撞车时才会发现它是必要的。我们现在将某个基因或某段DNA去掉,并不能完全确定对植物没有影响,也许是在特定条件下才会出现;当然,有一些DNA的确就是“进化”的遗迹,是可以抛弃的。

3.2 核酸的一级结构

DNA的一级结构是指各个核苷酸结构单元或碱基的排列顺序,存储了生物的遗传信息。此部分的重点是学习DNA测序的原理。

1)Sanger测序

最经典的是Sanger测序,也称链终止测序(chain termination method)。它利用DNA合成反应过程中,双脱氧核苷酸的加入使DNA链的合成终止,将终止的DNA链电泳后,来读取DNA序列。


Sanger测序的原理。使用放射性同位素标记DNA链的一端。

1.进行四组平行反应, 每一组反应混合物含有四种dNTP, 每一组反应含有一种少量的ddNTP

2.进行DNA合成反应。在多数情况下,聚合酶使用正常的核苷酸,DNA合成正常延伸;有时,聚合酶使用ddNTP,而导致末端终止。每一组反应中ddNTP的随机插入留下一系列长度不等的以该双脱氧核苷酸结尾的DNA链。

3.对每一组反应混合物进行凝胶电泳。DNA片段将按大小分离。片段越短,电泳越快,就越靠近凝胶的底部

4.序列读取。对凝胶电泳进行放射自显影,从凝胶的底部向上读出序列

我们一般使用的是自动化sanger测序仪,用四种不同的荧光分子,分别标记ddATP、ddCTP,ddTTP和ddGTP。测序反应后,利用激光扫描仪直接读取荧光分子的颜色,获得碱基信息。(视频: https://v.youku.com/v_show/id_XMjk5ODA3ODc2MA==.html?spm=a2h0k.11417342.soresults.dtitle)

2). 二代测序方法

即使自动化的Sanger测序,在前期需要大量的准备工作,并且测序通量有限,一次电泳也只能进行384个片段的测序反应。2005 年 Roche 公司发布的 454 测序系统标志着测序技术跨人高通量并行测序的时代。第二代 DNA 测序(next generation sequencing,NGS)技术又称大量并行测序技术(massive parallel sequencing,MPS)、高通量测序技术(high—throughputsequencing,HTS)。

NGS其特点是一个反应能同时测定成千上万的DNA片段的序列,但读取序列的长度有限。最早只能读取几十个碱基对长度的小片段,到现在能够并行读取300-500bp的DNA片段的序列。对于不同的测序技术,需要同学可以去查阅资料,到各个测序公司的官网了解这些测序方法的原理和性能。这里这是点到为止。

焦磷酸测序(pyrosequencing),  454测序仪加入某一核苷酸时,检测DNA合成时是否产生PPi(焦磷酸)来判断碱基序列。

Illumina/Solexa测序:荧光标记和分子阵列。即在一张芯片上同时进行大量的类似Sanger的测序反应。由于使用的末端终止世纪时可逆的,在完成一个碱基的读取后,可持续进行DNA链的延伸和测序。

Ion Torrent测序(半导体测序):利用半导体芯片捕获DNA合成过程中产生pH值的变化。

3). 三代测序

即单分子测序技术,在测序过程中不需要涉及PCR扩增,实现了对每一条DNA分子的单独测序。三代测序技术具有超长读长,还拥有不需要模板扩增、运行时间较短、直接检测表观修饰位点、较高的随机测序错误等特点。它弥补了第二代测序读长短、受GC含量影响大等局限性,已在小型基因组从头测序和组装中有较多应用。包括以下几个公司的技术。

Helicos (最早,2012年破产)

OxfordNanopore 纳米孔测序(Nanopore)

Pacific Biosciences的SMART测序,PacBio测序

3.3. 核酸的二级结构

DNA的二级结构主要是各种形式的双螺旋,除了最常见的B-型双螺旋,此外还有A-型双螺旋、Z-型双螺旋。B-型双螺旋也就是Watson和Crick提出的DNA结构模型,是生物体内DNA的主要形态。DNA还存在三链螺旋和四链螺旋。由于DNA的特殊性质,DNA可以组装成各种二级结构的纳米材料(DNA Origami)。我们感兴趣是有生物学意义的核酸结构。

在DNA复制, 转录,重组等阶段,双螺旋DNA还能形成多样的二级结构,比如分支型的DNA(在DNA修复中会出现),DNA复制时形成Y性的复制叉等

部分特殊的DNA序列哈能形成三螺旋DNA和四股螺旋DNA。

三股螺旋DNA

四螺旋DNA,也称G-quadruplex,在GGG重复序列组成的DNA链中容易形成的四螺旋DNA,发现于端粒、启动子等区域。近年研究发现G-quadruplex可能具有非常广泛的生物学功能,参与转录、翻译等环节的调控。

3.4 核酸的三级结构

        在细菌、病毒、真核细胞线粒体、叶绿体中,DNA多呈现双链环状分子,是没有自由末端的闭合双链结构(covalently closed circle DNA, cccDNA)。DNA分子可以在双螺旋的基础上,进一步绕同一中心轴扭转,造成额外的螺旋。形成超螺旋的结构。超螺旋本身具有方向性,因此当旋转方向不同时,可产生正超螺旋和负超螺旋两种形式的拓扑结构。右手超螺旋(顺时针),称为负超螺旋(与DNA双螺旋的旋转方向相反的扭转);反之形成的左手超螺旋(逆时针)称为正超螺旋(与DNA双螺旋的旋转方向相同的扭转)。


Topologicalstates of covalently closed, circular (ccc) DNA. The figure shows conversion of the relaxed (a) to the negativelysupercoiled (b) form of DNA. The strain in the supercoiled form may be taken upby supertwisting(b) orby localdisruption of base pairing (c).

在生物体内,DNA主要以负超螺旋的形式存在,并通过拓扑异构酶来调整DNA的超螺旋结构。DNA超螺旋与DNA复制和转录都有关(可见DNA复制部分)。

真核生物染色体虽然是线性分子,但其DNA与蛋白质相互结合,以许多大环的形式存在,许多个环的基部聚合在一起形成类似环的结构。此外,真核生物DNA在细胞中高度压缩成染色体结构,在后面的章节中会介绍。

3.5 RNA的二级结构

RNA为单链,非常容易分子内或是分子间形成双链,进而形成各类二级结构。RNA的二级结构跟它的功能有密切联系,比如核糖体RNA、snoRNA、tRNA的二级结构,siRNA来源于双链RNA,miRNA来源于同一个RNA分子形成的stem-loop结构等。这节的另外一部分内容就是希望大家熟悉各类RNA相关的名词。

你可能感兴趣的:(3. DNA和RNA的结构)