基础知识——基因结构

基因(遗传因子) 是产生一条多肽链或功能RNA所需的全部核苷酸序列。带有遗传信息的DNA片段称为基因。(百度百科)

我们都知道,不论真核生物还是原核生物都离不开基因,它储存着生长、发育、凋亡等几乎全部生命过程的信息。

一、基因结构

基因包含编码区和非编码区
image
  • 编码区:真核生物基因的编码区是不连续的,分为外显子和内含子,它们交替出现。在原核生物中,基因是连续的,也就是说无外显子和内含子之分。
  • 非编码区:不能编码蛋白质的区段叫做非编码区。非编码区位于编码区前后,同属于一个基因,控制基因的表达和强弱 。

二、编码区(Coding region)

编码区
  • 外显子 Exon

外显子(expressed region)是真核生物基因的一部分。外显子是最后出现在成熟RNA中的基因序列,又称表达序列。 编码区中不连续的具有蛋白编码功能的DNA序列

  • 内含子 Intron

内含子(Intron)又称间隔顺序,指一个基因或mRNA分子中无编码作用的片段。就是编码区中外显子之间间隔的非编码序列

  • 外显子的尾部与下一个内含子的头部大多是GT
  • 内含子的尾部与下一个外显子的头部大多是AG
  • 记做GT-AG法则,作为RNA剪切的识别信号。
  • 起始密码子(ATG),终止密码子(TAA、TGA、TAG)
  • 开放阅读框(ORF):从起始密码子到终止密码子的碱基序列,且不包含终止密码子

三、非编码区(Non-Coding region)

非编码区
  • 增强子 Enhancer

增强子是DNA上一小段可与蛋白质结合的区域,与蛋白质结合之后,基因的转录作用将会加强。增强子可能位于基因上游,也可能位于下游。一般位于转录起始位点上游大约100个碱基以外。

  • 启动子 Promoter

启动子是特定基因转录的DNA区域,启动子一般位于基因的转录起始位点5‘端上游,启动子长约100-1000bp。与RNA聚合酶特异性结合。

CAAT box

第一个外显子的5'转录起始位点(TSS)上游大约70-80个碱基的位置,具有GGCCAATCT 共有序列的核苷酸序列。是RNA聚合酶的结合位点,其作用是控制转录起始频率。

GC box

位于CAAT box两侧,包含的碱基是GGCGGG ,它有转录调节、激活转录的功能。

TATA box

第一个外显子的5'转录起始位点(TSS)上游大约20-30个碱基的位置。包含的碱基信息是TATAATAAT,其作用保证RNA聚合酶可以准确识别转录起始位点并开始转录过程。它影响转录的起始

  • 终止子 Terminator

终止子处于基因或操纵子的末端,给RNA聚合酶提供转录终止信号的DNA序列。

ATAAA

ATAAA 是 preRNA 在通过修剪后形成成熟mRNA 时在3'UTR产生ployA 是的加尾信号。这段序列再往下到转录终止位点(TTS)之前,是一个反向重复序列(7-20个碱基对),转录后形成一个发卡结构,可以阻碍RNA聚合酶移动,终止转录

回文序列 palindrome sequence

回文序列是双链DNA中的一段倒置重复序列,这段序列有个特点,它的碱基序列与其互补链之间正读和反读都相同。当该序列的双链被打开后,如果这段序列较短,有可能是限制性内切酶的识别序列,如果比较长,有可能形成发卡结构,这种结构的形成有助于DNA与特异性DNA与蛋白质的结合

三、preRNA

  • 转录起始位点 Transcription start sites (TSS)

TSS在启动子区下游和起始密码子上游

  • 转录终止位点 Transcription termination sites (TTS)

TTS在终止子区下游&终止密码子下游

四、mRNA

  • UTR:mRNA两端的非编码序列
  • 5'UTR:上游非编码区,位于5'帽子与起始密码子(AUG)之间
  • 3'UTR:下游非编码区,位于编码区末端的终止密码子到3’尾巴之间
  • 5'帽子:作用就是帮助mRNA跨过核膜,进入胞质,并且此过程中保护5‘不被降解;翻译时保证IFiii和核糖体识别
  • 3’poly-A尾巴:作用也是帮助mRNA跨过核膜,进入胞质,并且增加了mRNA在胞质中存在的稳定性。因为mRNA的降解过程是随着时间延长,A尾逐渐变短;

参考链接

(基因结构基础知识)

(基因结构)

你可能感兴趣的:(基础知识——基因结构)