氨基酸密码子表及偏好性(2022-05-03)

密码子(codon)是指信使RNA(mRNA)分子中每相邻的三个核苷酸编成一组,在蛋白质合成时,代表某一种氨基酸的规律。

  信使RNA在细胞中能决定蛋白质分子中的氨基酸种类和排列次序。信使RNA分子中的四种核苷酸(ATCG)的序列能决定蛋白质分子中的20种氨基酸的序列。而在信使RNA分子上的三个碱基能决定一个氨基酸。

  起始密码子(iniation codon):指定蛋白质合成起始位点的密码子。最常见的起始密码子是甲硫氨酸或缬氨酸密码。

一、不同生物的密码子使用偏好不同

  三联密码子一共有4×4×4=64个,而构成生物的氨基酸仅有20个(外加1个终止密码子)。这意味着,有许多密码子,编码着同一个氨基酸。比如说,UUA、UUG、CUU、CUC、CUA和CUG均编码亮氨酸。这种现象,称为密码子的简并性。

  但这是否意味着,生物可以随便更换密码子、反正只要编码同一个氨基酸就好呢?

  并不是!

  不同生物使用各种密码子的频率,是不同的。同样是编码亮氨酸,在酿酒酵母(Saccharomyces cerevisiae)中,使用UUU、UUA和UUG的几率是最高的,每1000个密码子中,这三个密码子就会出现大于26次。而在人类(Homo sapiens)中,使用UUA编码亮氨酸的概率是比较低的,每1000个密码子中只会出现不到8次。这种现象,称为密码子使用偏好性(codon usage bias)。

  如果随意更换同义的密码子,会产生各种问题。比如说,同样都是编码亮氨酸,假如将UUA换成CUG,就会显著改变GC比。这不光会影响基因组的稳定性,还会导致转录出来的mRNA的二级结构发生变化。同时,由于密码子偏好与tRNA池是共进化的,因此,更换了同义的密码子,而tRNA基因或者丰度却没有随着发生变化的话,就会影响蛋白质的翻译速度。再有,由于蛋白质是可以边翻译边折叠的。因此,翻译速度的变化,也会影响蛋白质的折叠。

  目前,有一些人类疾病,被认为与DNA的同义突变(synonymous mutations)具有相关性。

  这同时也告诉我们,在实验中,如果想在A生物中表达B生物的蛋白,往往需要考虑密码子的优化,将B生物的基因DNA序列,改成适合A生物的密码子使用偏好,否则表达效率会降低,甚至表达不出来。

二、核基因组与线粒体、叶绿体基因组使用的密码子表不同

  是的,你没看错,线粒体和核基因组所使用的密码子表,是存在差异的。原因就是在标准的密码子表中,AGA和AGG编码精氨酸,但在脊椎动物的线粒体中,这两个密码子却是终止密码子。而标准密码子表中的终止密码子UGA,在脊椎动物的线粒体中,却是编码色氨酸。

  所以,我们去ncbi做orf的时候,必须要根据基因的类别选择密码子

  最常用就是通用的,比如选择1.

但是如果是做线粒体,那就要选择5.无脊椎线粒体密码子编码

你可能感兴趣的:(氨基酸密码子表及偏好性(2022-05-03))