ORF and CDS

ORF(开放阅读框)最好被视为蛋白质编码区的假设。它是起始密码子和下一个终止​​密码子之间的DNA片段。它不是真核生物中整个蛋白质编码区的假设(由于内含子)。CDS应该是整个编码区域。

这些起始/终止'密码子'都可以在一个实际上不编码任何蛋白质的基因间区域中随机发现 - 因此不是每个ORF都意味着蛋白质。在蛋白质编码基因的实际起始密码子和下一个终止​​密码子之间发现ORF。该终止密码子很可能在内含子中发现,在这种情况下,ORF包括外显子和内含子的一部分。由于内含子大多只是随机序列,因此终止密码子可能偶然发生。如果内含子偶然不包含终止'密码子'(即在与外显子相同的阅读框中3个核苷酸TAA / TAG / TGA)那么ORF将继续直到它遇到终止密码子 - 在下一个内含子中随机,否则在基因结束时真正停止。

如果没有停止的内含子不是 3个核苷酸的倍数,那么它将引入移码,并且下一个停止可能很容易在下一个外显子内发生。如果它是3的倍数,它会将假氨基酸引入ORF,因为它继续通过内含子并进入外显子。这些错误在基因注释中并不罕见,因为内含子检测是复杂的,如果它“通读”,则在将cDNA序列与基因组序列进行比较之前,内含子可能不会被注释。

如果你想看到这些想法的演示,试着从GenBank获得一个含有前导序列5'-UTR,外显子,内含子,3'UTR的基因序列。CDS将被注释为外部区域。取这个基因序列并使用NCBI ORF-Finder,它将概述所有潜在的ORFs。其中一些,但不是全部,将是实际的编码部分。

你可能感兴趣的:(ORF and CDS)