DNA与二进制


我曾经写过一篇关于DNA和二进制关系的文章,前几天又复习了一下,感慨颇多。我是学生物的,后来又加学了计算机软件开发,发现不同领域的不同信息有着相似的编码方式。现在计算机学的越来越多,专业课学的越来越少了,可能是自己对IT世界更感兴趣吧。通过对这篇文章的复习,提醒自己将来努力做一个跨界的人才,因为米老师曾说过提高班要培养的是全面发展的人才。现将这篇文章与CSDN的同胞们分享一下。


——题记


米老师给我们讲了用二进制数码(0,1)可以表示任何信息(文字,图片,音乐,视屏……),于是我联想到了生物里面学的遗传信息的编码,二者有惊人的相似之处:

遗传信息 多媒体信息
所用编码字符(碱基) A T C G 0,1
基本体的个数 4 2


二者都可以用很少基本数据(结构)编码出千变万化的信息:信息技术用0,1编码和表示一切信息;基因用4类碱基(A、T、C、G)可以编码表示一切遗传信息。剩下的就是用多少0和1或用多少碱基来编码信息的问题,所用的二进制位或碱基越多,可携带的最大信息量也越多。以下以ASCII码和氨基酸的密码子为例:






其中遗传密码用3个碱基编码表示;ASCII码用7位二进制数编码.科学家在研究遗传密码时曾设想过用2个碱基编码,但这样共有4^2=16种编码,而氨基酸有20种,不能包含所有氨基酸,后来用三个表示,结果不仅能编码所有的氨基酸而且也符合事实。

在计算机内部以ASCII码识别字符和控制符,在基因表达时以密码子识别氨基酸;不同的碱基序列表示不同的遗传信息,从根本上说是因为不同的碱基序列代表了不同的氨基酸序列,从而所形成的蛋白质的一级结构不同,进而其高级结构不同,而蛋白质是生命活动的体现着,所以生物的性状也不同。
0和1可以表示出千变万化的计算机信息;ATCG可以表示出无穷多的性状(每个生物的遗传信息都不同)这是多么巧合的事情。
西方人逻辑思维好,从二进制和遗传密码的发现就可以体现出来

用有限去表现无限,用简单去表现复杂,这其实是人类文化的通则。任何的英文文章都归结为26个字母,任何的简体汉字都归结为横竖撇那,任何的物质都可以归结为核子和电子。计算机内的任何操作都归结为算术运算和逻辑运算(CPU中运算器的功能)。然而人类的智慧就在于如何用有限去实现无限,用简单去实现复杂。在21世纪人类的不可再生资源在减少,如何用有限的资源去实现最大的现实效益呢?


你可能感兴趣的:(人工智能)