计算机编码发展历史及不同版本python的所使用的编码

一、简述:

        计算机发源于美国,早期的计算机只是用于科学计算,但是在计算机迅速发展时,计算机被要求不仅仅能够进行数值计算,还要进行字符处理和表示。于是一套名为ASCII(American Standard Code for Information Interchange,美国信息互换标准代码)码的编码方式被创造而出,采用7位(bit)来表示一个字符,每一个7位的二进制数表示一个特定的字符,总共能表示128个字符;后来IBM对ASCII编码进行了扩充, 采用8位(bit)来表示一个字符,那么就能表示256个字符,这也仅仅是一些拉丁字母和特殊符号的扩充;后来计算机推广到了世界各国,ASCII码中不包含其他国家的字符,因为一个8位的二进制数所表示的字符数量仅仅只有256个,于是各个国家为了再计算机上表示自己国家的字符,也相继推出了自己国家的计算机编码,这些编码统称为:ANSI编码。

        当计算机普及到全世界时,各个国家面临的首要问题就是要针对自己国家的语言制定一套自己国家的编码规范,我国就提出里一套针对中文的GB2312的编码方式,这套编码方式基于ASCII码(并非IBM的ASCII扩充版本),使用2个字节表示一个汉字,具体的方式是前127个字符不变。当第一个字节(高字节)大于160的时候,表示一个汉字的开始,再用这个字节组合第二个字节(低字节,范围也是160-255)共同表示一个汉字。在这套编码方式中,不仅把中文编码进去,还把一些数学符号、罗马希腊字母和日本假名等等都编码进去,并且还把ASCII中原有的26个英文字母和符号都编入,当然这些字母是以2个字节表示,为和ASCII中原有的字母区别表示,称前者为“全角字符”,后者为“半角字符”。

        当然我大中华文化底蕴深厚,GB2312也只能编入部分常用汉字,为了把更多的汉字编入进来,针对GB2312进行扩充,就创造出了GBK标准。GBK只要求当高字节大于127时就表示汉字的开始,低字节也不再要求范围。

二、计算机发源于美国(ASCII)

三、计算机普及到世界各国(ANSI)


四、世界统一编码诞生(Unicode)


你可能感兴趣的:(计算机编码发展历史及不同版本python的所使用的编码)