计算机编码简介(ASCII、ANSI、EBCDIC、Unicode)

1) ASCII(American Standard Code for Information Interchange,美国信息交换标准码)是使用最广的。使用ASCII码编码的文件称为ASCII文件。标准的ASCII编码使用7个二进制数来表示128个符号,包括英文大小写字母、标点符号、数字和特殊控制符。

2) ANSI(American National Institute,美国国家标准协会)编码使用8位二进制数来表示每个字符。8个二进制数能表示256个信息单元,因此,该编码可以对256个字符、符号等进行编码。ANSI开始的128个字符的编码和ASCII定义的一样,只是在最高位上加个0。例如,在ASCII编码中,字符"A"表示为1000001,而在ANSI编码中,则用01000001表示。除了表示ASCII编码中的128个字符外,ANSI编码还有128个符号可以表示,如版权符、英镑符、外国语言字符等。

3)EBCDIC(Extended Binary-Coded Decimal Interchange Code,扩展二、十进制交换码)是IBM公司为它的大型机开发的8位字符编码。值得注意的是,在EBCDIC编码开始的128个字符中,EBCDIC的编码和ASCII或ANSI的编码并不相同。

总的来说,标准的ASCII编码定义的128个字符,对于表示数字、字符、标点符号和特殊字符来说是足够了。ANSI编码表示了所有的ASCII编码所表示的128个字符,并且还表示了欧洲语言中的字符。EBCDIC编码表示了标准的字符和控制代码。但是,没有一种编码方案支持可选的字符集,也不支持非字母组合起来的语言,如汉语、日语等。

4)Unicode编码是一组16位编码,可以表示超过65000个不同的信息单元。从原理上讲,Unicode可以表示现在正在使用的、或者已经不再使用的任何语言中的字符。对于国际商业和通信来说,这种编码方式是非常有用的,因为在一个文件中可能需要包含有汉语、日语、英语等不同的语种。并且,Unicode编码还适用于软件的本地化,即可以针对特定的国家修改软件。另外,使用Unicode编码,软件开发人员可以修改屏幕的提示、菜单和错误信息提示等,来适用于不同国家的语言文字。

你可能感兴趣的:(IBM,扩展,语言)