计算机中汉字的二进制编码表示

      1.常用汉字有3000~5000,无法用一个字节编码。

      2.我国公布的《通用汉字字符集(基本集)及其交换码标准》GB2312-80共收集了7445个字符,用两个字节编码一个字符,每个字节最高位为0。GB2312-80编码简称国标码。

      3.汉字内码是汉字在计算机内部存储、处理和传输用的信息编码。它必须与ASCII码兼容但又不能冲突。内码是把国标码两个字节的最高位置“1”得到的。

      4.汉字输入码又称为外码, 是指从键盘上输入汉字时使用的编码。主要有三类: 数字编码, 拼音编码和字型编码。

       数字编码是用一串数字代表一个汉字。最常用的是区位码.。它是把国标码的每一个字节减去00100000(20H)得到的, 被减去的是控制字符. 高字节为区码, 低字节为位码. 无重码, 难记忆。

      拼音编码是以汉字读音为基础的输入方法. 简单, 重码率高, 输入速度较慢。

      字形编码是根据汉字形状确定的编码. 因为构成汉字的部件是一定的, 所以对这些部件进行编码,按书写顺序依次输入, 就能表示一个汉字. 常见的有五笔字形码和表形码。

      5.字形码用在汉字输出时产生汉字字形。有两种显示字形的方法:矢量字符和位图(Bitmap)字符。

      6.汉字信息处理系统必须要包含汉字库,字库中存储汉字子模,供显示和打印输出时使用。字库可以使固化在只读存储器芯片上的汉卡,也可以是以文件形式存储在软盘或硬盘上的软字库。

 

你可能感兴趣的:(存储)