区位码

1980年,为了使每一个汉字有一个全国统一的代码,我国颁布了第一个汉字编码 的国家标准: GB2312-80《信息交换用汉字编码字符集》基本集,这个字符集是我国中文信息处理技术的发展基础,也是目前国内所有汉字系统的统一标准。 国标码是一个四位十六进制数,区位码是一个四位的十进制数,每个国标码或区位码都对应着一个唯一的汉字或符号,但因为十六进制数我们很少用到,所以大家常用的是区位码,它的前两位叫做区码,后两位叫做位码。

 

汉字库分布情况

 

一级汉字 16-55区 (3755个最常用的汉字,按拼音字母的次序排列)

二级汉字 56-87区 (3008个汉字,按部首次序排列)

三级汉字 1-9区

空闲未用 10-15区

 

01-09区为特殊字符.

 

我的理解,区位码是gb2312才用到的,每个汉字都有自己的区位码,而且是唯一的。这样,汉字的gb2312的编码是否就是它的区位码呢?

 

 

你可能感兴趣的:(区)