机内码、国际码、区位码换算

机内码、国际码是十六进制的,区位码是十进制的。
一般换算全部用十六进制,不过特别注意:区位码从十进制转换为十六进制是两位两位分别转换的。
国际码=区位码(十六进制)+2020H
机内码=国际码+8080H 

如:某汉字的区位码是2534。则25D=19H,34D=22H
      国际码=1922H+2020H=3952H
      机内码=3952H+8080H=B9D2H
所有的国标码汉字及符号组成一个94行94列的二维代码表。在此方阵中,每一行称为一个"区",每一列称为一个"位"。这个方阵实际上组成一个有94个区(编号由01到94),每个区有94个位(编号由01到94)的汉字字符集。每个字节分别用两位十进制编码,前字节的编码称为区码,后字节的编码称为位码,此即区位码,其中,高两位为区号,低两位为位号。这样区位码可以唯一地确定某一汉字或字符;反之,任何一个汉字或符号都对应一个唯一的区位码,没有重码。如“保”字在二维代码表中处于17区第3位,区位码即为“1703 ”。

汉字的机内码采用变形国标码,其变换方法为:将国标码的每个字节都加上128,即将两个字节的最高位由0改1,其余7位不变,如:由上面我们知道,“保”字的国标码为3123H,前字节为00110001B,后字节为00100011B,高位改1为10110001B和10100011B 即为B1A3H,因此,保字的机内码就是B1A3H;。

        显然,汉字机内码的每个字节都大于128,这就解决了与西文字符的ASCII码冲突的问题。

       英文字符的的机内码是最高为为0的8位ASCII码。为了不与7位ASCII码发生冲突,把国标码每个字节的最高位由0改为1,其余位不变的编码作为汉字字符的机内码。

       汉字机内码的范围用二进制表示是: 10100001 10100001 11111110 11111110 机内码的高位和低位比对应的国标码的高位和低位大(128)10或(10000000)2或(80)H 即: 机内码高位 = 国标码高位 + 80H      机内码低位 = 国标码低位 + 80H 又因为: 国标码高位 = 区码 + 20H      国标码低位 = 位码 + 20H 所以: 机内码高位 = 区码 + A0H     机内码低位 = 位码 + A0H  也就是说,机内码高位和机内码低位分别比对应的区码和位码大(160)10或(10100000)2或 (A0)H 例如:汉字"啊"的区位码为"1601",其中区码为(16)10或(10)H,位码为(01)10或(01)H。 则: 机内码高位 = 10H + A0H = B0H      机内码低位 = 01H + A0H = A1H      所以:机内码= B0A1H

你可能感兴趣的:(机内码、国际码、区位码换算)