机内码和区位码关系

汉字字库:
GB2312-80共收录汉字图形符号共7445个,汉字6763个.
频度:一级:3755个
     二级:3008个
汉字图形符号根据其位置将其分为"94个区"每个区包含94个汉字字符,每个汉字字符又称为"位"
其中"区"的序号为1~94,
    "位"的序号为1~94
若以横向表示位号,纵向表示区号,则"区"和"位"构成一个二维坐标.给定一个区值和位值就可以确定一个惟一的汉字或图形符号.即4位阿拉伯数字就可以惟一地确定一个汉字或符号.
如"北"字为1717,而"京"的区位码为"3009"
前两位为"区"号,后两位为"位"号.
其中1到15区是各种图形符号,制表符和一些主要国家的语言字母.16区至87区是汉字.其中16到55区为一级汉字,56至87区为二级汉字.

PC机的文本文件中,汉字是以机内码形式存储的,每一个汉字占两个字节,其中第一个字节表示机内码的区码
汉字的机内码的区码范围是从0a1h开始的,对应的区位码中的区码的第一区,而机内码的第二字节为机内码的位码,范围也是从0a1h开始的,对应某区中的第一个位码,也就是说:
汉字机内码-0a0a0h=汉字的区位码:
"北"机内码为b1b1:  b1b1-a0a0=1111==>11h=17区码,11h=17位码
所以"北"字的区码为1717
单片机中
uchar HZK[]="北京"
则:HZK[0]=0XB1
   HZK[1]=0XB1
   HZK[2]=0XBE
   HZK[3]=0XA9

你可能感兴趣的:(机内码和区位码关系)