Unicode和UTF系列(4)

如果说GB2312、GBK是ANSI时代的产物,为什么如今还需要制定GB18030呢?以下引用官方的话:"世界许多国家和地区从方便本国和民族应用的角度出发,制定了相应的编码标准和内码体系,如日本的JIS X 0208和JIS X 0212,韩国的KS C 5601和KS C 5657等,这是国际上采用的通行惯例。制定GB 18030同样符合国际惯例,它全面兼容GB 2312,在字汇上兼容GB 13000.1,可以充分利用已有资源,保证不同系统间的兼容性,最大限度地共享资源,为我国软件产业留有巨大的发展空间。可以相信,GB 18030的实施将有利于国产软件的发展并形成规模,使我国的中文信息技术再上一个台阶。"

        GB2312、GBK的编码范围如下:
名称        第一字节        第二字节       
GB2312        0xA1-0xF7(161-247)        0xA1-0xFE(161-254)       
GBK        0x81-0xFE(129-254)        0x40-0xFE(64-254)


        GB18030编码范围如下:
字节数        码位空间
单字节         0x00~0x7F (0-127)
双字节         第一字节在0x81~0xFE (129-254)第二字节在0x40~0x7E,0×80至0×FE(64-126),(128-254)
四字节        第一字节在0x81~0xFE之间 (129-254) 第二字节在0x30~0x39之间 (48-57) 第三字节在0x81~0xFE之间 (129-254) 第四字节在0x30~0x39之间 (48-57)

你可能感兴趣的:(unicode)