GB2312 GBK GB18030编码介绍

     GB2312是最早的国家标准,第一字节存储区01-87(0x01-0x57),第二字节为位码 01-91(0x01-0x5E)。在计算机实现区位码是分别在第一第二字节加上0xA0。则第一字节位 0xA1-0xF7,第二字节为 0xA1-0xFE

 

    GBK在具体实现时也是两字节编码,它完全兼容GB2312标准。第一字节为0x81-0xFE,第二字节为 0x40-0x7E 0x80-0xFE。如下图所示。一般目前如果你针对大陆用户,那么你选择GBK编码就足够了。它不但包含绝大多数汉字,也包括了CJK中的汉字。

 

 

GB2312 GBK GB18030编码介绍_第1张图片   

 

    GB18030 它是多字节编码,有2字节和4字节之分。码位空间达到一百多万个,是目前最全的标准。但由于他有4字节的编码,所以会造成存储浪费,所以根据需要选择。个人认为网站与其选择GB18030还不如选择unicode存储。可以根据需要把unicode转换成各种编码格式。

 

 

    

你可能感兴趣的:(存储)