汉字编码浅析

汉字编码浅析
1. GBK是GB2312与BIG5的超集,结构基本相同
2. GB13000/Unicode是等同采用ISO 10646/Unicode的国家标准
3. GB13000/Unicode又是GBK的超集
4. UTF-8/UTF-16只是Unicode的编码变种,并不是字符集合的变种
5. GB18030是目前最大的汉字字符集合,比GB13000都要大
6. GB18030不是简单的GBK超集,其体系结构完全不一样
7. GB18030从未实现并真正应用过......
8. GBK是国家规范,GB2312/GB18030/GB13000则为国家标准
9. ASCII、GB2312、GBK到GB18030是向下兼容的(另一说)
10. Unicode只与ASCII兼容(另一说)

GB2312<GBK<GB13000/Unicode<ISO 10646/Unicode
BIG5<GBK<GB13000/Unicode<ISO 10646/Unicode
GB13000/Unicode<GB18030
Unicode==UTF-8==UTF-16

参考:
1. 程序员趣味读物:谈谈Unicode编码
2. 维基百科全书 - GBK
3. 用信息化手段进行语言文字研究

你可能感兴趣的:(汉字编码浅析)