中文字符集

GB2312(1980年):16位字符集,收录有6763个简体汉字,682个符号,共7445个字符。
优点:适用于简体中文环境,属于中国国家标准,通行于大陆,新加坡等地也使用此编码; 
缺点:不兼容繁体中文,其汉字集合过少。 
GBK(1995年):16位字符集,收录有21003个汉字,883个符号,共21886个字符。
优点:适用于简繁中文共存的环境,为简体Windows所使用(代码页cp936),向下完全兼容gb2312,向上支持 ISO-10646 国际标准 ;所有字符都可以一对一映射到unicode2.0上。
缺点:不属于官方标准,和big5之间需要转换;很多搜索引擎都不能很好地支持GBK汉字。
GB18030(2000年):32位字符集;收录了27484个汉字,同时收录了藏文、蒙文、维吾尔文等主要的少数民族文字。 
优点:可以收录所有你能想到的文字和符号,属于中国最新的国家标准;
缺点:目前支持它的字库较少。
BIG5(1992):BIG5收录13461个汉字和符号,通行于台湾、香港地区的一个繁体字编码方案,BIG5是台湾资讯工业策进会根据以上标准制定的编码方案。BIG5码是双字节编码方案,其中第一个字节的值在OXAO-OXFE之间,第二个字节在OX40-OX7E和OXA1-OXFE之间。

你可能感兴趣的:(中文,编码,字符集)