常见的语言编码

常见的语言编码有:

GB2312:简体中文编码,一个汉字占用2字节,在大陆是主要编码方式。

BIG5:繁体中文编码。主要在台湾地区采用。

GBK:支持简体及繁体中文,但对他国非拉丁字母语言还是有问题。

UTF-8:Unicode编码的一种。Unicode用一些基本的保留字符制定了三套编码方式,它们分别UTF-8,UTF-16和UTF-32。在UTF-8中,字符是以8位序列来编码的,用一个或几个字节来表示一个字符。这种方式的最大好处,是UTF-8保留了ASCII字符的编码做为它的一部分。UTF-8俗称“万国码”,可以同屏显示多语种,一个汉字占用3字节。为了做到国际化,网页应尽可能采用UTF-8编码。

当然,处理中文时http头也要改成UTF-8编码的—–加上。

语言 字符集 正式名称

英语、西欧语 ASCII,ISO-8859-1 MBCS多字节

简体中文 GB2312 MBCS多字节

繁体中文 BIG5 MBCS多字节

简繁中文 GBK MBCS多字节

中文、日文及朝鲜语 GB18030 MBCS多字节

各国语言 UNICODE,UCS DBCS宽字节

你可能感兴趣的:(编码)