Unicode 编码

粗暴的理解:

Unicode其实就是世界上各个国家的每种文字都会在Unicode表上对应一个数字

var a = '我是中国人'

undefined

a.charCodeAt('2')

20013

a.charCodeAt('0')

25105

a.charCodeAt('3')

22269

英文字母也是一样。

所以这样,在进行数据传输的时候,我们可以显示对应的文字了。

不要理解为翻译,别以为通过她就可以把中文识别成对应的英文了。

要说翻译,他只是将每种文字翻译成了计算机可识别的形式。

而 UTF (-8/7...) 啊 GB(K/2312)他们是一些对于unicode的封装转换格式的编码解码集,用来在本区域传输数据的,比如在我国用GB2312,来编码进行传输的,你用其他编码方式进行解码,那不就崴了,所以要切换到对应的编码方式才可以正确显示出来。那utf-8呢是现在通用的编码方式,这样的好处,是我们都用统一的编码方式,那么解码也统一的方式就可以了。但是utf8的编码占用空间要比gbk(/gb2312)的大。

你可能感兴趣的:(Unicode 编码)