UTF-8和Unicode简述

Unicode和UTF-8简述

ASCII

	由于计算机是美国人发明的,他们先用127个字符(大小写英文字母
	加上一些符号)编码,用一个字节(256位)即可表示。

GB2312

	要处理中文就必须加多字节数,把中文字符加进去。
	中国制定GB2312编码,把中文加进去。

Unicode

	由于世界各国有不同的符号,各自有各自的编码标准,很难
	不出现冲突,多国语言一起使用就会出先乱码。
	于是Unicode出现了,它把所有的语言都统一到一套编码里面。
	这样就不会出现乱码现象。最常用的是2个字节,出现生僻的
	字符需要4个字节。

UTF-8

	由于Unicode写英文的时候占用的空间是ASCII的两倍。
	浪费空间,于是UTF-8(可变长编码),如其名,他的编码
	字节数是可以变换的,一般是1~6个字节。英文一个字节
	汉字3个字节。

UTF-8和Unicode

	由于两个的特性,我们可以在内存中使用Unicode,当要
	保存的时候使用UTF-8。通过两种编码的转换来实现。
	像在记事本(Unicode编码)中,从文件(UTF-8编码)读取UTF-8的编码转化为Unicode
	然后显示,当要存储的时候,再转换回去。

你可能感兴趣的:(笔记,unicode)