Mysql字符集介绍

使用Navicate图形化界面工具

字符集

字符集的由来

​ 计算机只能识别二进制代码无论是计算机程序还是数据,最终都会转换成二进制,计算机才能认识。
​ 为了计算机不只能做科学计算,也能处理文字信息。
人们想出了给每一个文字符号编码以便于计算识别处理的办法,这就是计算机字符集的由来。


ASSCII

​ 一套文字符号及其编码,比较规则 的集合。
​ 20世纪60年代初。美国标准化组织ANSI发布了第一个字符集。ASCII
​ 后来又进一步变成了国际标准ISO-646

各大字符集
​ 自ASCII后。为了处理不同的文字。各大计算机公司,各国,标准化政府,组织先后发明了几百种字符集。
​ ISO-8859
​ GB2312-80
​ GBK
​ BIG5
​ 这些五花八门的字符集从收录的字符集到编码规则各不相同。给计算机软件开发和移值带来了很大的困难。一个软件要在使用不同文字的国家和地区发布,必须得要做本地化开发。
​ 基于这个原因,要统一字符编码。


unicode

​ 为了统一字符编码。国际标准化组织ISO的一些成员国于1984年发起制定了新的国际字符集标准。容纳全世界各种语言,文字,和 符号。最后这个标准ISO-10646
​ ISO-10646发布后,遭到了美国计算机公司的反对。
​ 1988年,Xerox公司提议制定了新的以16位编码人统一字符集。并联合不Apple,IBM,SUN,Microsoft等公司成立了Unicode技术委员会。专门负责收集,整理,和编码。于1991年推出了Unicode1.0
​ 都是为了字符编码统一问题,ISO和Unicode协会推出了连个不同人标准。这显然是不利的。后来双方开始谈判。1991年10月达成协议。ISO将Unicode收编。起了个名BMP


UTF-16

​ ISO-10646编码空间足以容纳从古自今使用过的文字和字符。但很多文字字符已经很少用了。
​ 超过99%的在用文字字符都编入了BMP.因此,绝大部分情况下。
​ Unicode双字节方式都能满足需求。而且比双字节编码方式4字节原始编码来说,更节省内存和处理时间 。这也是Unicode流行的原因。
​ 万一使用了BMP以这后文字怎么办?
​ Unicode提出了UTF-16的解决办法。


UTF-8

​ 虽然UTF-16解决了上面问题。但当时的计算机和网络世界还是ASCII的天下。只能处理单字节数据流。UTF-16离开了Unicode环境后。在传输和处理中,都存在问题。
​ 于是又提出了UTF-8的解决文案,
​ UTF-8按一定的规则,将一个ISO10646或Unicode转换成1至4个字节的编码
​ 其中ASCII转成单字节编码。也就严格兼容了ASCII字符集。
​ UTF-8的2,3,4字节用以转换ISO-10646标准的UCS-4原始码。


汉字的一些常见字符集

​ GB2312
​ GB13000
​ GBK
​ GB18030

你可能感兴趣的:(Mysql字符集介绍)