mysql创建数据库时字符集和排序方式的选择

数据库需要适应各种语言和字符就需要支持不同的字符集(Character Set),每种字符集也有各自的排序规则(Collation)。

在绝大部分情形中,使用何种字符集和排序规则决定于服务器,数据库和表的级别,一般SQL操作不必关心这些。

字符集,用于定义字符在数据库中的编码的集合。 常见的字符集:utf-8、gbk 等。

排序规则,用来定义字符在进行排序和比较的时候的一种规则。 常见的如下:

(1) utf8_general_cs 和 utf8_general_ci (后缀"_cs"或者"_ci"意思是区分大小写和不区分大小写(Case Sensitive & Case Insensitve));
(2) utf8_bin 规定每个字符串用二进制编码存储,区分大小写,可以直接存储二进制的内容。

所谓排序规则,就是指字符比较时是否区分大小写,以及是按照字符编码进行比较还是直接用二进制数据比较。

另外,utf8_unicode_ci比较准确,utf8_general_ci速度比较快。如果有德语、法语或者俄语,请一定使用utf8_unicode_ci,通常情况下 utf8_general_ci的准确性就够我们用的了。

你可能感兴趣的:(计算机基础)