MySQL的字符集支持(Character Set Support)有两个方面:

     字符集(Character set)和排序方式(Collation)。

对于字符集的支持细化到四个层次:

     服务器(server),数据库(database),数据表(table)和连接(connection)。

1.MySQL默认字符集

MySQL对于字符集的指定可以细化到一个数据库,一张表,一列,应该用什么字符集。

但是,传统的程序在创建数据库和数据表时并没有使用那么复杂的配置,它们用的是默认的配置,那么,默认的配置从何而来呢? 
    (1)编译MySQL 时,指定了一个默认的字符集,这个字符集是 latin1;

    (2)安装MySQL 时,可以在配置文件 (my.ini) 中指定一个默认的的字符集,如果没指定,这个值继承自编译时指定的;

    (3)启动mysqld 时,可以在命令行参数中指定一个默认的的字符集,如果没指定,这个值继承自配置文件中的配置,此时 character_set_server 被设定为这个默认的字符集;

    (4)当创建一个新的数据库时,除非明确指定,这个数据库的字符集被缺省设定为character_set_server;

    (5)当选定了一个数据库时,character_set_database 被设定为这个数据库默认的字符集;

    (6)在这个数据库里创建一张表时,表默认的字符集被设定为 character_set_database,也就是这个数据库默认的字符集;

    (7)当在表内设置一栏时,除非明确指定,否则此栏缺省的字符集就是表默认的字符集;

简单的总结一下,如果什么地方都不修改,那么所有的数据库的所有表的所有栏位的都用 latin1 存储,不过我们如果安装 MySQL,一般都会选择多语言支持,也就是说,安装程序会自动在配置文件中把 default_character_set 设置为 UTF-8,这保证了缺省情况下,所有的数据库的所有表的所有栏位的都用 UTF-8 存储。

2.查看默认字符集(默认情况下,mysql的字符集是latin1(ISO_8859_1)

通常,查看系统的字符集和排序方式的设定可以通过下面的两条命令:

   
   
   
   
  1. mysql> SHOW VARIABLES LIKE 'character%';  
  2.  
  3. +--------------------------+---------------------------------+  
  4.  
  5. | Variable_name            | Value                           |  
  6.  
  7. +--------------------------+---------------------------------+  
  8.  
  9. | character_set_client     | latin1                          |  
  10.  
  11. | character_set_connection | latin1                          |  
  12.  
  13. | character_set_database   | latin1                          |  
  14.  
  15. | character_set_filesystem | binary                    |  
  16.  
  17. | character_set_results    | latin1                          |  
  18.  
  19. | character_set_server     | latin1                          |  
  20.  
  21. | character_set_system    | utf8                            |  
  22.  
  23. | character_sets_dir       |  /usr/share/mysql/charsets/  |  
  24.  
  25. +--------------------------+---------------------------------+  
  26.  
  27. mysql> SHOW VARIABLES LIKE 'collation_%';  
  28.  
  29. +----------------------+-----------------+  
  30.  
  31. | Variable_name        | Value           |  
  32.  
  33. +----------------------+-----------------+  
  34.  
  35. | collation_connection | utf8_general_ci |  
  36.  
  37. | collation_database   | utf8_general_ci |  
  38.  
  39. | collation_server     | utf8_general_ci |  
  40.  
  41. +----------------------+-----------------+  

3.修改默认字符集

(1) 最简单的修改方法,就是修改mysql的my.ini文件中的字符集键值,

如    default-character-set = utf8

      character_set_server = utf8

   修改完后,重启mysql的服务,service mysql restart

   使用 mysql> SHOW VARIABLES LIKE 'character%';查看,发现数据库编码均已改成utf8

 

   
   
   
   
  1. mysql> SHOW VARIABLES LIKE 'character%';  
  2.  
  3. +--------------------------+---------------------------------+  
  4.  
  5. | Variable_name            | Value                           |  
  6.  
  7. +--------------------------+---------------------------------+  
  8.  
  9. | character_set_client     | utf8                            |  
  10.  
  11. | character_set_connection | utf8                            |  
  12.  
  13. | character_set_database   | utf8                            |  
  14.  
  15. | character_set_filesystem | binary                          |  
  16.  
  17. | character_set_results    | utf8                            |  
  18.  
  19. | character_set_server     | utf8                            |  
  20.  
  21. | character_set_system     | utf8                            |  
  22.  
  23. | character_sets_dir       |  /usr/share/mysql/charsets/  |  
  24.  
  25. +--------------------------+---------------------------------+  

   (2) 还有一种修改字符集的方法,就是使用mysql的命令

   
   
   
   
  1. mysql> SET character_set_client = utf8 ;  
  2.  
  3.   mysql> SET character_set_connection = utf8 ;  
  4.  
  5.   mysql> SET character_set_database = utf8 ;  
  6.  
  7.   mysql> SET character_set_results = utf8 ;  
  8.  
  9.   mysql> SET character_set_server = utf8 ;  
  10.  
  11.   mysql> SET collation_connection = utf8 ;  
  12.  
  13.   mysql> SET collation_database = utf8 ;  
  14.  
  15.   mysql> SET collation_server = utf8 ;  

一般就算设置了表的默认字符集为utf8并且通过UTF-8编码发送查询,你会发现存入数据库的仍然是乱码。问题就出在这个connection连接层上。解决方法是在发送查询前执行一下下面这句:

   
   
   
   
  1. SET NAMES 'utf8';它相当于下面的三句指令:  
  2.  
  3. SET character_set_client = utf8;  
  4.  
  5. SET character_set_results = utf8;  
  6.  
  7. SET character_set_connection = utf8;  

总结:

因此,使用什么数据库版本,不管是3.x,还是4.x还是5.x,其实对我们来说不重要,重要的有二:

1) 正确的设定数据库编码.MySQL4.0以下版本的字符集总是默认ISO8859-1,MySQL4.1在安装的时候会让你选择。如果你准备使用UTF- 8,那么在创建数据库的时候就要指定好UTF-8(创建好以后也可以改,4.1以上版本还可以单独指定表的字符集)

2) 正确的设定数据库connection编码.设置好数据库的编码后,在连接数据库时候,应该指定connection的编码,比如使用jdbc连接时,指定连接为utf8方式.