MySQL的字符集支持(Character Set Support)有两个方面: 

1、字符集(Character set)

2、排序方式(Collation)。 

对于字符集的支持细化到四个层次: 

1、服务器(server)

2、数据库(database)

3、数据表(table)

4、连接(connection)

注意:MySQL对于字符集的指定可以细化到一个数据库,一张表,一列,应该用什么字符集。

###################################################################


第一问:mysql默认字符集能否进行修改呢?

1、修改配置文件:

[mysqld]

default-character-set = utf8 

default-collation=utf8_general_ci

#character_set_server = utf8

#[client]

#default-character-set=utf8

修改完后,重启mysql的服务,service mysql restart

2、命令修改(不推荐,除非有特殊情况)

mysql> SET character_set_client = utf8 ;  

mysql> SET character_set_connection = utf8 ;   

mysql> SET character_set_database = utf8 ;   

mysql> SET character_set_results = utf8 ;    

mysql> SET character_set_server = utf8 ;   

mysql> SET collation_connection = utf8 ;  

mysql> SET collation_database = utf8 ;   

mysql> SET collation_server = utf8 ; 

有时候设置了表的默认字符集为utf8并且通过UTF-8编码发送查询,存入数据库的仍然是乱码。那connection连接层上可能出了问题。解决方法是在发送查询前执行一下下面这句: SET NAMES 'utf8';它相当于下面的三句指令:

SET character_set_client = utf8;

SET character_set_results = utf8;

SET character_set_connection = utf8;

注意:具体的参数和MySQL的安装方式以及版本有密切关系,比较成熟的版本默认字符集是utf-8,当然具体怎么定义,可参考官方文档。

###################################################################


第二问:查看MySQL默认字符集(默认情况下,mysql的字符集是latin1) 

通常,查看系统的字符集和排序方式的设定可以通过下面的两条命令:

SHOW VARIABLES LIKE 'character%'; 

SHOW VARIABLES LIKE 'collation_%'; 

MySQL字符集导致的乱码问题总结_第1张图片

###################################################################


第三问:传统的程序在创建数据库和数据表时并没有使用那么复杂的配置,它们用的是默认的配置,那么,默认的配置从何而来呢? 

(1)编译MySQL 时,指定了一个MySQL默认的字符集,这个字符集是 latin1; 

(2)安装MySQL 时,可以在配置文件 (my.cnf,或者my.ini) 中指定一个默认的的字符集,如果没指定,这个值继承自编译时指定的; 

(3)启动mysqld 时,可以在命令行参数中指定一个默认的的字符集,如果没指定,这个值继承自配置文件中的配置,此时 character_set_server 被设定为这个默认的字符集;

(4)当创建一个新的数据库时,除非明确指定,这个数据库的字符集被缺省设定为character_set_server; 

(5)当选定了一个数据库时,character_set_database 被设定为这个数据库默认的字符集;  

(6)在这个数据库里创建一张表时,表默认的字符集被设定为 character_set_database,也就是这个数据库默认的字符集;

(7)当在表内设置一栏时,除非明确指定,否则此栏缺省的字符集就是表默认的字符集; 

简单的总结一下,如果什么地方都不修改,那么所有的数据库的所有表的所有栏位的都用 latin1 存储,不过我们如果安装 MySQL,一般都会选择多语言支持,也就是说,安装程序会自动在配置文件中把 default_character_set 设置为 UTF-8,这保证了缺省情况下,所有的数据库的所有表的所有栏位的都用 UTF-8 存储。

###################################################################


第四问:还有什么情况下会由于MySQL的原因导致乱码?

这种情况可能和使用高可用软件或者插件导致的,比如mysql-proxy等

例子:mysql proxy 乱码问题 

有时候通过proxy连上数据库之后,查到的字符串始终是乱码,即便手工执行了set names ‘utf8′也没有效果。

解决办法,mysql server必须设置

修改my.cnf文件

[mysqld]


skip-character-set-client-handshake

init-connect='SET NAMES utf8'

default-character-set=utf8

###################################################################


第五问:什么原因还会导致乱码问题?

1、浏览器问题

2、代理问题

3、代码字符集问题

4、数据库代理字符集问题

有很多原因都可能导致网站乱码,根据自己的实际情况来排除,这里只是讨论MySQL问题,其它原因不予深究。