MySQL的字符集问题

    MySQL在后来的新版本(4.1及以上)开始支持多字符集,这样也开始引发由于配置不当导致的乱码问题。

    假设数据库实例使用的编码是GBK。

1,通过unixODBC访问的时候,实际起作用的编码设置仅仅在数据源配置中

     odbc.ini中定义如下:

[TESTDSN2]
Description = MySQL test database
Trace = On
TraceFile = stderr
Driver = mysql
SERVER = 192.168.1.14

USER = cutscreen
PASSWORD = cutscreen#match
PORT = 3306
DATABASE = images
socket = /tmp/mysql.sock
charset = GBK

    属性charset就是起到这个作用的,它表示数据库实例使用的就是GBK编码。

    澄清一下,程序通过unixODBC访问数据库的时候,仅仅跟这个设置有关,与my.cnf配置文件毫无关系。

2,通过mysql命令访问的时候,起作用的仅仅是my.cnf

[client]
default-character-set=gbk

# The MySQL server
[mysqld]
character-set-server=gbk

[mysql]
default-character-set=gbk

    这个配置文件必须在使用mysql命令所在的机器上。
    
    如果没有做这个设置,使用mysql命令登录后,执行insert插入数据的时候,就会导致乱码,常见的是??,就是表示无法解释的字符。

    只有设置了这些,才能正确插入中文数据。
    
3, 查询所有可用的字符集
show character set;

4,查询当前连接的字符集情况
show variables like '%character_set%';

character_set_client     | gbk   --->  客户端字符集
character_set_connection | gbk   --->  客户端与服务器端连接采用的字符集
character_set_results    | gbk   --->  SELECT查询返回数据的字符集
character_set_database   | utf8     --->  数据库采用的字符集,这个值就是编码的默认值,没有太大实际意义,实际操作中可以通过建立不同编码的数据库实例或者数据表来调整实际的编码设置,这里这个值取决于character-set-server配置或者编译安装MySQL时候设置的DEFAULT_CHARSET属性

附录:
    
     在解决乱码问题的过程中也从网络上查到一些有用的资料,写的挺好,摘录在下面。

     下面内容摘自http://www.blogjava.net/wldandan/archive/2007/09/04/142669.html:

     MySQL对于字符集的指定可以细化到一个数据库,一张表,一列,应该用什么字符集。

但是,传统的 程序在创建数据库和数据表时并没有使用那么复杂的配置,它们用的是默认的配置,那么,默认的配置从何而来呢?
    (1)编译MySQL 时,指定了一个默认的字符集,这个字符集是 latin1;
    (2)安装MySQL 时,可以在配置文件 (my.ini) 中指定一个默认的的字符集,如果没指定,这个值继承自编译时指定的;
    (3)启动mysqld 时,可以在命令行参数中指定一个默认的的字符集,如果没指定,这个值继承自配置文件中的配置,此时 character_set_server 被设定为这个默认的字符集;
    (4)当创建一个新的数据库时,除非明确指定,这个数据库的字符集被缺省设定为character_set_server;
    (5)当选定了一个数据库时,character_set_database 被设定为这个数据库默认的字符集;
    (6)在这个数据库里创建一张表时,表默认的字符集被设定为 character_set_database,也就是这个数据库默认的字符集;
    (7)当在表内设置一栏时,除非明确指定,否则此栏缺省的字符集就是表默认的字符集;

简单的总结一下,如果什么地方都不修改,那么所有的数据库的所有表的所有栏位的都用 latin1 存储,不过我们如果安装 MySQL,一般都会选择多语言支持,也就是说,安装程序会自动在配置文件中把 default_character_set 设置为 UTF-8,这保证了缺省情况下,所有的数据库的所有表的所有栏位的都用 UTF-8 存储。

    下面内容摘自http://blog.sina.com.cn/s/blog_8a18c33d01011yla.html:
  MySQL的字符集处理是这样的:

  1、发送请求。
  1)客户端发送请求到服务器端。
  2)服务器端会把请求的数据从客户端字符集(character_set_client)转成服务器连接字符集(character_set_connection)。
  3)然後服务器会检测存储区域(table,column)的字符集,然后把数据从连接字符集(character_set_connection)转为存储区域(table,column)的字符集,然後再存储或者查询。

  2、返回请求。
  1)服务器将存储区域(table,column)的字符集转换成服务器连接字符集(character_set_connection)。
  2)将服务器连接字符集(character_set_connection)转换成结果字符集(character_set_results),再发送到客户端。


你可能感兴趣的:(mysql,字符集)