MySQL 4.1的字符集支持(Character Set Support)有两个方面:字符集(Character set)和排序方式(Collation)。对于字符集的支持细化到四个层次: 服务器(server),数据库(database),数据表(table)和连接(connection)。下面将分两部分,分别设置服务器编码和数据库、数据表与连接部分的编码,从而杜绝中文乱码的出现。
一 服务器编码设置
服务器编码设置方法有二:
一是安装mysql时,其中会有一个步骤选择编码方式,此时选择gbk即可。如果不选择,默认的编码是latin1;
二是在安装玩mysql之后,手动修改其配置文件,如下:
(1)修改 MySql安装目录下面的my.ini(MySQL Server Instance Configuration 文件)。 设置
default-character-set=gbk(注意,有2处)
(2)修改data目录中相应数据库目录下的db.opt配置文件
(2)修改data目录中相应数据库目录下的db.opt配置文件
default-character-set=gbk
default-collation=gbk_chinese_ci
重启数据库,关闭控制台窗口重新登录数据库即可。
二 数据库、数据表和连接部分的编码设置
2.1 设置数据库和数据表编码
要解决乱码问题,首先必须弄清楚数据库和数据表用什么编码。如果没有指明,将是默认的latin1。
用得最多的应该是这3种字符集 gb2312,gbk,utf8。
如何去指定数据库和数据表的字符集呢?下面也gbk为例:
【在MySQL Command Line Client创建数据库 】
mysql> CREATE TABLE `mysqlcode` (
-> `id` TINYINT( 255 ) UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY ,
-> `content` VARCHAR( 255 ) NOT NULL
-> ) TYPE = MYISAM CHARACTER SET gbk COLLATE gbk_chinese_ci;
Query OK, 0 rows affected, 1 warning (0.03 sec)
其中后面的TYPE = MYISAM CHARACTER SET gbk COLLATE gbk_chinese_ci;
就是指定数据库的字符集,COLLATE (校勘),让mysql同时支持多种编码的数据库。
当然也可以通过如下指令修改数据库数据表的字符集:
alter database mysqlcode default character set 'gbk'.
前面已经设置了服务器、数据库和数据表的编码,那么数据库中的编码便都是 gbk,中文可以存储进去。
用得最多的应该是这3种字符集 gb2312,gbk,utf8。
如何去指定数据库和数据表的字符集呢?下面也gbk为例:
【在MySQL Command Line Client创建数据库 】
mysql> CREATE TABLE `mysqlcode` (
-> `id` TINYINT( 255 ) UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY ,
-> `content` VARCHAR( 255 ) NOT NULL
-> ) TYPE = MYISAM CHARACTER SET gbk COLLATE gbk_chinese_ci;
Query OK, 0 rows affected, 1 warning (0.03 sec)
其中后面的TYPE = MYISAM CHARACTER SET gbk COLLATE gbk_chinese_ci;
就是指定数据库的字符集,COLLATE (校勘),让mysql同时支持多种编码的数据库。
当然也可以通过如下指令修改数据库数据表的字符集:
alter database mysqlcode default character set 'gbk'.
前面已经设置了服务器、数据库和数据表的编码,那么数据库中的编码便都是 gbk,中文可以存储进去。
但是如果你要通过执行insert或select等操作时,仍然
会出现中文乱码问题,这是因为还没设置
“连接(connection)”部分的编码,而
insert、select等数据库操作都包含与数据库的连接动作。如果不信
,你现在可以
执行下面的sql文试一试:
mysql> insert into mysqlcode values(null,'java爱好者');
按回车,结果如下:
按回车,结果如下:
ERROR 1406 (22001): Data too long for column 'content' at row 1
2.2 设置连接编码
设置了服务器、数据库和数据表部分的编码,必须设置连接编码。连接编码设置如下:
mysql> SET character_set_client='gbk';
mysql> SET character_set_connection='gbk'
mysql> SET character_set_results='gbk'
设置好连接编码,下面便可以成功插入中文了:
mysql> SET character_set_connection='gbk'
mysql> SET character_set_results='gbk'
设置好连接编码,下面便可以成功插入中文了:
mysql> insert into mysqlcode values(null,'java爱好者');
Query OK, 0 rows affected (0.02 sec)
Query OK, 0 rows affected (0.02 sec)
其实,上面设置连接编码的三条命令可以简化为一条:
mysql> set names 'gbk';
设置好了连接编码后,在select查询时,也能正确显示中文:
mysql> select * from mysqlcode;
+----+-----------+
| id | content |
+----+-----------+
| 1 | java爱好着 |
+----+-----------+
1 row in set (0.00 sec)
+----+-----------+
| id | content |
+----+-----------+
| 1 | java爱好着 |
+----+-----------+
1 row in set (0.00 sec)
三 完整示例
下面将用一个例子完整地将上面的理论演示一遍,最后达到能向mysql中插入中文的目的:
3.1 设置mysql服务器编码
这一步请参见上文第一节,主要就是在安装mysql之后,修改my.ini和dataTable.db中的编码为gbk
3.2 创建一个数据库
先连接到本地数据库:mysql -h localhost -u root -proot,接着创建一个数据库:
mysql> create database test;
3.3 创建数据表并设置其编码
-- 中文编码测试数据表
use test
DROP TABLE IF EXISTS `test`.`test_nml`;
SET @saved_cs_client = @@character_set_client;
SET character_set_client = gbk;
CREATE TABLE `test`.`test_nml` (
`id` TINYINT( 255 ) UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY,
`content` VARCHAR( 255 ) NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=gbk COMMENT='用户基本信息';
SET character_set_client = @saved_cs_client;
DROP TABLE IF EXISTS `test`.`test_nml`;
SET @saved_cs_client = @@character_set_client;
SET character_set_client = gbk;
CREATE TABLE `test`.`test_nml` (
`id` TINYINT( 255 ) UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY,
`content` VARCHAR( 255 ) NOT NULL
) ENGINE=InnoDB DEFAULT CHARSET=gbk COMMENT='用户基本信息';
SET character_set_client = @saved_cs_client;
这里的红色部分等价于上文中的
TYPE = MYISAM CHARACTER SET gbk COLLATE gbk_chinese_ci;
3.4 插入中文数据
--插入数据
SET @saved_cs_client = @@character_set_client;
set names gbk;
insert into test_nml values(null,'我是中文');
SET @saved_cs_client = @@character_set_client;
set names gbk;
insert into test_nml values(null,'我是中文');
注意:每次执行insert或update或select连接操作时,都必须设置编码,即在前面加上:set names 'gbk';