让MYSQL彻底支持中文

作者: anthony855
来自:LinuxSir.Org

提要:
系统自带的mysql默认字符集不是gbk,因此给数据库的推广应用以及中文程序的开发带来极大的不便,在没完没了的GBK和UTF8的转换过程中消耗了我们无数的精力以及系统的资源.经过摸索尝试解决了中文支持问题,经验与大家分享一下.

先将让slack支持中文,方法可以看"linuxsir.org 之Slackware讨论区",然后重新编译mysql,原来系统mysql的要先用卸载.
login:root

shell> removepkg mysql
shell> groupadd mysql
shell> cd /app
shell> mkdir mysql
shell> chmod 744 mysql
shell> useradd -G mysql -s /bin/bash –p /app/mysql mysql
shell> chown -R mysql.mysql mysql

 

下载mysql4.x.x

shell> gunzip < mysql-VERSION.tar.gz | tar -xvf -
shell> cd mysql-VERSION
shell> CFLAGS="-O3 -mcpu=pentium3" /
CXX=gcc /
XXFLAGS="-O3 -mcpu=pentium3 -felide-constructors" /
./configure --prefix=/app/mysql /
--with--charset=gbk /
--with-extra-charsets="gbk gb2312 big5 utf8"/
--with-unix-socket-path=/etc/mysql.sock /
--enable-local-infile /
--enable-thread-safe-client /
--enable-assembler /
--with-client-ldflags=-all-static /
--with-mysqld-ldflags=-all-static


//-mcpu 根据CPU类型优化编译,可以让你的mysq表现更好!可选项目很多:i386, i486, i586, i686, pentium, pentium-mmx, pentiumpro, pentium2, pentium3, pentium4, k6, k6-2, k6-3, athlon, athlon-tbird, athlon-4, athlon-xp,athlon-mp,winchip-c6, winchip2 , c3.

 

shell> make
------------------------------------------
错误时候
shell> make clean
再回上一步
------------------------------------------------------------

shell> make install
shell> cp support-files/my-medium.cnf /etc/my.cnf
shell> cd /app/mysql
shell> bin/mysql_install_db --user=root

shell> chown -R root .
shell> chown -R mysql var
shell> chgrp -R mysql .
shell> ./bin/mysqld_safe --user=root --default-character-set=gbk &
shell> ./bin/mysqladmin -u root password 'new-password'
shell> ./bin/mysql -u root --default-character-set=gbk -p

mysql> status
...
Server characterset: gbk
Db characterset: gbk
Client characterset: gbk
Conn. characterset: gbk
....


看见characterset全是gbk就算成功了.
----------------------------------------------------------------------------------------------------
在UTF8字符集的老数据库中,创建中文支持表脚本如下,对字段加上字符集说明

CREATE TABLE `test`.`cn` (
`zh` CHAR(10) CHARACTER SET gb2312 COLLATE gb2312_chinese_ci NOT NULL,
`中文` INT(11) NOT NULL
)
ENGINE = MYISAM;


注:CHARACTER SET 写GB2312 和gbk都可以,gbk优于gb2312.

 

对于新创建的数据库加个默认字符集声明GBK,就不用建表时候每个字段声明了,这样看起来简单流畅,没有特殊的痕迹,建议多采用这种方法.

mysql> CREATE DATABASE dbCN DEFAULT CHARACTER SET gbk COLLATE gbk_chinese_ci;

CREATE TABLE `dbCN`.`cn` (
`zh` CHAR(10) NOT NULL,
`中文` INT(11) NOT NULL
)
ENGINE = MYISAM;

mysql> insert into cn values("真的?",1);

 

注:如果这些脚本用bin/mysql命令行是输入不了,可以 用mysql query Browser,或者编程执行.
--------------------------------------------------------------------------------------------------------

shell> bin/mysql -u root --default-character-set=gbk -p

mysql>use test
mysql> select * from cn;
+--------+------+
| zh | 中文 |
+--------+------+
| 真的?| 1  |
+--------+------+
1 row in set (0.00 sec)

---------------------------------------------

 

最后修改启动文件/etc/rc.d/rc.mysqld

改路径/app/mysql/bin/mysqld_safe
改路径/app/mysql/var/web.pid

/app/mysql/bin/mysqld_safe 后面加入 --user=root --default-character-set=gbk

 

=====================================================================

MySQL(4.1以后版本) 服务器中有六个关键位置使用了字符集的概念,他们是:client connectiondatabaseresultsserver systemMySQL有两个字符集概念:一个就是字符集本身,一个是字符集校验规则。字符集影响数据在传输和存储过程中的处理方式,而字符集校验则影响ORDER BYGROUP BY这些排序方式。

1.和存储有关的
服务器字符集 (@@character_set_server)
库字符集 (@@character_set_database)
表字符集
字段字符集

character_set_server: 服务器安装时指定的默认字符集设定。
character_set_database
: 数据库服务器中某个库使用的字符集设定,如果建库时没有指明,将使用服务器安装时指定的字符集设置。
character_s
ystem: 数据库系统使用的字符集设定。

在创建一个表的时候,每个字段只要不是binary,都会有一个字符集。如果不指定,那么在SHOW CREATE TABLE的时候,它是不会显示出来的。
建表时候,字段字符集的选取方式如下:

* if 字段指定的字符集
* else if
表指定的字符集
* else if @@character_set_database
* else @@character_set_server (
如果没有设定,这个值为latin1)

2.和传输有关的
@@
character_set_connection
@@character_set_results
@@character_set_client

character_set_connection: 连接数据库的字符集设置类型,如果php没有指明连接数据库使用的字符集类型就按照服务器端默认的字符设置
character_set_results: 数据库给客户端返回时使用的字符集设定,如果没有指明,使用服务器默认的字符集
character_set_client:
客户端使用的字符集,相当于网页中的字符集设置

3.字符集的校对规则
字符集的校对规则设定分别由上面的
character_set_connection, character_set_database, character_set_server决定

collation_connection: 连接字符集的校对规则
collation_database
:
默认数据库使用的校对规则。当默认数据库改变时服务器则设置该变量。如果没有默认数据库,变量的值同collation_server
collation_server: 服务器的默认校对规则

以上内容中character_set_client, character_set_connection, character_set_results 受客户端默认字符集影响,其中php编译mysql模块时的默认字符集同样也受到它链接的mysql动态库影响,从而影响到phpcharacter_set_connection, character_set_client设定。当默认字符集不是utf8时,设置my.cnf

[mysqld]
default-character-set=utf8

default-collation=utf8_general_ci

default-character-set只能改变对存储层(server,database,table,column,system)的设定,对于客户端和服务器端的通讯层没有任何影响。
mysql> SHOW VARIABLES LIKE ‘character_set_%’;

+————————–+—————————————————————————+
| Variable_name | Value |
+————————–+—————————————————————————+
| character_set_client | latin1 |
| character_set_connection | latin1 |
| character_set_database | utf8 |
| character_set_filesystem | binary |
| character_set_results | latin1 |
| character_set_server | utf8 |
| character_set_system | utf8

解决字符集通讯设置不匹配的方法:
(
修改默认的character_set_client,character_set_connection,character_set_result)

1. 重新编译mysqlphp,mysql加入编译参数 –default-character-set=utf8
2.
PHP程序在查询数据库之前,执行mysql_query(”set names utf8;”);
3.
修改my.cnf,在[mysqld]中加入init-connect=”set names utf8” (对于超级用户连接该选项无效)
4.
启动mysqld 加入参数 –skip-character-set-client-handshake 忽略客户端字符集

你可能感兴趣的:(mysql,数据库,服务器,database,character,collation)