MySQL会出现中文乱码的原因不外乎下列几点:
1.server本身设定问题,例如还停留在latin1
2.table的语系设定问题(包含character与collation)
3.客户端程式(例如php)的连线语系设定问题
强烈建议使用utf8!!!!
utf8可以兼容世界上所有字符!!!!
一、避免创建数据库及表出现中文乱码和查看编码方法
1、创建数据库的时候:CREATE DATABASE `test`
CHARACTER SET 'utf8'
COLLATE 'utf8_general_ci';
2、建表的时候 CREATE TABLE `database_user` (
`ID` varchar(40) NOT NULL default '',
`UserID` varchar(40) NOT NULL default '',
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
这3个设置好了,基本就不会出问题了,即建库和建表时都使用相同的编码格式。
但是如果你已经建了库和表可以通过以下方式进行查询。
1.查看默认的编码格式:
mysql> show variables like "%char%";
+--------------------------+---------------+
| Variable_name | Value |
+--------------------------+---------------+
| character_set_client | gbk |
| character_set_connection | gbk |
| character_set_database | utf8 |
| character_set_filesystem | binary |
| character_set_results | gbk |
| character_set_server | utf8 |
| character_set_system | utf8 |
+--------------------------+-------------+
注:以前2个来确定,可以使用set names utf8,set names gbk设置默认的编码格式;
执行SET NAMES utf8的效果等同于同时设定如下:
SET character_set_client='utf8';
SET character_set_connection='utf8';
SET character_set_results='utf8';
2.查看test数据库的编码格式:
mysql> show create database test;
+------------+------------------------------------------------------------------------------------------------+
| Database | Create Database |
+------------+------------------------------------------------------------------------------------------------+
| test | CREATE DATABASE `test` /*!40100 DEFAULT CHARACTER SET gbk */ |
+------------+------------------------------------------------------------------------------------------------+
3.查看yjdb数据库的编码格式:
mysql> show create table yjdb;
| yjdb | CREATE TABLE `yjdb` (
`sn` int(5) NOT NULL AUTO_INCREMENT,
`type` varchar(10) NOT NULL,
`brc` varchar(6) NOT NULL,
`teller` int(6) NOT NULL,
`telname` varchar(10) NOT NULL,
`date` int(10) NOT NULL,
`count` int(6) NOT NULL,
`back` int(10) NOT NULL,
PRIMARY KEY (`sn`),
UNIQUE KEY `sn` (`sn`),
UNIQUE KEY `sn_2` (`sn`)
) ENGINE=MyISAM AUTO_INCREMENT=1826 DEFAULT CHARSET=gbk ROW_FORMAT=DYNAMIC |
二、避免导入数据有中文乱码的问题
1:将数据编码格式保存为utf-8
设置默认编码为utf8:
set names utf8;
设置数据库db_name默认为utf8:
ALTER DATABASE `db_name` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;
设置表tb_name默认编码为utf8:
ALTER TABLE `tb_name` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;
导入:
LOAD DATA LOCAL INFILE 'C:\\utf8.txt' INTO TABLE yjdb;
2:将数据编码格式保存为ansi(即GBK或GB2312)
设置默认编码为gbk:
set names gbk;
设置数据库db_name默认编码为gbk:
ALTER DATABASE `db_name` DEFAULT CHARACTER SET gbk COLLATE gbk_chinese_ci;
设置表tb_name默认编码为gbk:
ALTER TABLE `tb_name` DEFAULT CHARACTER SET gbk COLLATE gbk_chinese_ci;
导入:
LOAD DATA LOCAL INFILE 'C:\\gbk.txt' INTO TABLE yjdb;
文件转换:(gb2312 -> utf-8)
iconv -t utf-8 -f gb2312 -c search.dat > search22.dat
注:1.UTF8不要导入gbk,gbk不要导入UTF8;
2.dos下不支持UTF8的显示;
三、解决网页中乱码的问题
将网站编码设为 utf-8,这样可以兼容世界上所有字符。
如果网站已经运作了好久,已有很多旧数据,不能再更改简体中文的设定,那么建议将页面的编码设为 GBK, GBK与GB2312的区别就在于:GBK能比GB2312显示更多的字符,要显示简体码的繁体字,就只能用GBK。
1.编辑/etc/my.cnf ,在[mysql]段加入default_character_set=utf8;
2.在编写Connection URL时,加上?useUnicode=true&characterEncoding=utf-8参;
3.在网页代码中加上一个"set names utf8"或者"set names gbk"的指令,告诉MySQL连线内容都要使用
utf8或者gbk;
作者: www.quicklinux.org
邮件: [email protected]
MySQL4.1是比较烦人.支持多语言的细化设置.再加上PhpMyadmin-2.6也比较笨.默认就是改不动的UTF-8.怎么弄都乱码.好了.废话少说.我们来一步步解决这个问题:
1. 修改/etc/my.cnf文件.改成如下内容:
[mysqld]
datadir=/var/lib/mysql
socket=/var/lib/mysql/mysql.sock
default-character-set=utf8
[mysql.server]
user=mysql
basedir=/var/lib
[mysqld_safe]
err-log=/var/log/mysqld.log
pid-file=/var/run/mysqld/mysqld.pid
注意.就是加入了一句: default-character-set=utf8
2. 命令 /etc/init.d/mysqld restart 重新启动MySQL.
3. 打开PhpMyadmin. 选择Lang为"Chines simplifies(zh-utf-8)". 选择"MySQL连接校对为utf8_general_ci". 点"服务器变量和设置". 可以看到:
character set client utf8 utf8
character set connection utf8 utf8
character set database utf8 utf8
character set results utf8 utf8
character set server utf8 utf8
character set system utf8 utf8
collation connection utf8_general_ci utf8_general_ci
collation database utf8_general_ci utf8_general_ci
collation server utf8_general_ci utf8_general_ci
从这里可以看到character全部变成UTF-8了.
为什么都要改成UTF-8呢?改成GB2312不行吗?解释如下:
我也不想改成UTF-8. 只是PhpMyadmin 2.6在MySQL 4.1的时候只会用UTF-8. 连其他页面的charset也都是UTF-8. 改成GB23122一定会乱码. 我们只能凑PhpMyadmin了. 只有在MySQL 3.23的时候PhpMyadmin才会多一个GB2312的页面charset.这时候是正常的.
3. 将以前的MySQL 3.23的库文件导入MySQL 4.1的库.有两种情况:
一是从PhpMyadmin上导入. 这时候你要注意的是在选择库文件的页面左下脚有个"文件的字符集:". 默认是UTF-8. 要改成Gb23122. 否则导进去乱码.
二是在Linux下导入.这时候你需要先在库文件的头部加一行:
SET NAMES 'gb2312';
注意最后也是;号. 别漏了. 然后执行: MySQ -u 用户名 -p 密码 xxx.sql > 库名
导入完成以后再用PhpMyadmin打开看. 里面的中文字就是正确的.
4.从MySQL 4.1里导出库文件
一.用PhpMyadmin导出.导出倒是问题不大.如果PhpMyadmin的浏览页面里显示的中文是正常的.那么导出肯定也是正常的.
二.在Linux上导出.如果用mysqldump导出出现了乱码也没有关系.可以运行iconv来转换一下:
iconv -c -f UTF-8 -t GB2312 库文件名 > 新的Gb2312的库文件名
综上所述.需要注意:
1. 尽量在需要导入的库文件的开头加入 SET NAMES 'Gb2312'; 告诉MySQLl你要导入的是一个Gb2312的文件.
2. 可能你需要这个: SET NAMES 'utf8'; 在登陆到MySQL后用.
3. 把character的一些默认参数改到UTF-8上.有时可以减少一些困扰.不过也不是必须的.
4. 在MySQL上使用: SHOW VARIABLES LIKE 'character_set_%'; 用来查看当前的状态.
5. 如果出现乱码也不要怕.一是你要注意留存原有的备份.二是用iconv来进行转化.