网页乱码一直是网络编程高手都头痛的问题,我是一个PHP Web编程的初学者,学习当中也遇到了这个问题,查找了相关的资源,总结如下:
一般的中文编码:gb2312,gbk(前者的一种扩展),这两种编码缺乏国际通用性;UTF-8为国际标准编码,一般网页编码使用该编码方式;
出现乱码大部分是由于编码方式的不一致导致的,其中主要有四个地方不一致就可能存在这个可能:
1、页面文件的编码方式(.html,.php等)
2、 html.head中指定浏览器的编码方式
3、MySql数据库传输的编码方式
4、Apache字符集
这四个的编码一般需要统一起来,统一为UTF-8更为合适。以下四点应该注意:
1、PlusEdit这种编辑会识别文件编码,打开并保存后编码方式保持不变 ;而像visual studio 2005、Zend Studio等开发工具会以工具首选项中的字符集打开并保存,可能改变原来的编码方式,可能原来是utf-8的,zend studio ->工具(首选项编码为gb2312),打开并保存就变成了gb2312可能会出现乱码;
2、<meta http-equiv="Content-Type" content="text/html; charset=utf-8"> 这句话可以强制要求浏览器以utf-8编码方式来查看页面,但有一点需要注意,可能Apache的字符集为非UTF-8,例如GB2312,此时浏览器会优先以服务器(GB2312)的字符集编码打开,又可能导致乱码;所以一般可以这么处理:关闭服务器Apache的字符集AddDefaultCharset off 此时浏览会以页面Head中字符集打开;
3、PHP一般都与Mysql数据库交互,两者进行数据通信时,也有一个编码问题,不管增还是查,必须指定通信编码方式(一般与Head中编码方式UTF-8一致,否则取出来的数据是以非UTF-8编码的,到页面上显示仍旧为乱码;把UTF-8编码的字符通过非UTF-8的通信方式传输到数据库同样会失败,我遇到了这个Insert失败问题,希望大家不要重蹈覆辙,O(∩_∩)O~) 指定通信方式方法:mysql_query('set names utf8'),注意不是utf-8;
4、一般跟数据库建库时的编码没有关系,修改后sql语句执行会有问题,比如前台可视化工具操作删除数据时会报字符集不符合的错误(我用的工具为MySql-Front),也不需要修改my.ini文件中的编码方式,修改后可能导致Mysql无法启动,报1065错误 ;只要命令行执行mysql客户机程序时增与查没有出现乱码,数据库的编码方式应该是没有问题的,重点需要检查的是否是上面三个导致的乱码。
from: http://www.cnblogs.com/cardon/archive/2009/12/13/1622977.html
参考:http://www.soft6.com/tech/17/172596.html
PHP在实际编写代码中,会经常出现一些问题,比如页面出现乱码等问题。我们接下来将会具体介绍PHP页面乱码的产生原因和相关解决方法。一般来说,PHP页面乱码的出现有2种原因,首先是由于编码(charset)设置错误,导致浏览器以错误的编码来解析,从而出现了满屏乱七八糟的“天书”,其次是文件被以错误的编码打开,然后保存,比如一个文本文件原先是GB2312编码的,却以UTF-8编码打开再保存。要解决上述PHP页面乱码问题,首先需要知道开发中哪些环节涉及到了编码:
1、文件编码:指的是页面文件(.html,.php等)本身是以何种编码来保存的。记事本和Dreamweaver在打开页面时候会自动识别文件编码因而不太会出问题。而ZendStudio却不会自动识别编码,它只会根据首选项的配置固定以某种编码打开文件,如果工作时候一不注意,用错误编码打开文件,做了修改之后一保存,乱码就出现了(我深有体会)。
2、页面申明编码:在HTML代码HEAD里面,可以用来告诉浏览器网页采用了什么编码,目前中文网站开发中XXX主要用的是GB2312和UTF-8两种编码。
3、数据库连接编码:指的是进行数据库操作时候以哪种编码与数据库传输数据,这里需要注意的是不要与数据库本身的编码混淆,比如MySQL内部默认是latin1编码,也就是说Mysql是以latin1编码来存储数据,以其他编码传输给Mysql的数据会被转换成latin1编码。
知道了WEB开发中哪些地方涉及到了编码,也就知道了PHP页面乱码产生的原因:上述3项编码设置不一致,由于各种编码绝大部分是兼容ASCII的,所以英文符号不会出现,中文就倒霉了。下面是一些常见的错误情况与解决:
1、数据库采用UTF8编码,而页面申明编码是GB2312,这是最常见的产生乱码的原因。这时候在PHP脚本里面直接SELECT数据出来的就是PHP页面乱码,需要在查询前先使用:
mysql_query("SET NAMES GBK"); 来设定MYSQL连接编码,保证页面申明编码与这里设定的连接编码一致(GBK是GB2312的扩展)。如果页面是UTF-8编码的话,可以用:
mysql_query("SET NAMES UTF8"); 注意是UTF8而不是一般用的UTF-8。假如页面申明的编码与数据库内部编码一致可以不设定连接编码。
注:事实上MYSQL的数据输入输出比上面讲的更复杂一些,MYSQL配置文件my.ini中定义了2个默认编码,分别是[client]里的default-character-set和[mysqld]里的default-character-set来分别设定默认时候客户端连接和数据库内部所采用的编码。我们上面指定的编码其实是MYSQL客户端连接服务器时候的命令行参数character_set_client,来告诉MYSQL服务器接受到的客户端数据是什么编码的,而不是采用默认编码。
2、页面申明编码与文件本身编码不一致,这种情况很少发生,因为如果编码不一致美工做页面时候在浏览器看到的就是乱码了。更多时候是发布以后修改一些小BUG,以错误编码打开页面然后保存导致的。或者是用某些FTP软件直接在线修改文件,比如CuteFTP,由于软件编码配置错误而导致转换错了编码。
3、一些租用虚拟主机的朋友,明明上述3项编码都设置正确了还是有PHP页面乱码。比方说网页是GB2312编码的,IE等浏览器打开却总是识别成UTF-8,网页HEAD里面已经申明是GB2312了,手动修改浏览器编码为GB2312后页面显示正常。产生原因是服务器Apache设定了服务器全局的默认编码,在httpd.conf里面加了AddDefaultCharset UTF-8。这时候服务器会首先发送HTTP头给浏览器,其优先级比页面里申明编码高,自然浏览器就识别错了。解决办法有2个,请管理员在配置文件自己的虚机里加上一条AddDefaultCharset GB2312来覆盖全局配置,或者在自己目录的.htaccess里配置。