PHP+MYSQL做网站开发通常都会碰到浏览器输出中文字符时乱码,这个问题的原因主要是因为HTML内容编码,PHP文件编码和MySQL数据库编码这三者不一致造成的。下面我们以UTF-8为例简述一下如何统一这三者之间的关系。
新增一个PHP文件,命名为test_charset.php,将下面的代码保存到该文件中:
<?php
$charset = "utf8";
$con = mysql_connect("localhost", "root", "");
mysql_query("SET character_set_connection=$charset, character_set_results=$charset, character_set_client=binary", $con);
mysql_select_db("ecshop", $con);
$sql = "SELECT user_name, email FROM ecs_admin_user WHERE user_id = 4";
$result = mysql_query($sql, $con);
$array = mysql_fetch_array($result, MYSQL_ASSOC);
mysql_close($con);
$name = $array["user_name"];
$email = $array["email"];
?>
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
</head>
<body>
<h1>你好, <?php echo $name; ?>!</h1>
<h2>你的邮件是:<a href="mailto:<?php echo $email; ?>"><?php echo $email; ?></a></h2>
</body>
</html>
HTML内容编码
上面的第22行:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
这里我们指定了浏览器在解析HTML时使用UTF-8编码 。如果这里没有指定,浏览器会使用自己缺省的编码。不同的浏览器缺省编码会有所不同,比如IE6是GB2312,FireFox是UTF-8。所以,上面这段代码如果没有第22行,在FireFox会显示正常,在IE6就会显示乱码。
PHP文件编码
PHP文件本身也需要有一致的编码。如何检查自己的PHP文件是哪一种编码呢?Windows下简单的可以用记事本来处理。用记事本打开PHP文件,从“文件”菜单中选择“另存为...”
在打开的对话框最下面有一个“编码”的选项,当前看到的就是该文件现在的编码。如果要变为其它的编码,从下拉列表框中选择,然后点击“保存”按钮。
MySQL数据库编码
数据库连接成功后,应该第一时间执行一条设置编码指令,如上面代码的第7行。这里有一点需要特别注意,UTF-8是正常的写法,不过在MySQL中简写成了UTF8,中间没有横线。上面第7行是将连接编码设置成utf8($charset="utf8"),而不是utf-8。这里附上ECShop设置连接编码的完整实现,供大家参考。文件是includes/cls_mysql.php。
function set_mysql_charset($charset)
{
/* 如果mysql 版本是 4.1+ 以上,需要对字符集进行初始化 */
if ($this->version > '4.1')
{
if (in_array(strtolower($charset), array('gbk', 'big5', 'utf-8', 'utf8')))
{
$charset = str_replace('-', '', $charset);
}
if ($charset != 'latin1')
{
mysql_query("SET character_set_connection=$charset, character_set_results=$charset, character_set_client=binary", $this->link_id);
}
}
}