下面是我查询了网上的解决办法后,自己总结的方法, 如有错误的地方,请你帮忙指正,在此感谢
由于, 用PHP的json_encode来处理中文的时候, 中文都会被编码, 变成不可读的, 类似”\u***”的格式,如下所示:
$arr
= [
'name'
=>
'大霞'
,
'sex'
=>
'f'
];
$str
= json_encode(
$arr
);
//下面的例子,我将使用到此变量
var_dump(
$str
);
打印结果如下:
string
'{"name":"\u5927\u971e","sex":"f"}'
升级PHP,在PHP5.4, 这个问题终于得以解决, Json新增了一个选项: JSON_UNESCAPED_UNICODE, 故名思议, 就是说, Json不要编码Unicode
$str
= json_encode(
$arr
, JSON_UNESCAPED_UNICODE); //这样我们存进去的是就是中文了,那么取出的也就是中文了
打印结果如下:
string
'{"name":"大霞","sex":"f"}'
对unicode码再进行解码,解码函数如下:
function
decodeUnicode(
$str
)
{
return
preg_replace_callback(
'/\\\\u([0-9a-f]{4})/i'
,
create_function(
'$matches'
,
'return mb_convert_encoding(pack("H*", $matches[1]), "UTF-8", "UCS-2BE");'
),
$str
);
}
$str
= json_encode(
$arr
)
$str
= decodeUnicode(
$str
);
结果如下:
string
'{"name":"大霞","sex":"f"}'
$str
=preg_replace(
"#\\\u([0-9a-f]{4})#ie"
,
"iconv('UCS-2BE', 'UTF-8', pack('H4', '\\1'))"
,
$str
);
打印结果如下:
string
'{"name":"大霞","sex":"f"}'
|
注意: preg_replace函数已经在php5.5.x版本中废除, 如果你是高版本,将会报错如下(如果你是低版本,此方法仍然可用)
preg_replace(): The /e modifier is deprecated,
use
preg_replace_callback instead
|
此时我们可以使用preg_replace_callback()来代替, 例子如下所示:
$arr
= [
'name'
=>
'大霞'
,
'sex'
=>
'f'
];
$str
= json_encode(
$arr
);
$test
= preg_replace_callback(
'/\\\u([0-9a-f]{4})/'
,
function
(
$match
) {
return
iconv(
'UCS-2BE'
,
'UTF-8'
, pack(
'H4'
,
$match
[1]));
//抓取来的ucs-2编码的信息转码成utf-8格式的
},
$str
);
$arr
= [
'name'
=> urlencode(
"大霞"
),
'sex'
=>
'f'
];
$str
= json_encode(
$arr
);
var_dump(
$str
);
结果如下:
string
'{"name":"%E5%A4%A7%E9%9C%9E","sex":"f"}'
|
取出数据的时候,再次使用urldecode来解码,这样编码出来的json数组中的汉字就不会出现unicode编码了。
$str
= urldecode(
$str
);
打印结果如下:
string
'{"name":"大霞","sex":"f"}'
|
上面可能用到一些函数:
说明一下其他用到的函数: pack() 函数把数据装入一个二进制字符串。 语法 : pack(format,args+) format 必需。规定在包装数据时所使用的格式。 args+ 可选。规定被包装的一个或多个参数。 iconv()函数库能够完成各种字符集间的转换,是php编程中不可缺少的基础函数库。 例如: $string = "大霞"; iconv("utf8","gbk",$string)//将字符串string 编码由utf8转变成gbk;