json_encode中文转义错误的处理方法

最近使用json_encode转换数组为json数据,储存在数据库里面,因为字段的长度个内容不确定,就只能使用这个方法了,但是使用json_decode解析为数组以后,却出现了类似”u590fu5a03u7684u8bf1u60d14u5979u7684u6280u5de7″,通过查询百度,这应该是UCS-2编码的字符串,那么如何转换这个字符串呢?

其实在在php5.2以前的版本中做json_encode转换的时候的时候。中文会被unicode编码, php5.3加入了options参数, 5.4以后才加入JSON_UNESCAPED_UNICODE,这个参数,不需要做escape和unicode处理。

5.4以上转换成中文的方法:
json_encode($str, JSON_UNESCAPED_UNICODE); 
UCS-2编码转中文的3种方法

第一种
在实际应用中有个问题,部分字符会掉,不止为何,如字符串:”日期11.2″会被变成”日期.2″。

function encode_json($str){  
    return preg_replace("/u([0-9a-f]+)/ie", "iconv('UCS-2', 'UTF-8', pack('H4', '\\1'))", $code);  
}

第2种

function encode_json($str) {
    return urldecode(json_encode(url_encode($str)));  
}
function url_encode($str) {
    if(is_array($str)) {
        foreach($str as $key=>$value) {
            $str[urlencode($key)] = url_encode($value);
        }  
    } else {
        $str = urlencode($str);
    }
    return $str;  
}

第3种

function decodeUnicode($str){
  return preg_replace_callback('/\\\\u([0-9a-f]{4})/i',
   create_function(
    '$matches',
    'return mb_convert_encoding(pack("H*", $matches[1]), "UTF-8", "UCS-2BE");'
   ),
   $str);
}

有时PHP备份的数据"”\u590f\u5a03\u7684\u8bf1“"会被去掉”\“斜杠,显示这样的数据 ”u590fu5a03u7684u8bf1“那就需要使用第一种方法转换或者重新导出数据。

你可能感兴趣的:(json_encode中文转义错误的处理方法)