今天的用PHP的时候无意的出现了用unserialize()函数转换老是返回false,我确认我的字符串是没错的,测试了很多次还是一样,没办法,启用了error_reporting(E_ALL)启用错误信息,没想到发现了Notice: unserialize() [function.unserialize]: Error at offset的信息, 因为我字符我是从数组转换过来的,所以应该是没有错的, Google了一下,原来是编码问题,在PHP手册的评论中有人讨论了此问题.

原来我serialize后的数组字符串是从数据库里取出来的,而原来插入数据库时,因为美工修改前台视图代码时导致视图编码未保存成UTF8编码而是ANSCII编辑,而我复制出来后用unserialize()的PHP文件是UTF-8编码,编码不同,所以就出现错误了...

例子:
“ 首页以ANSCII方式操作


$arr = array('en' => 'hello', 'cn' => '您好');
$str = serialize($arr);
echo $str;

?>

输出结果: a:2:{s:2:"en";s:5:"hello";s:2:"cn";s:4:"您好";}

然后以UTF-8的编码方式来测试

则以上代码的输出结果为: a:2:{s:2:"en";s:5:"hello";s:2:"cn";s:6:"您好";}
看到有什么不同了吧,在出现中文字符时字符长度就不一样了,也就是strlen('您好')在第一种编码中是4,而在第二种编码中是6,其中原因可以查看相关手册. 而unsrialize()要根据类似 s:6:"您好" 中的6来判断字符长度并进行反序列,但原来的是4,字符长度不符,也就是出现了offset错误

解决办法:
“ 将要反序列的字符串进行一次转换,代码

$data=preg_replace('!s:(\d+):"(.*?)";!se',"'s:'.strlen('$2').':\"$2\";'",$data);
$data=unserialize($data);
如果您的解码数组内容里有类似(\"\"的双引号转移字符)的子元素,还需要对特定子元素去除重复的转移双引号(文本编辑器上传图片功能默认对URL内容进行了斜杠转义,解码后需要对其去除重复双引号转移)

a:7{s:8:"nickname";s:10:"4211931411";s:3:"uid";s:6:"481010";s:10:"other_type";s:1:"1";s:8:"other_id";i:2023;s:11:"other_title";s:143:"发布了博文: 中国有个你大爷 巧妙 答记者问 ";s:3:"des";s:232:"


\"\"

1、记者:大爷,巿长被绑架了,绑匪要赎金一千万,如果不给,他们就用汽油烧死他。现正在";s:11:"content_url";s:53:"/blog/a-log/uid-481010/id-2023";}

$data['des']=stripslashes($data['des']);