(本文转载自 https://blog.tanteng.me/2015/11/serialize-json-diff/)

在PHP中,serialize和json两种方式对一个对象或数组进行序列化或反序列化有什么区别呢?

假设一个对象和一个数组:

PHP

1

2

3

4

$web = new stdClass;

$web->site = 'tantengvip';

$web->owner = 'tuntun';

$web->age = 5;

PHP

1

2

3

4

$web = array();

$web['site'] = 'tantengvip';

$web['owner'] = 'tuntun';

$web['age'] = 5;

对它们分别用serialize函数和unserialize函数进行序列化和反序列化,看看打印结果分别是什么,如下:

使用serialize方式:

PHP

1

2

3

4

var_dump(serialize($web));

var_dump(unserialize(serialize($web)));

var_dump(json_encode($web));

var_dump(json_decode(json_encode($web)));

结果:

PHP

1

2

3

4

5

6

7

8

9

10

11

12

13

string 'O:8:"stdClass":3:{s:4:"site";s:10:"tantengvip";s:5:"owner";s:6:"tuntun";s:3:"age";i:5;}' (length=87)

 

object(stdClass)[127]

  public 'site' => string 'tantengvip' (length=10)

  public 'owner' => string 'tuntun' (length=6)

  public 'age' => int 5

 

string '{"site":"tantengvip","owner":"tuntun","age":5}' (length=46)

 

object(stdClass)[127]

  public 'site' => string 'tantengvip' (length=10)

  public 'owner' => string 'tuntun' (length=6)

  public 'age' => int 5

使用json方式:

PHP

1

2

3

4

var_dump(serialize($web));

var_dump(unserialize(serialize($web)));

var_dump(json_encode($web));

var_dump(json_decode(json_encode($web),true));

结果

PHP

1

2

3

4

5

6

7

8

9

10

11

12

13

string 'a:3:{s:4:"site";s:10:"tantengvip";s:5:"owner";s:6:"tuntun";s:3:"age";i:5;}' (length=74)

 

array (size=3)

  'site' => string 'tantengvip' (length=10)

  'owner' => string 'tuntun' (length=6)

  'age' => int 5

 

string '{"site":"tantengvip","owner":"tuntun","age":5}' (length=46)

 

array (size=3)

  'site' => string 'tantengvip' (length=10)

  'owner' => string 'tuntun' (length=6)

  'age' => int 5

我们发现,对于前面定义的这样一个对象或数组,用serialize和json进行序列化,反序列化回来的结果和原来是一样的,并没有什么区别,除了序列化的格式不同而已。

那么它们到底有何区别?以下文字总结很好,就不自己加以说明了,可以写代码验证。(链接)

使用json序列化和反序列化

优势:

  • 变量序列化后依然可读

  • 可以给其他系统使用,因为JSON格式是标准的

劣势:

  • 只对UFT-8的数据有效,其他编码可能不能很好工作

  • 只对stdClass类的示例有效

使用serialize方式序列化和反序列化

优势:

  • 允许非UTF-8的变量

  • 支持除了stdClass 示例外的其他实例

劣势:

  • 编码后的文本对人来说是不可读的

  • 无法被其他语言的系统引用

好,写个代码看看:

PHP

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

class Test

{

    private $pri = 'pri';

    public $class = 'Test';

    public function __construct()

    {

        $this->class = 'Test construct';

        $this->pri = 'pri construct';

    }

}

 

$test = new Test();

 

var_dump(serialize($test));

var_dump(unserialize(serialize($test)));

 

var_dump(json_encode($test));

var_dump(json_decode(json_encode($test)));

结果:

PHP

1

2

3

4

5

6

7

8

9

10

string 'O:4:"Test":2:{s:9:"Testpri";s:13:"pri construct";s:5:"class";s:14:"Test construct";}' (length=86)

 

object(Test)[127]

  private 'pri' => string 'pri construct' (length=13)

  public 'class' => string 'Test construct' (length=14)

 

string '{"class":"Test construct"}' (length=26)

 

object(stdClass)[127]

  public 'class' => string 'Test construct' (length=14)

我们发现,json序列化和反序列化丢失了类中的私有成员变量,而serialize序列化和反序列化只要是类的变量都可以,但是类的成员方法都无法进行序列化和反序列化。

在一般情况,还是使用json比较好,因为json是跨平台的通用格式,除了json,用xml也比较好。那在什么时候使用serialize方式呢?

在对一个类进行serialize反序列化的时候会默认调用魔术方法__wakeUp(),这样就使得对象能够重新建立起序列化时未能保留的各种状态。例如:数据库连接等。那就是另外一个问题了,这里不做深究了。