PHP5.2中使用的内存回收算法-引用计数
PHP5.2中使用的内存回收算法是大名鼎鼎的Reference Counting,其思想:为每个内存对象分配一个计数器(关于引用计数器参看 http://my.oschina.net/wzwitblog/blog/156257),当一个内存对象建立时计数器初始化为1(因此此时总是有一个变量引用此对象),以后每有一个新变量引用此内存对象,则计数器加1,而每当减少一个引用此内存对象的变量则计数器减1,当垃圾回收机制运作的时候,将所有计数器为0的内存对象销毁并回收其占用的内存。而PHP中内存对象就是zval,而计数器就是refcount。
但却存在一个致命的缺陷,就是容易造成内存泄露。如果存在循环引用,那么Reference Counting就可能导致内存泄露。例如下面的代码:
<?php
$a = array();
$a[] = & $a;
unset($a);
?>
这段代码首先建立了数组a,然后让a的第一个元素按引用指向a,这时a的zval的refcount就变为2,然后我们销毁变量a,此时a最初指向的zval的refcount为1,但是我们再也没有办法对其进行操作,因为其形成了一个循环自引用。
PHP5.3中的垃圾回收算法
PHP5.3中的垃圾回收算法是Concurrent Cycle Collection in Reference Counted Systems,其思想:PHP会分配一个固定大小的“根缓冲区”,这个缓冲区用于存放固定数量的zval,这个数量默认是10,000,如果需要修改则需要修改源代码Zend/zend_gc.c中的常量GC_ROOT_BUFFER_MAX_ENTRIES然后重新编译。
由上文我们可以知道,一个zval如果有引用,要么被全局符号表中的符号引用,要么被其它表示复杂类型的zval中的符号引用。因此在zval中存在一些可能根(root)。
当根缓冲区满额时,PHP就会执行垃圾回收,此回收算法如下:
1)对每个根缓冲区中的根zval按照深度优先遍历算法遍历所有能遍历到的zval,并将每个zval的refcount减1,同时为了避免对同一zval多次减1(因为可能不同的根能遍历到同一个zval),每次对某个zval减1后就对其标记为“已减”。
2)再次对每个缓冲区中的根zval深度优先遍历,如果某个zval的refcount不为0,则对其加1,否则保持其为0。
3)清空根缓冲区中的所有根(注意是把这些zval从缓冲区中清除而不是销毁它们),然后销毁所有refcount为0的zval,并收回其内存。
如果不能完全理解也没有关系,只需记住PHP5.3的垃圾回收算法有以下几点特性:
1)并不是每次refcount减少时都进入回收周期,只有根缓冲区满额后在开始垃圾回收。
2)可以解决循环引用问题。
3)可以总将内存泄露保持在一个阈值以下。
__destruct /unset
__destruct() 析构函数,是在垃圾对象被回收时执行。
unset 销毁的是指向对象的变量,而不是这个对象。
例1:
<?php error_reporting(E_ALL);
$a = 'I am test.';
$b = &$a;
echo $b ."<br />";
?>
结果:
I am test.
例2:
<?php
error_reporting(E_ALL);
$a = 'I am test.';
$b = &$a;
$b = 'I will change?';
echo $a ."<br />";
echo $b ."<br />";
?>
结果:
I will change?
I will change?
例3:
<?php
error_reporting(E_ALL);
$a = 'I am test.';
$b = &$a;
unset($a);
echo $a ."<br />";
echo $b ."<br />";
?>
结果:
Notice: Undefined variable...
I am test.
例4:
<?php
error_reporting(E_ALL);
$a = 'I am test.';
$b = &$a;
unset($b);
echo $a ."<br />";
echo $b ."<br />";
?>
结果:
I am test.
Notice: Undefined variable...
例5:
<?php
error_reporting(E_ALL);
$a = 'I am test.';
$b = &$a;
$a = null;
echo '$a = '. $a ."<br />";
echo '$b = '. $b ."<br />";
?>
结果:
$a =
$b =
例6:
<?php error_reporting(E_ALL);
$a = 'I am test.';
$b = &$a;
$b = null;
echo '$a = '. $a ."<br />";
echo '$b = '. $b ."<br />";
?>
结果:
$a =
$b =
下面我们来详细分析 GC 与引用.
1)所有例子中,创建了一个变量,即在内存中开辟了一块空间,在里面存放了一个字符串 I am test. 。 PHP 内部有个符号表,用来记录各块内存引用计数,那么此时会将这块内存的引用计数加 1,并且用一个名为 $a 的标签(变量)指向这块内存,方便依标签名来操作内存。
2)对变量 $a 进行 & 操作,即找到 $a 所指向的内存,并为 $b 建立同样的一引用指向,并将存放字符串 I am test. 的内存块在符号表中引用计数 加 1。换言之,脚本执行到这一行的时候,存放字符串 I am test. 的那块内存被引用了两次。这里要强调的是,& 操作是建立了引用指向,而不是指针, PHP 没有指针的概念。有人提出说类似于 UNIX 的文件软链接,可以在一定程度上这么理解:存放字符 I am test. 的那块内存是我们的一个真实的文件,而变量 $a 与 $b 是针对真实文件建立的软链接,但它们指向的是同一个真实文件。在 例2中给 $b 赋值的同时, $a 的值也跟着变化了。
3)在 例3 与 4 中,进行了 unset() 操作,可以看出: unset() 只是断开这个变量对它原先指向的内存的引用,使变量本身成为没有定义过空引用,所在调用时发出了 Notice,并且使那块内存在符号表中引用计数减 1,并没有影响到其他指向这块内存的变量。只有当一块内存在符号表中的引用计数为 0 时,PHP 引擎才会将这块内存回收.
看看下面的代码与其结果:
<?php
error_reporting(E_ALL);
$a = 'I am test.';
$b = & $a;
unset($a);
unset($a);
unset($a);
echo '$a = '. $a ."<br />";
echo '$b = '. $b ."<br />";
?>
结果:
Notice: Undefined variable...
$a =
$b = I am test.
第一次 unset() 的操作已经断开了指向,所以后继的操作不会对符号表的任何内存的引用记数造成影响了.
4)通过 例5 & 6 可以明确无误得出: 赋值 null操作会直接将变量所指向的内存在符号号中的引用计数置 0,那这块内存自然被引擎回收了,至于何时被再次利用不得而知,有可能马上被用作存储别的信息,也许再也没有使用过。但是无论如何,原来所有指向那块内存变量都将无法再操作被回收的内存了。任何试图调用它的变量都将返回 null。
<?php
error_reporting(E_ALL);
$a = 'I am test.';
$b = & $a;
$b = null;
echo '$a = '. $a ."<br />";
echo '$b = '. $b ."<br />";
if (null === $a) {
echo '$a is null.';
} else {
echo 'The type of $a is unknown.';
}
?>
结果:
$a =
$b =
$a is null.
析构函数与PHP的垃圾回收机制
析构函数也可以被显式调用,但不要这样去做。
析构函数是由系统自动调用的,不要在程序中调用一个对象的虚构函数。
析构函数不能带有参数。
如下面程序所示,程序结束前,所有对象被销毁。析构函数被调用了。
<?
class Person {
public function __destruct(){
echo '析构函数现在执行了';
}
}
$p = new Person();
for($i = 0; $i < 5; $i++){
echo "$i <br />";
}
?>
结果:
0
1
2
3
4
析构函数现在执行了
当对象没有指向时,对象被销毁。
<?
class Person {
public function __destruct(){
echo '析构函数现在执行了 <br />';
}
}
$p = new Person();
$p = null; // 析构函数在这里执行了
$p = "abc";
for($i = 0; $i < 5; $i++){
echo "$i <br />";
}
?>
结果:
析构函数现在执行了
0
1
2
3
4
<?
class Person {
public function __destruct(){
echo '析构函数现在执行了 <br />';
}
}
$p = new Person();
$p1 = $p;
unset($p);
echo '现在把 $p 被销毁了,对象是否也被销毁了呢?<br />';
for($i = 0; $i < 5; $i++){
echo "$i <br />";
}
echo '现在再把 $p1 也销毁掉,即已经没有指向对象的变量了<br />';
unset($p1); // 现在没有指向对象的变量了,析构函数在这里执行了
?>
结果:
现在把 $p 被销毁了,对象是否也被销毁了呢?
0
1
2
3
4
现在再把 $p1 也销毁掉,即已经没有指向对象的变量了
析构函数现在执行了
unset 销毁的是指向对象的变量,而不是这个对象。