免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 11751 | 回复: 15
打印 上一主题 下一主题

[原创] 从 PHP 代码分析 PHP 的 GC(垃圾回收) 机制 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-11-07 12:29 |只看该作者 |倒序浏览
众所周知, PHP 引擎本身是用 C 写的,提到 C 不能不提的就是 GC(垃圾回收).通过 PHP 手册我们了解到, PHP 引擎会自动进行 GC 动作.那么我们不禁要问,到底它是怎么回收的, & 引用操作是不是指针, unset()了一个变量时它是不是真的被回收了呢?这些看似手册有提及的问题,如果仔细分析会发现,远没有那么简单泛泛.也许有人会跳出来说:看 PHP源码不就知道了.是的,等你通读了 PHP 源码后这个问题肯定不在话下了,然本篇要仅从 PHP本身来分析这些看似平常却被忽视的小细节,当然了,其中难免水平所限,有所疏漏,热烈欢迎广大 phper 来共同讨论.

首先咱先看到例子,最简单不过的执行流程了:
Example 1: gc.php
<?php
error_reporting
(E_ALL);
$a = 'I am test.';
$b = & $a;

echo
$b ."\n";

?>

不用说 % php -f gc.php 输出结果非常明了:
hy0kl% php -f gc.php
I am test.


好,下一个:
Example 2:
<?php
error_reporting
(E_ALL);
$a = 'I am test.';
$b = & $a;

$b = 'I will change?';                                                           

echo
$a ."\n";
echo
$b ."\n";

?>
执行结果依然很明显:
hy0kl% php -f gc.php
I will change?
I will change?


君请看:
Example 3:
<?php
error_reporting
(E_ALL);
$a = 'I am test.';
$b = & $a;  

unset(
$a);

echo
$a ."\n";
echo
$b ."\n";
?>
是不是得想一下下呢?
hy0kl% php -f gc.php
Notice: Undefined variable: a in /usr/local/www/apache22/data/test/gc.php on line 8
I am test.

有点犯迷糊了吗?

君再看:
Example 4:
<?php
error_reporting
(E_ALL);
$a = 'I am test.';
$b = & $a;

unset(
$b);                                                                       

echo
$a ."\n";
echo
$b ."\n";

?>
其实如果 Example 3 理解了,这个与之异曲同工.
hy0kl% php -f gc.php
I am test.
Notice: Undefined variable: b in /usr/local/www/apache22/data/test/gc.php on line 9


君且看:
Example 5:
<?php
error_reporting
(E_ALL);
$a = 'I am test.';
$b = & $a;

$a = null;

echo
'$a = '. $a ."\n";
echo
'$b = '. $b ."\n";

?>
猛的第一感觉是什么样的?
hy0kl% php -f gc.php
$a =
$b =

没错,这就是输出结果,对 PHP GC 已有深入理解的 phper 不会觉得有什么奇怪,说实话,当我第一次运行这段代码时很意外,却让我对 PHP GC 有更深刻的理解了.那么下面与之同工的例子自然好理解了.

Example 6:
<?php                                                                           
error_reporting
(E_ALL);
$a = 'I am test.';
$b = & $a;

$b = null;

echo
'$a = '. $a ."\n";
echo
'$b = '. $b ."\n";

?>

OK,如果上面的例子的结果对看官来说无任何细节可言,那您可关闭本窗口了,欢迎有空再来!

下面我们来详细分析 GC 与引用.
1. 所有例子中,创建了一个变量,这个过程通俗一点讲:是在内存中开辟了一块空间,在里面存放了一个字符串 I am test. . PHP 内部有个符号表,用来记录各块内存引用计数,那么此时会将这块内存的引用计数 加 1,并且用一个名为 $a 的标签(变量)指向这块内存,方便依标签名来操作内存.

2. 对变量 $a 进行 & 操作,我的理解是找到 $a 所指向的内存,并为 $b 建立同样的一引用指向,并将存放字符串 I am test. 的内存块在符号表中引用计数 加 1.换言之,我们的脚本执行到这一行的时候,存放字符串 I am test. 的那块内存被引用了两次.这里要强调的是, & 操作是建立了引用指向,而不是指针, PHP 没有指针的概念!同时有人提出说类似于 UNIX 的文件软链接.可以在一定程度上这么理解: 存放字符 I am test. 的那块内存是我们的一个真实的文件,而变量 $a$b 是针对真实文件建立的软链接,但它们指向的是同一个真实文件. So, 我们看到,在 Example 2  中给 $b 赋值的同时, $a 的值也跟着变化了.与通过某一软链操作了文件类似.

3. 在 Example 3 与 4 中,进行了 unset() 操作.根据实际的执行结果,可以看出: unset() 只是断开这个变量对它原先指向的内存的引用,使变量本身成为没有定义过空引用,所在调用时发出了 Notice ,并且使那块内存在符号表中引用计数 减 1,并没有影响到其他指向这块内存的变量.换言之,只有当一块内存在符号表中的引用计数为 0 时, PHP 引擎才会将这块内存回收.
PHP 手册
4.0.0                 unset() became an expression. (In PHP 3,         unset() would always return 1).
这意味着什么?
看看下面的代码与其结果:
<?php
error_reporting
(E_ALL);
$a = 'I am test.';
$b = & $a;

unset(
$a);
unset(
$a);
unset(
$a);

echo
'$a = '. $a ."\n";
echo
'$b = '. $b ."\n";

?>
hy0kl% php -f gc.php

Notice: Undefined variable: a in /usr/local/www/apache22/data/test/gc.php on line 10
$a =
$b = I am test.
第一次 unset() 的操作已经断开了指向,所以后继的操作不会对符号表的任何内存的引用记数造成影响了.

4. 通过 Example 5 & 6 可以明确无误得出: 赋值 null操作是相当猛的,它会直接将变量所指向的内存在符号号中的引用计数置 0,那这块内存自然被引擎回收了,至于何时被再次利用不得而知,有可能马上被用作存储别的信息,也许再也没有使用过.但是无论如何,原来所有指向那块内存变量都将无法再操作被回收的内存了,任何试图调用它的变量都将返回 null.

<?php
error_reporting
(E_ALL);
$a = 'I am test.';
$b = & $a;

$b = null;

echo
'$a = '. $a ."\n";
echo
'$b = '. $b ."\n";

if (
null === $a)
{                                                                                
echo
'$a is null.';     
} else
{
echo
'The type of $a is unknown.';     
}

?>
hy0kl% php -f gc.php
$a =
$b =
$a is null.


综上所述,充分说明了为什么我们在看开源产品源码的时候,常看到一些比较大的临时变量,或使用完不再调用的重用信息都会被集中或显示的赋值为 null 了.它相当于 UNIX 中直接将真实文件干掉了,所有指向它的软链接自然成了空链了.
之前在讨论到这些细节点时有很多想当然的念头,在实际的执行了测试代码后才发现: 哦,原来如此!
纸上得来终觉浅,绝知此事须躬行.

作者: hy0kl
永久链接: 从 PHP 代码分析 PHP 的 GC(垃圾回收) 机制
Email/MSN/Gtalk: hy0kle@gmail.com
Time: 2009.11.07

论坛徽章:
0
2 [报告]
发表于 2009-11-07 12:41 |只看该作者
不错,正好用得上

论坛徽章:
0
3 [报告]
发表于 2009-11-07 18:24 |只看该作者
嗯,对PHP的GC有了进一步的了解

论坛徽章:
0
4 [报告]
发表于 2009-11-07 22:04 |只看该作者
楼主精神可嘉
不过这个不能算gc吧 只是关于php引用的一些行为特性
而且全都在手册中有提及到
1.引用是什么?
2.修改引用的值会有什么影响?
3.unset一个引用变量会怎么样?

另外,分享一段代码, 帮助理解引用
  1. <?php
  2. $items = array('apple', 'banana', 'carrot');
  3. print_r($items);
  4. foreach ($items as &$item) { }
  5. print_r($items);
  6. foreach ($items as $item) { }
  7. print_r($items);
复制代码

论坛徽章:
0
5 [报告]
发表于 2009-11-08 12:10 |只看该作者
感谢楼主分享自己的心得
根据楼主的代码,我测试了下,对象的引用和赋值,但有些地方不是很理解,小弟初学php几个月,还请牛人解释下
之下是测试代码:
  1. <?php
  2. error_reporting(E_ALL);
  3. $a = new stdClass;
  4. $a->p = 'a';
  5. $b = &$a;
  6. var_dump($a,$b);
  7. $b->p = 'b';
  8. var_dump($a,$b);
  9. $b = null;
  10. var_dump($a,$b);
  11. ?>
复制代码
运行结果
  1. object(stdClass)#1 (1) {
  2.   ["p"]=>
  3.   string(1) "a"
  4. }
  5. object(stdClass)#1 (1) {
  6.   ["p"]=>
  7.   string(1) "a"
  8. }
  9. object(stdClass)#1 (1) {
  10.   ["p"]=>
  11.   string(1) "b"
  12. }
  13. object(stdClass)#1 (1) {
  14.   ["p"]=>
  15.   string(1) "b"
  16. }
  17. NULL
  18. NULL
复制代码
对象赋值用了引用,根据楼主的解释,这个结果是没有问题的,但改成以下代码:
  1. <?php
  2. error_reporting(E_ALL);
  3. $a = new stdClass;
  4. $a->p = 'a';
  5. $b = $a;
  6. var_dump($a,$b);
  7. $b->p = 'b';
  8. var_dump($a,$b);
  9. $b = null;
  10. var_dump($a,$b);
  11. ?>
复制代码
结果:
  1. object(stdClass)#1 (1) {
  2.   ["p"]=>
  3.   string(1) "a"
  4. }
  5. object(stdClass)#1 (1) {
  6.   ["p"]=>
  7.   string(1) "a"
  8. }
  9. object(stdClass)#1 (1) {
  10.   ["p"]=>
  11.   string(1) "b"
  12. }
  13. object(stdClass)#1 (1) {
  14.   ["p"]=>
  15.   string(1) "b"
  16. }
  17. object(stdClass)#1 (1) {
  18.   ["p"]=>
  19.   string(1) "b"
  20. }
  21. NULL
复制代码
就有点不懂了,如果 对象 的直接赋值 是拷贝赋值,为什么 对象b的属性改变,会影响对象a,如果是 引用赋值,为这么 b=null 不会对对象a造成影响?
当然 如果 对象用 clone 操作,那 结果就像 操作基本类型一样了。
难道说,如果是基本类型,unset操作 和 =null 操作 会删除 内存中的实际变量,而如果是 对象 或是 资源(没有测试),只是引用 减一(从代码看 直接= 好像是 引用赋值)?
不知道我理解的对不对,还请牛人解释一下...

论坛徽章:
0
6 [报告]
发表于 2009-11-08 14:43 |只看该作者
能对php engine如何malloc和free 进行管理吗?
看完你的帖子还是不清楚怎么对内存回收

论坛徽章:
0
7 [报告]
发表于 2009-11-08 14:57 |只看该作者

回复 #6 suntoltti 的帖子

过段时间了,请关注.

论坛徽章:
0
8 [报告]
发表于 2009-11-08 21:33 |只看该作者
我就知道.NET Framework有垃圾回收器。

PHP的就一直不清楚。

JavaScript又是怎么回收内存的?

论坛徽章:
0
9 [报告]
发表于 2009-11-09 21:36 |只看该作者

回复 #5 fly020212 的帖子

楼主所说的并不完全正确, $a=$b这样的方式并不意味着一定会开辟新的内存
是否传值拷贝与是否传递引用没有必然关系
参考这里:http://bbs3.chinaunix.net/misc.p ... end&tid=1159154
另外, 你所列的测试代码原因是这样的
PHP5改进了对象赋值操作,但也不是完全如平常所传的在php5中对象是传引用
当$b是一个对象时,$a=$b将会把$b的资源标示符号(也就是var_dump看到的那个#1)传递给$a
这样$a,$b依然是指向同一对象内容,所以修改任何一个另一个也被修改了
对其中一个进行unset或者赋值为null,实际上是将变量所存储的资源标示符(#1)给置为了null
所以这个变量也就理所当然的是null了
至于$a=&$b, 你参考关于引用的行为就可以理解了 这里就不赘述了

论坛徽章:
0
10 [报告]
发表于 2009-11-27 15:15 |只看该作者
好奇的问下lz,实际应用中怎样的场景会用到PHP GC?

GC的开销是怎么个计算?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP