免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 17464 | 回复: 27
打印 上一主题 下一主题

[学习] PHP中的(伪)多线程与多进程 [复制链接]

论坛徽章:
1
技术图书徽章
日期:2013-12-05 23:25:45
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2005-12-02 15:32 |只看该作者 |倒序浏览
[学习] PHP中的(伪)多线程与多进程

    已经因为没怎么需要,所以没有查这个的资料。最近有一个项目却是需要这样子的功能。

    查看了PHP的手册和他人的例子,了解到基本的两种方法:

(伪)多线程:借助外力
    利用WEB服务器本身的多线程来处理,从WEB服务器多次调用我们需要实现多线程的程序。
    以下转载自:http://www.laikan8.com/21/118472.html
我们知道PHP本身是不支持多线程的, 但是我们的WEB服务器是支持多线程的.

也就是说可以同时让多人一起访问. 这也是我在PHP中实现多线程的基础.

假设我们现在运行的是a.php这个文件. 但是我在程序中又请求WEB服务器运行另一个b.php

那么这两个文件将是同时执行的.

(PS: 一个链接请求发送之后, WEB服务器就会执行它, 而不管客户端是否已经退出)

有些时候, 我们想运行的不是另一个文件, 而是本文件中的一部分代码.该怎么办呢?

其实可是通过参数来控制a.php来运行哪一段程序.

下面看一个例子:

//a.php


PHP代码:--------------------------------------------------------------------------------

  1. <?php
  2.     function runThread()
  3.     {
  4.         $fp = fsockopen('localhost', 80, $errno, $errmsg);
  5.         fputs($fp, "GET /a.php?act=brnrn");        //这里的第二个参数是HTTP协议中规定的请求头
  6.                                 //不明白的请看RFC中的定义
  7.         fclose($fp);
  8.     }

  9.     function a()
  10.     {
  11.         $fp = fopen('result_a.log', 'w');
  12.         fputs($fp, 'Set in ' . Date('h:i:s', time()) . (double)microtime() . "rn");
  13.         fclose($fp);        
  14.     }

  15.     function b()
  16.     {
  17.         $fp = fopen('result_b.log', 'w');
  18.         fputs($fp, 'Set in ' . Date('h:i:s', time()) . (double)microtime() . "rn");
  19.         fclose($fp);        
  20.     }
  21.     if(!isset($_GET['act'])) $_GET['act'] = 'a';
  22.     if($_GET['act'] == 'a')
  23.     {
  24.         runThread();
  25.         a();
  26.     }
  27.     else if($_GET['act'] == 'b') b();
  28. ?>
复制代码

--------------------------------------------------------------------------------


打开result_a.log 和 result_b.log 比较一下两个文件的中访问的时间. 大家会发现, 这两个的确是在不同线程中运行的.
有些时间完全一样.

上面只是一个简单的例子, 大家可以改进成其它形式.


既然PHP中也能多线程了, 那么问题也来了, 那就是同步的问题. 我们知道 PHP本身是不支持多线程的. 所以更不会有什么像

Java 中synchronize的方法了. 那我们该如何做呢.

1. 尽量不访问同一个资源. 以避免冲突. 但是可以同时像数据库操作. 因为数据库是支持并发操作的. 所以在多线程的PHP中

不要向同一个文件中写入数据. 如果必须要写的话, 用别的方法进行同步.. 如调用 flock对文件进行加锁等. 或建立临时文件

并在另外的线程中等待这个文件的消失 while(file_exits('xxx')); 这样就等于这个临时文件存在时, 表示其实线程正在操作

如果没有了这个文件, 说明其它线程已经释放了这个.

2. 尽量不要从runThread在执行fputs后取这个socket中读取数据. 因为要实现多线程, 需要的用非阻塞模式. 即在像fgets这

样的函数时立即返回.. 所以读写数据就会出问题. 如果使用阻塞模式的话, 程序就不算是多线程了. 他要等上面的返回才执行

下面的程序. 所以如果需要交换数据最后利用外面文件或数据中完成. 实在想要的话就用socket_set_nonblock($fp) 来实现.


说了这么多, 倒底这个有没有实际的意义呢? 在什么时候需要这种用这种方法呢 ?

答案是肯定的. 大家知道. 在一个不断读取网络资源的应用中, 网络的速度是瓶颈. 如果采多这种形式就可以同时以多个线程对

不同的页面进行读取.

本人做的一个能从8848、soaso这些商城网站搜索信息的程序。还有一个从阿里巴巴网站上读取商业信息和公司目录的程序也用到

了此技术。 因为这两个程序都是要不断的链接它们的服务器读取信息并保存到数据库。 利用此技术正好消除了在等待响应时的瓶

颈。


    多进程:使用PHP的Process Control Functions(PCNTL/线程控制函数)
    函数参考可见:http://www.php.net/manual/zh/ref.pcntl.php
    只能用在Unix Like OS,Windows不可用。
    编译php的时候,需要加上--enable-pcntl,且推荐仅仅在CLI模式运行,不要在WEB服务器环境运行。
    以下为简短的测试代码:
  1. <?php
  2. declare(ticks=1);
  3. $bWaitFlag = FALSE; /// 是否等待进程结束
  4. $intNum = 10;           /// 进程总数
  5. $pids = array();        ///  进程PID数组

  6. echo ("Start\n");

  7. for($i = 0; $i < $intNum; $i++) {

  8.   $pids[$i] = pcntl_fork();/// 产生子进程,而且从当前行之下开试运行代码,而且不继承父进程的数据信息

  9.   if(!$pids[$i]) {
  10.     // 子进程进程代码段_Start
  11.     $str="";
  12.     sleep(5+$i);
  13.     for ($j=0;$j<$i;$j++) {$str.="*";}
  14.     echo "$i -> " . time() . " $str \n";
  15.     exit();
  16.     // 子进程进程代码段_End
  17.   }

  18. }
  19. if ($bWaitFlag)
  20. {
  21.   for($i = 0; $i < $intNum; $i++) {
  22.     pcntl_waitpid($pids[$i], $status, WUNTRACED);
  23.     echo "wait $i -> " . time() . "\n";
  24.   }
  25. }
  26. echo ("End\n");
  27. ?>
复制代码

    运行结果如下:
  1. [qiao@oicq qiao]$ php test.php        
  2. Start
  3. End
  4. [qiao@oicq qiao]$ ps -aux | grep "php"
  5. qiao     32275  0.0  0.5 49668 6148 pts/1    S    14:03   0:00 /usr/local/php4/b
  6. qiao     32276  0.0  0.5 49668 6152 pts/1    S    14:03   0:00 /usr/local/php4/b
  7. qiao     32277  0.0  0.5 49668 6152 pts/1    S    14:03   0:00 /usr/local/php4/b
  8. qiao     32278  0.0  0.5 49668 6152 pts/1    S    14:03   0:00 /usr/local/php4/b
  9. qiao     32279  0.0  0.5 49668 6152 pts/1    S    14:03   0:00 /usr/local/php4/b
  10. qiao     32280  0.0  0.5 49668 6152 pts/1    S    14:03   0:00 /usr/local/php4/b
  11. qiao     32281  0.0  0.5 49668 6152 pts/1    S    14:03   0:00 /usr/local/php4/b
  12. qiao     32282  0.0  0.5 49668 6152 pts/1    S    14:03   0:00 /usr/local/php4/b
  13. qiao     32283  0.0  0.5 49668 6152 pts/1    S    14:03   0:00 /usr/local/php4/b
  14. qiao     32284  0.0  0.5 49668 6152 pts/1    S    14:03   0:00 /usr/local/php4/b
  15. qiao     32286  0.0  0.0  1620  600 pts/1    S    14:03   0:00 grep php
  16. [qiao@oicq qiao]$ 0 -> 1133503401  
  17. 1 -> 1133503402 *
  18. 2 -> 1133503403 **
  19. 3 -> 1133503404 ***
  20. 4 -> 1133503405 ****
  21. 5 -> 1133503406 *****
  22. 6 -> 1133503407 ******
  23. 7 -> 1133503408 *******
  24. 8 -> 1133503409 ********
  25. 9 -> 1133503410 *********

  26. [qiao@oicq qiao]$
复制代码


    如果$bWaitFlag=TURE,则结果如下:
  1. [qiao@oicq qiao]$ php test.php        
  2. Start
  3. 0 -> 1133503602  
  4. wait 0 -> 1133503602
  5. 1 -> 1133503603 *
  6. wait 1 -> 1133503603
  7. 2 -> 1133503604 **
  8. wait 2 -> 1133503604
  9. 3 -> 1133503605 ***
  10. wait 3 -> 1133503605
  11. 4 -> 1133503606 ****
  12. wait 4 -> 1133503606
  13. 5 -> 1133503607 *****
  14. wait 5 -> 1133503607
  15. 6 -> 1133503608 ******
  16. wait 6 -> 1133503608
  17. 7 -> 1133503609 *******
  18. wait 7 -> 1133503609
  19. 8 -> 1133503610 ********
  20. wait 8 -> 1133503610
  21. 9 -> 1133503611 *********
  22. wait 9 -> 1133503611
  23. End
  24. [qiao@oicq qiao]$
复制代码


    从多进程的例子可以看出,使用pcntl_fork()之后,将生成一个子进程,而且子进程运行的代码,从pcntl_fork()之后的代码开始,而子进程不继承父进程的数据信息(实际上是把父进程的数据做了一个全新的拷贝),因而使用if(!$pids[$i]) 来控制子进程实际运行的代码段。

    更详细的研究出于时间关系,暂时没有进行,你可以参考我给出的手册的链接。

[ 本帖最后由 HonestQiao 于 2005-12-2 22:02 编辑 ]

论坛徽章:
0
2 [报告]
发表于 2005-12-02 15:41 |只看该作者
好像在 phpx 上看到过

例二是不是可以用来暴力破解

[ 本帖最后由 hitty 于 2005-12-2 15:46 编辑 ]

论坛徽章:
0
3 [报告]
发表于 2005-12-02 15:59 |只看该作者
看不出有什么实际意义

如果当前程序不需要“进程”的结果,那么要打开那个“进程”干什么?
如果当前程序需要使用“进程”的结果,那么你终归是要等待“进程”的结束,那么多不多又有什么区别呢?

论坛徽章:
1
技术图书徽章
日期:2013-12-05 23:25:45
4 [报告]
发表于 2005-12-02 16:32 |只看该作者
原帖由 xuzuning 于 2005-12-2 15:59 发表
看不出有什么实际意义

如果当前程序不需要“进程”的结果,那么要打开那个“进程”干什么?
如果当前程序需要使用“进程”的结果,那么你终归是要等待“进程”的结束,那么多不多又有什么区别呢?


做类似页面抓取的工作可能需要,不然一次一个页面抓取浪费带宽。

再如做本地的文件转换,例如有一批文件需要转换。

其实进程之间可以使用很多方法通信。

当然可以手动启动很多进程,但是毕竟它提供了这个功能,你可以看pcntl的手册,它可以对子进程进行控制,例如他结束你可以知道,他超时你可以处理。

论坛徽章:
0
5 [报告]
发表于 2005-12-02 16:47 |只看该作者
没有看清楚!

编译php的时候,需要加上--enable-pcntl,且推荐仅仅在CLI模式运行,不要在WEB服务器环境运行。

呵呵!
用c或shell要好多了吧?

论坛徽章:
1
技术图书徽章
日期:2013-12-05 23:25:45
6 [报告]
发表于 2005-12-02 16:49 |只看该作者
原帖由 xuzuning 于 2005-12-2 16:47 发表
没有看清楚!

编译php的时候,需要加上--enable-pcntl,且推荐仅仅在CLI模式运行,不要在WEB服务器环境运行。

呵呵!
用c或shell要好多了吧?



用c当然无可厚非,不过门槛比php高多了。

但是用shell可能不是很多人可以接受。

论坛徽章:
0
7 [报告]
发表于 2005-12-02 17:05 |只看该作者
我也是借助外力,是OS本身的多进程

不觉得这样控制有什么优势,甚至会加大复杂程度

论坛徽章:
0
8 [报告]
发表于 2005-12-02 18:29 |只看该作者
原帖由 HonestQiao 于 2005-12-2 15:32 发表
从多进程的例子可以看出,使用pcntl_fork()之后,将生成一个子进程,而且子进程运行的代码,从pcntl_fork()之后的代码开始,而子进程不继承父进程的数据信息,因而使用if(!$pids[$i]) 来控制子进程实际运行的代码段。


这里表述不当, 子进程继承了父进程的很多数据信息.

而 $pids[$i] 是 pcntl_fork() 的返回值, 进程创建后子进程返回 0 父进程返回子进程. 所以用 fork() 的返回值区别子进程或者父进程.

由于进程/线程都是系统的调度单位, 参与系统资源竞争, 所以适当情况下多进程/线程是十分必要的, 而不是像某些回贴说的增加复杂度.

有些情况不是借助外力可以创建进程就行的, 可能需要从父进程中读取一些信息呢.

论坛徽章:
0
9 [报告]
发表于 2005-12-02 19:38 |只看该作者
多线程还是很好用的,我做过的项目中就有用到,也是用于搜索,抓取WEB页面。

如果是在Unix下,没有必要采用
$fp = fsockopen('localhost', 80, $errno, $errmsg);
        fputs($fp, "GET /a.php?act=brnrn");        

直接用exec("php a.php args")这样更方便。

论坛徽章:
0
10 [报告]
发表于 2005-12-02 20:32 |只看该作者
我的方法大概像 Haohappy

php本身处理多线程/进程就不好,我认为没必要搞一个   伪   多线程与多进程,增加编写php编写的难度

有必要吗?假如本身就是假的,是为了一种实现方式,那另一种办法也能实现,而且又不用增加任何代码等

为啥要像LZ那样去写?

请注意哦:是LZ的实现方式我觉得没必要,不是说多线程/进程不好,偶写的程序中多线程帮了很大忙
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP