免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1231 | 回复: 0
打印 上一主题 下一主题

php抓捕网页内容的几种方式 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-06-18 14:24 |只看该作者 |倒序浏览

               
               
                1.fopen->fread->fclose
$handle = fopen ("http://www.example.com/", "rb");
$contents = "";
do {
   $data = fread($handle, 8192);
   if (strlen($data) == 0) {
   break;
   }
   $contents .= $data;
} while(true);
fclose ($handle);
2.file_get_contents
$url = "http://www.example.com/";
$contents = file_get_contents($url);
/***如果出现中文乱码使用下面代码***/
$getcontent = iconv("gb2312", "utf-8",file_get_contents($url));
3.curl
$url = "http://www.example.com/";
$ch = curl_init();
$timeout = 5;
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
/***在需要用户检测的网页里需要增加下面两行***/
curl_setopt($ch, CURLOPT_HTTPAUTH, CURLAUTH_ANY);
curl_setopt($ch, CURLOPT_USERPWD, US_NAME.":".US_PWD);
4.ob_get_contents获取本地php网页内容
session_start();
ob_start();
include('test.php');
contents = ob_get_contents();
$contents = curl_exec($ch);
curl_close($ch);


本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u3/94426/showart_1968700.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP