免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2540 | 回复: 5
打印 上一主题 下一主题

如何用正则抓取网页中的内容 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2006-11-14 23:19 |只看该作者 |倒序浏览
如题

希望附加例子

论坛徽章:
0
2 [报告]
发表于 2006-11-14 23:39 |只看该作者
explode preg_match



if(0!=$k) {
                                $oldstr = array('\'','(',');','\n','\r','array','Array');
                                $newstr = array('','','','','','','');
                                $messages = str_replace($oldstr,$newstr,$v);
//                                $messages = strtolower($messages);
                                $rule="\"\;[a-zA-Z0-9]{1,}\:[a-zA-Z0-9{1,}\:\"[a-zA-Z0-9]{1,}\"\;[a-zA-Z0-9]{1,}\:[a-zA-Z0-9]{1,}\:\"";
                                $messages=ereg_replace($rule,"",$messages);
                                $messages = explode(',',$messages);
                                $tmp_datetime = explode(' ',$messages[1]);
                                $temp_date = explode('-',$tmp_datetime[0]);
                                $temp_time = explode(':',$tmp_datetime[1]);
                                $tmp_year        = $temp_date[0];
                                $tmp_month        = $temp_date[1];
                                $tmp_day        = $temp_date[2];
                                $tmp_hour        = $temp_time[0];
                                $tmp_minute        = $temp_time[1];
                                $tmp_second='00';
                                $tmp_today_info = $this->M_Tmp_year.'-'.$tmp_month.'-'.$tmp_day;
                                $date_time = $this->M_Tmp_year . '-' . $tmp_month . '-'.$tmp_day . ' ' . $tmp_hour . ':' . $tmp_minute . ':' .$tmp_second;
//                                echo "<pre>\n $this->M_Tmp_year .. $tmp_month .. $tmp_day .. $tmp_hour .. $tmp_minute .. $tmp_second \n";
                                $tmp_Unix_second=mktime($tmp_hour,$tmp_minute,$tmp_second,$tmp_month,$tmp_day,$this->M_Tmp_year);
                                $new_tmp_time = $tmp_Unix_second+43200;
                                $tmp_hour = date('H',$new_tmp_time);
                                $tmp_minute = date('i',$new_tmp_time);
                                $tmp_second = date('s',$new_tmp_time);
                                $tmp_month = date('m',$new_tmp_time);
                                $tmp_day = date('d',$new_tmp_time);
                                $tmp_Unix_second=mktime($tmp_hour,$tmp_minute,$tmp_second,$tmp_month,$tmp_day,$this->M_Tmp_year);
                                $this->M_Tmp_year = date('Y',$new_tmp_time);
                                $Unix_second=$tmp_Unix_second-$this->M_LostTime*60;
                                $close_time = date('Y-m-d H:i:s',$Unix_second);
                                $tmp_sj = $tmp_sj = $tmp_month.'-'.$tmp_day.'<br>'.$tmp_hour.':'.$tmp_minute.':'.$tmp_second;
                                $messages[6]=strtoupper($messages[6]);
                                $uptime=date("Y-m-d H:i:s");

论坛徽章:
0
3 [报告]
发表于 2006-11-15 11:09 |只看该作者
仁兄写得好高深呀,小弟有点迷

论坛徽章:
0
4 [报告]
发表于 2006-11-15 11:16 |只看该作者
根据HTML 固定不变的部分开始划分 界限 然后一一打散 分析需要的东西

论坛徽章:
0
5 [报告]
发表于 2006-11-15 17:58 |只看该作者
不太明白

论坛徽章:
0
6 [报告]
发表于 2006-11-16 15:38 |只看该作者
还有其它人发言吗?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP