免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3746 | 回复: 17
打印 上一主题 下一主题

[正则] 字串处理,数据读取,小偷程序相关! [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2005-07-27 16:53 |只看该作者 |正序浏览
这个问题在喜悦国际村已经提过了,可是还有些问题没有解决.希望这里有哥们能拿下它,万分感谢!
原贴地址:http://www.phpx.com/happy/top104150.html

论坛徽章:
0
18 [报告]
发表于 2005-08-02 20:45 |只看该作者

[正则] 字串处理,数据读取,小偷程序相关!

有一些急事,这个问题被我放了两天


今天终于搞定,代码我就不贴了,思路和上面表述的基本一样

在这里谢谢斑竹和所有热心帮助我的CUER,你们真的是..................................................................
.....................................................................
...................................................................
....(省略部分==(太可爱了!)*n)!

论坛徽章:
1
技术图书徽章
日期:2013-12-05 23:25:45
17 [报告]
发表于 2005-07-28 21:50 |只看该作者

[正则] 字串处理,数据读取,小偷程序相关!

结帖结帖

论坛徽章:
0
16 [报告]
发表于 2005-07-28 12:22 |只看该作者

[正则] 字串处理,数据读取,小偷程序相关!

已经有代码可以取到手机的参数数据,可是我还没有想到怎么将某个参数属于哪个类别写进去?
  1. <?php
  2. $msg = file_get_contents("http://mobile.mooyi.com/phone/phone{495D00DD-ED21-441B-AB08-D4E2CD367E1F}.htm");
  3. preg_match_all('/width="24%" valign="top">;(.+?)<\/tr>;/si',$msg,$tmp);
  4. for($i=0;$i<count($tmp[0]);$i++){
  5.     list($name,$value) = explode(':',strip_tags($tmp[1][$i]));
  6.     echo "$name:$value<br/>;";     
  7. }
复制代码

论坛徽章:
0
15 [报告]
发表于 2005-07-28 11:54 |只看该作者

[正则] 字串处理,数据读取,小偷程序相关!

我看了一下页面源代码,没有任何特征,弄起来很麻烦的,而且各种手机的参数项不定,现在提供接口和XML或其它正规数据页的多的是,干吗抓着这个不放了
------------------------------------------------------------
$txt = file_get_contents('url');

1.去掉$txt 的前段跟尾部没用的东西,[可粗略估计]
2.去掉格式标签如<font ..>;,及其它没用的东西
3.去掉换行,空格等
4...

$reg_standard[] = "网络频率(.+)<td>;(.+)</td>;";
$reg_standard[] = "可选颜色(.+)<td>;(.+)</td>;";
$reg_standard[] = "尺寸体积(.+)<td>;(.+)</td>;";

$reg = implode('(.+)', $reg_standard);
具体正则只自己修改,只是提供一个想法,如果还是有某些不能提出来的可以构造条件,如添加标签....

论坛徽章:
0
14 [报告]
发表于 2005-07-27 21:42 |只看该作者

[正则] 字串处理,数据读取,小偷程序相关!

上面的表还缺少一个字段

classify varchar  手机的参数类别 ,就象:规格参数 \基本功能\高级功能..

这是关键,如何提取呢?

论坛徽章:
0
13 [报告]
发表于 2005-07-27 21:25 |只看该作者

[正则] 字串处理,数据读取,小偷程序相关!

id  int auto increment primary key  主键
p_id  int  保存产品ID 比如 1-> 联想777 2-> 三星666
name varchar  特征名字 比如 网络频率 可选颜色 中文输入
comm varchar  特征说明  900/1800 银色 T9输入法

表2

p_id 主键,自插入
name 收集型号 

论坛徽章:
0
12 [报告]
发表于 2005-07-27 21:06 |只看该作者

[正则] 字串处理,数据读取,小偷程序相关!

这个没有太大的问题.
关键是下面:
这是我数据表中数据的存储方式,如何将数据这样存储呢?求教!

网络频率  900/1800;GSM/GPRS      规格参数
可选颜色  银色                       规格参数
操作系统  Windows Mobile 2003SE  高级功能
中文输入                             基本功能

论坛徽章:
0
11 [报告]
发表于 2005-07-27 20:09 |只看该作者

[正则] 字串处理,数据读取,小偷程序相关!

可以分两次来匹配.因为有个"更多信息",他要单独匹配出来
其他的可以这样

/"#0080c0">;(.*):</font>;</td>;<td>;(.*)</td>;</tr>;/i

这个正则可以配置普通的特点.

意思是 "#0080c0">; 开头(匹配 "<font color="#0080c0">;
后面跟任意个字符(比如 颜色.闹钟) 后面个 : 后面跟 </font>;</td>;<td>;

后面跟任意个字符 (比如 白色.关机闹钟) 后面跟 </td>;</tr>;

第一匹配的是你要的特征名称,第二个括号匹配的是特征说明.

论坛徽章:
0
10 [报告]
发表于 2005-07-27 19:39 |只看该作者

[正则] 字串处理,数据读取,小偷程序相关!

手机的参数分为5个类别

规格参数
基本功能
高级功能
附加功能
更多信息
相关文章

手机的每一个参数在数据表中作为一个一条记录,类别为其中的一个字段

如何存取呢?
  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP