免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 2739 | 回复: 14
打印 上一主题 下一主题

[远程文件读取,正则]如何遍历站点的类似PHONE..HTM的所有文件呢 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2005-07-28 10:39 |只看该作者 |倒序浏览
旧的请看http://bbs.chinaunix.net/forum/v ... 4234&show_type=

新问题就是我如何才能取得这个站点上面的所有类似PHONE{....}.HTM的所有文件呢??
这些文件是在一个文件夹中的.如果我不能在本地取文件名的话,那么能不能通过站点的访问得到啊?

那位大虾,帮下小弟!!向你致意![/url]

论坛徽章:
1
技术图书徽章
日期:2013-12-05 23:25:45
2 [报告]
发表于 2005-07-28 21:54 |只看该作者

[远程文件读取,正则]如何遍历站点的类似PHONE..HTM的所有文件呢

完全可以做到的。

但是,你需要从首页开始访问,来遍历他的站点,生成目录结构。

一个简单的说名:商店里面,展出的东西,你才可以看到。

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
3 [报告]
发表于 2005-07-29 12:19 |只看该作者

[远程文件读取,正则]如何遍历站点的类似PHONE..HTM的所有文件呢

[quote]原帖由 "waituy"][/quote 发表:

解決了嗎 ?
需要我幫忙嗎 ?

另外,個人看法,從這一帖來看,我得追上一帖, 及裏面的連結,
如果你問題從頭到尾再說一次,這帖的回覆或幫你的人可能會多一點

论坛徽章:
0
4 [报告]
发表于 2005-07-29 17:43 |只看该作者

[远程文件读取,正则]如何遍历站点的类似PHONE..HTM的所有文件呢

两个问题都还没有很好的解决方案呢!

在高手的眼中,也许这些处理字符的琐碎事情只要有心去做,总是能做好的.也许真的是这样.可是,.我都验证N遍了,它就是还有毛病.呵呵!发点牢骚!

这个遍历取远程文件的问题,我提出来只是想多学一点的东西.因为我要处理的文件都是我们自己的,所以可以在本地利用文件系统的函数读取的.

关于旧的问题,也就是如何分割页面;将其中的参数和值,分别取出来,然后再分类存储的问题还没有一个很好的解决方案.

可能是我的脑子太不灵光了,呵呵.

本来单独写出来调试好的功能,取制造商和手机类型的部分,竟然又出了一点毛病毛病!!!继续调!

QQ:52748176

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
5 [报告]
发表于 2005-07-29 17:48 |只看该作者

[远程文件读取,正则]如何遍历站点的类似PHONE..HTM的所有文件呢

嗯~
你有看到這個檔案嗎 ?
http://mobile.mooyi.com/scripts/model.js
裏面巳經有答案了,
再來看
http://mobile.mooyi.com/phone/list_1.htm
就巳經有了一半的答案了
(因為 list_?.htm 這個沒有分頁,較好抓)
仔細看看,你要的東西幾乎都有

论坛徽章:
0
6 [报告]
发表于 2005-07-29 17:56 |只看该作者

[远程文件读取,正则]如何遍历站点的类似PHONE..HTM的所有文件呢

呵呵,现在我在本地直接取文件就好了,谁要是想远程在站点上做的话,也可以练练手,现在小偷的程序很好用啊,以后要好好的研究下!

有空的话能和我讨论下如何去每个手机页面中的数据呢?谢谢!

论坛徽章:
0
7 [报告]
发表于 2005-07-29 17:59 |只看该作者

[远程文件读取,正则]如何遍历站点的类似PHONE..HTM的所有文件呢

每一个这样的页面中是某个厂家的所有的手机型号
http://mobile.mooyi.com/phone/list_1.htm

现在我在每一个也面中取厂家和型号的数据,然后先存如数据库,再读去其他的参数.现在只剩下最后一步了.

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
8 [报告]
发表于 2005-07-29 18:12 |只看该作者

[远程文件读取,正则]如何遍历站点的类似PHONE..HTM的所有文件呢

本地直接取文件 ?
看來你是在練習囉~
我也練習看看

等我貼出來,不過我打算用 shell 寫,不用 php 寫

论坛徽章:
0
9 [报告]
发表于 2005-07-29 18:17 |只看该作者

[远程文件读取,正则]如何遍历站点的类似PHONE..HTM的所有文件呢

呵呵,能不能麻烦你先考虑一下如何如其中一个页面中的数据
这个我急!!

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
10 [报告]
发表于 2005-07-29 18:36 |只看该作者

[远程文件读取,正则]如何遍历站点的类似PHONE..HTM的所有文件呢

[code]#!/bin/bash

# moofi 的 js , 裏有 phone 的國別,廠別,機別
url="http://mobile.mooyi.com/scripts/model.js"
file="/tmp/model.js"

wget $url -O $file

# 抓國及廠,形成所有的廠家 id
array=`grep 'dsy.add("0_[0-2]"' $file| sed -e 's/dsy.add("0_//g' | tr ',' '\n' |sed -e 's/[[,"].*|\([0-9].*\)".*/\1/g' `

# 廠家 id 的所有款機別 list url
factory_url="http://mobile.mooyi.com/phone"
for f in $array
do

# array 中有 0" 1 2 3...1" 100 101, 取這些字的第二個 byte
        d="${f:1:1}"
        case $c in
        # 是國別碼
        \"
                c=${f:0:1}
                ;;
        # 是廠別碼
        *)
       
                 factory=$f
        # 取得該廠所有手機 list
                wget  "$factory_url/list_$f.htm" -O $file
        # 取得該廠所有手機的編碼 {AASFLLF-aFLFL...}, 及 id ,title
        # 其中的中文字是評論,因我用 Big5
                grep -E 'href="phone.*htm' $file | sed -e 's/.*phone{\(.*\)}.htm.*infor.*?id=\(.*\)&guid.*title=\(.*\)" target="_blank">;斜
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP