免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 7441 | 回复: 17
打印 上一主题 下一主题

讨论,第三方统计是如何获取网页标题的? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-04-08 21:44 |只看该作者 |倒序浏览
这个统计是用在taobao店铺上的,在taobao的店铺上,加上一段统计代码,统计代码是一个动态产生图片的php程序,
如:<img src="http://*****/count.php?id=888>。下图中的“停留”,是指统计脚本所在网页的title。
请问,这个程序获取统计图标所在网页的url这个很简单,但是如何获得所在网页的标题的呢?难道是count.php中再去打开这个远程页面的url后再正则title的吗?这样应该对性能有很大影响,如何才能高效率的解决这个问题呢?

[ 本帖最后由 hh11 于 2008-4-8 21:46 编辑 ]

2.gif (17.54 KB, 下载次数: 49)

2.gif

论坛徽章:
0
2 [报告]
发表于 2008-04-08 23:54 |只看该作者
这种数据都是js取的,然后再递交给php的

论坛徽章:
0
3 [报告]
发表于 2008-04-09 09:15 |只看该作者
原帖由 3227049 于 2008-4-8 23:54 发表
这种数据都是js取的,然后再递交给php的


由于taobao的限制,根本无法使用js,上例中以<img src=http://****/count.php>调用代码,跟本不可能即在其中执行js,同时又输出图片的。

论坛徽章:
0
4 [报告]
发表于 2008-04-09 21:06 |只看该作者
好象很难哦,大家来讨论一下。

论坛徽章:
0
5 [报告]
发表于 2008-04-10 10:03 |只看该作者
Img里面一个程序,里面有HTTP头的Reference,可以通过这个再去找对应网页。

论坛徽章:
0
6 [报告]
发表于 2008-04-10 11:24 |只看该作者
原帖由 ipaddr 于 2008-4-10 10:03 发表
Img里面一个程序,里面有HTTP头的Reference,可以通过这个再去找对应网页。


是不是,在用file或curl去获得远程网页的html后,用正则分析title。
如果这样,效率应该很差,是不是肯定没别的办法了?

论坛徽章:
0
7 [报告]
发表于 2008-04-14 20:40 |只看该作者
继续关注。

论坛徽章:
0
8 [报告]
发表于 2008-04-14 20:51 |只看该作者
你的要求是什么,,,比如一分钟获取多少个网页标题。

论坛徽章:
1
技术图书徽章
日期:2013-12-05 23:25:45
9 [报告]
发表于 2008-04-14 23:09 |只看该作者
就是读取抓取的。

google也会这么做来分析页面投放广告。

论坛徽章:
0
10 [报告]
发表于 2008-04-16 23:50 |只看该作者
抓下来referer来分析,取个标题太简单了,而且只要去网页的前1k字节足够了,taobao的页面都一样

而且取过url标题的下次不需要再去取,或者存一下referer,另外运行一个定时程序专门根据referer更新标题

[ 本帖最后由 ashchen 于 2008-4-16 23:56 编辑 ]
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP