免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3574 | 回复: 7
打印 上一主题 下一主题

[Web] 求助如何获取海量web日志文件 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-12-25 15:11 |只看该作者 |倒序浏览
小弟正在做海量web日志文件的分析研究,需要有很大的web日志文件作为数据基础,但是我本身并没有自己的网站,不能通过自己的网站获取web日志。其他的网站又不可能把自己的日志提供给咱,所以求助高人们,如何才能获取到海量日志?之前看过论坛里的一个类似话题,回复者提到了模仿访问的方法,我就想到有没有一种软件可以这样:我自己设立一个虚拟服务器,该软件经过设置,自动的随机的以各种ip、各种用户、各种需要来访问我的虚拟服务器,这样时间足够长的话日志文件也会不断变大,达到我的要求。请高人来指点了,如果有这样一种软件,请告诉我名字,小弟拜托了!先表示诚挚的谢意!

论坛徽章:
0
2 [报告]
发表于 2010-12-25 20:20 |只看该作者
你这算窃取 知道吗

论坛徽章:
0
3 [报告]
发表于 2010-12-26 14:30 |只看该作者
没人会给你的,日志里很多会有铭感信息的,呵呵。

论坛徽章:
0
4 [报告]
发表于 2010-12-27 00:00 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
5 [报告]
发表于 2010-12-28 02:27 |只看该作者
晕。

1. 如果你关心的只是日志的数量, 直接复制就成了。
2 .如果需要有点意义的日志, 找一块web扫描软件,逮着你的站点抓取一遍,然后你就有N多的日志,then goto 1
ps:这个扫描软件大多和安全相关,会进行大量的计算,可以去掉这写安全测试,只抓取。
或者, 最简单,你用wget 把你的网站镜像下来。一条命令足矣。

论坛徽章:
34
亥猪
日期:2015-03-20 13:55:11戌狗
日期:2015-03-20 13:57:01酉鸡
日期:2015-03-20 14:03:56未羊
日期:2015-03-20 14:18:30子鼠
日期:2015-03-20 14:20:14丑牛
日期:2015-03-20 14:20:31辰龙
日期:2015-03-20 14:35:34巳蛇
日期:2015-03-20 14:35:56操作系统版块每日发帖之星
日期:2015-11-06 06:20:00操作系统版块每日发帖之星
日期:2015-11-08 06:20:00操作系统版块每日发帖之星
日期:2015-11-19 06:20:00黄金圣斗士
日期:2015-11-24 10:43:13
6 [报告]
发表于 2010-12-29 16:37 |只看该作者
tfn 自己?

论坛徽章:
0
7 [报告]
发表于 2010-12-31 11:43 |只看该作者
自己压 脚本合成
复制 粘贴

论坛徽章:
0
8 [报告]
发表于 2010-12-31 21:47 |只看该作者
等楼主 研究过程中的 经验总结
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP