- 论坛徽章:
- 0
|
小弟在分析 apache的日志, 想统计每一个栏目有哪些IP访问, 访问了多少次
得出结论
www.aa.com 被IP1访问了 3次
被IP2访问了5次
比如有一条日志是这样的
1.2.3.4 - - [21/Apr/2006:00:02:00 +0800] "GET /index.php HTTP/1.0" 200 13643 "http://www.aa.com/" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; Poco
0.31; .NET CLR 1.1.4322)"
于是就看 "GET /****" 那里
可能会出现 "GET / HTTP/1.0"
"GET /index.php HTTP/1.0" 或*h t m 等
当发现这样的模式时, 就看 后边的referer域 , 可以找到 http://www.aa.com
这样就把IP 1.2.3.4对www.aa.com的访问计数加一
可是问题是有这样的记录
1.2.3.4 - - [21/Apr/2006:00:02:19 +0800] "GET /index.php HTTP/1.0" 200 5482 "-" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)"
他的referer域是空的, 这样的怎么来算呢? 为什么会产生这样的记录呢?
而且这样的记录有很多, 我想把这样的都记录总数记下来, 然后平均分配到日志里出现
的链接上, 一个站点有aa.site.com 和 bb.site.com两个栏目, 有100个IP访问了这两个
栏目, 就把那个总数除以100
加到对aa.site.com and bb.site.com进行访问的IP 计数上.
这样作可以么?大家帮忙看看呀 |
|