免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2953 | 回复: 6
打印 上一主题 下一主题

如何从access.log中找出符合某个IP段集合的记录 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-05-21 15:30 |只看该作者 |倒序浏览
各位大侠, 我现在要从access.log 文件中找出 符合某个ip段集合的记录, 具体文件如下
access.log

2008-05-19 00:00:00.85   INFO    211.94.164.200  2008-05-19 00:00:00             null                     
2008-05-19 00:00:00.94   INFO    211.139.189.37  2008-05-19 00:00:00             null                     
2008-05-19 00:00:00.101 INFO    218.205.237.42  2008-05-19 00:00:00             000000000000   
2008-05-19 00:00:00.161 INFO    211.140.3.110    2008-05-19 00:00:00             000000000000

其中第4个域为访问我的ip地址。 接下来的ip_addr_set为ip段的集合,如下:

ip_addr_set

211.95.
211.96.
220.196.52.
202.75.248.139
202.75.248.159

以点号结束的表示号段, 数字结束的表示一个单独的IP。
能在access.log中找出ip 在 ip_addr_set中的记录么??  

我自己能想的办法是:
awk 'BEGIN{i=0; j=1}  NR=FNR{ i++; a=$4, b=$0 } NR!=FNR{ for(j=1;j<=i; j++)   if(a[j] ~ /*这里把ip_addr_set的ip变成一个正则表达式,但是这个正则表达式我不太知道写*/) print b[j]}' access.log   ip_addr_set  

access.log 和ip_addr_set我都只列出了其中的一部分.............

现在主要的问题的把ip_addr_set这个里的每个记录都变成 正则表达式的形式 ........
或者另外各位大侠还有什么更高明,或者更有效率的办法, 也多多提供帮助啊, 先谢过了:)

论坛徽章:
11
金牛座
日期:2015-03-19 16:56:22数据库技术版块每日发帖之星
日期:2016-08-02 06:20:00数据库技术版块每日发帖之星
日期:2016-04-24 06:20:00数据库技术版块每日发帖之星
日期:2016-04-13 06:20:00IT运维版块每日发帖之星
日期:2016-04-13 06:20:00数据库技术版块每日发帖之星
日期:2016-02-03 06:20:00数据库技术版块每日发帖之星
日期:2015-08-06 06:20:00季节之章:春
日期:2015-03-27 15:54:57羊年新春福章
日期:2015-03-27 15:54:37戌狗
日期:2015-03-19 16:56:41数据库技术版块每日发帖之星
日期:2016-08-18 06:20:00
2 [报告]
发表于 2008-05-21 15:35 |只看该作者
使用 grep -f ip_addr_set access.log
-f跟的是文件..

论坛徽章:
0
3 [报告]
发表于 2008-05-21 16:00 |只看该作者

  1. awk -v PAT=$(sed ':a;$!{N;ba;};s/\n/|/g' ipsetfile) '$4~PAT' logfile
复制代码

论坛徽章:
0
4 [报告]
发表于 2008-05-21 16:15 |只看该作者

凑一个


  1. awk 'NR==FNR{a[$0]} NR!=FNR{for(i in a){ if($0~i)print } }'  ip_addr_set access.log
复制代码

论坛徽章:
0
5 [报告]
发表于 2008-05-21 18:57 |只看该作者
原帖由 liaosnet 于 2008-5-21 15:35 发表
使用 grep -f ip_addr_set access.log
-f跟的是文件..



学一招grep的这个用法,不ip_addr_set 里的是202.19. 诸如此类的字符串,我估计. 在grep里被通配了.............所以把202.133.192.1这样的ip也找出来了
不过还是谢谢你啦

论坛徽章:
0
6 [报告]
发表于 2008-05-21 18:59 |只看该作者
原帖由 springwind426 于 2008-5-21 16:00 发表

awk -v PAT=$(sed ':a;$!{N;ba;};s/\n/|/g' ipsetfile) '$4~PAT' logfile


谢谢啦, 我已经在用上这个了, 而且用肉眼测试过输出数据!
厉害啊, springwind大哥!  up up up

论坛徽章:
0
7 [报告]
发表于 2008-05-21 19:04 |只看该作者
原帖由 err7dd 于 2008-5-21 16:15 发表

awk 'NR==FNR{a[$0]} NR!=FNR{for(i in a){ if($0~i)print } }'  ip_addr_set access.log


理论上应该是可以的,但是我执行了40几分钟也没出结果.........我之前写的那个估计效率也一样,但是我想结果应该是正确 的
PS,我的access.log有300多万条记录
不过还是谢谢啦
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP