免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 6894 | 回复: 10
打印 上一主题 下一主题

[文本处理] grep -v 可以实现以一个文件给出的内容为过滤列表吗? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-04-29 20:03 |只看该作者 |倒序浏览
今天在分析iis的log,我想观察下百度蜘蛛的来访纪录,发现有很多的都是假的百度蜘蛛。我就想把这些ip给过滤掉

现在还是用的这种土鳖方法。。。。有什么好的方法可以处理吗?
grep -v "113.98.254.245"| grep -v "117.21.220.245"| grep -v "117.28.255.53"| grep -v "117.34.73.70"| grep -v "123.125.67.200"| grep -v "175.6.7.78"| grep -v "183.91.40.144"| grep -v "220.181.165.139"| grep -v "220.181.165.197"| grep -v "220.181.51.203"| grep -v "221.236.173.82"| grep -v "222.73.139.72"| grep -v "42.120.49.62"| grep -v "58.215.190.84"| grep -v "60.172.229.61"| grep -v "117.28.255.37"| grep -v "110.81.155.232"


-------------假蜘蛛IP---------------------------------
113.98.254.245
117.21.220.245
117.28.255.53
117.34.73.70
123.125.67.200
175.6.7.78
183.91.40.144
220.181.165.139
220.181.165.197
220.181.51.203
221.236.173.82
222.73.139.72
42.120.49.62
58.215.190.84
60.172.229.61
117.28.255.37
110.81.155.232

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
2 [报告]
发表于 2014-04-29 20:17 |只看该作者
这种问题用awk比较适合~
  1. awk 'NR==FNR{a[$0];next}!($0 in a)'
复制代码

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
3 [报告]
发表于 2014-04-29 20:38 |只看该作者
回复 1# shamandalie


    可以使用 grep -Fvf ip.txt logfile 啊。

论坛徽章:
768
金牛座
日期:2014-02-26 17:49:58水瓶座
日期:2014-02-26 18:10:15白羊座
日期:2014-04-15 19:29:52寅虎
日期:2014-04-17 19:43:21酉鸡
日期:2014-04-19 21:24:10子鼠
日期:2014-04-22 13:55:24卯兔
日期:2014-04-22 14:20:58亥猪
日期:2014-04-22 16:13:09狮子座
日期:2014-05-05 22:31:17摩羯座
日期:2014-05-06 10:32:53处女座
日期:2014-05-12 09:23:11子鼠
日期:2014-05-21 18:21:27
4 [报告]
发表于 2014-04-29 20:42 |只看该作者
回复 3# blackold
黑哥v5,学习了。


   

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
5 [报告]
发表于 2014-04-29 21:27 |只看该作者
回复 4# Herowinter


    算是 grep 基本用法吧。

    相互学习!

论坛徽章:
0
6 [报告]
发表于 2014-04-29 21:56 |只看该作者
回复 3# blackold

我试试


   

论坛徽章:
0
7 [报告]
发表于 2014-04-29 22:49 |只看该作者
回复 5# blackold

又学了一招
   

论坛徽章:
3
酉鸡
日期:2014-04-23 17:17:56丑牛
日期:2014-05-08 11:41:302015亚冠之德黑兰石油
日期:2015-08-03 11:14:27
8 [报告]
发表于 2014-04-30 09:24 |只看该作者
回复 3# blackold


    黑哥V5,87! 学习下,mark!

论坛徽章:
1
水瓶座
日期:2014-05-16 13:42:25
9 [报告]
发表于 2014-04-30 10:31 |只看该作者
grep --help看说明
-v 过滤
-f 通过文件来匹配过滤

一切都可以--help解决

论坛徽章:
0
10 [报告]
发表于 2014-04-30 10:40 |只看该作者
学习了 又学了一招
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP