免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: useinxinuanihc
打印 上一主题 下一主题

如何用awk按组合关键字删除重复行 [复制链接]

论坛徽章:
16
IT运维版块每日发帖之星
日期:2015-08-24 06:20:00综合交流区版块每日发帖之星
日期:2015-10-14 06:20:00IT运维版块每日发帖之星
日期:2015-10-25 06:20:00IT运维版块每日发帖之星
日期:2015-11-06 06:20:00IT运维版块每日发帖之星
日期:2015-12-10 06:20:00平安夜徽章
日期:2015-12-26 00:06:302016猴年福章徽章
日期:2016-02-18 15:30:34IT运维版块每日发帖之星
日期:2016-04-15 06:20:00IT运维版块每日发帖之星
日期:2016-05-21 06:20:00综合交流区版块每日发帖之星
日期:2016-08-16 06:20:002015七夕节徽章
日期:2015-08-21 11:06:17IT运维版块每日发帖之星
日期:2015-08-14 06:20:00
21 [报告]
发表于 2010-05-19 15:28 |只看该作者
回复 20# bbyyzhang


    awk 'BEGIN{FS="?"} .......

打印¥1

论坛徽章:
0
22 [报告]
发表于 2010-05-19 15:35 |只看该作者
本帖最后由 bbyyzhang 于 2010-05-19 15:38 编辑

回复 21# expert1


    这个不好使
我要提取的是apache日志,统计bb地址的来源地址,里面有两个问号的,格式如:

116.24.211.162 347044 13947 [18/May/2010:10:43:56 +0800] "GET http://××.com/××/bb.htm?t=1231231" 200 10508 "http://××.com/××/aa.htm?t=1274150547406" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; .NET CLR 3.0.04506.30)"
已经使用pattern提取到来源了,使用
awk '/..../ {print $10}' access_log |sort |uniq 消重后不彻底

论坛徽章:
16
IT运维版块每日发帖之星
日期:2015-08-24 06:20:00综合交流区版块每日发帖之星
日期:2015-10-14 06:20:00IT运维版块每日发帖之星
日期:2015-10-25 06:20:00IT运维版块每日发帖之星
日期:2015-11-06 06:20:00IT运维版块每日发帖之星
日期:2015-12-10 06:20:00平安夜徽章
日期:2015-12-26 00:06:302016猴年福章徽章
日期:2016-02-18 15:30:34IT运维版块每日发帖之星
日期:2016-04-15 06:20:00IT运维版块每日发帖之星
日期:2016-05-21 06:20:00综合交流区版块每日发帖之星
日期:2016-08-16 06:20:002015七夕节徽章
日期:2015-08-21 11:06:17IT运维版块每日发帖之星
日期:2015-08-14 06:20:00
23 [报告]
发表于 2010-05-19 15:45 |只看该作者
回复  expert1


    这个不好使
我要提取的是apache日志,统计bb地址的来源地址,里面有两个问号的, ...
bbyyzhang 发表于 2010-05-19 15:35



    晕,你看看20F你给的例子嘛。

看看下边的名言:
###############################
我们只负责切割,至于原模型是什么样子我不管。

                            -----blackbold (China)
###############################

论坛徽章:
0
24 [报告]
发表于 2010-05-19 15:54 |只看该作者
本帖最后由 bbyyzhang 于 2010-05-19 16:07 编辑
借宝地问一下
只对第一列做个消重,然后打印消重后第一列内容怎么做?
bbyyzhang 发表于 2010-05-19 15:09
to 11 F

awk '{print $1}' wokao |sort |uniq

awk '{a[$1]=$1}END{for (i in a)print ' wokao
expert1 发表于 2010-05-19 15:10

回复  expert1


    谢谢哥,|sort |uniq 这个好用,呵呵
bbyyzhang 发表于 2010-05-19 15:19


使用awk '/..../ {print $10}' access_log |sort |uniq消重后的结果不彻底
因为$10有些是有时间戳的,如: ...
bbyyzhang 发表于 2010-05-19 15:25

回复  bbyyzhang


    awk 'BEGIN{FS="?"} .......

打印¥1
expert1 发表于 2010-05-19 15:28

回复  expert1


    这个不好使
我要提取的是apache日志,统计bb地址的来源地址,里面有两个问号的, ...
bbyyzhang 发表于 2010-05-19 15:35



回复 23# expert1


    20F给的是切割后的结果,我想再切割
我现在的命令如下:
awk '/pattern1/&&$0!~/pattern2/&&$10!~/pattern3/&&$10!~/pattern4/&&$10!~/pattern5/ {print $10}' access_log |sort|uniq
所以加 'BEGIN{FS="?"} 就乱掉了

求职 : 技术支持/维
论坛徽章:
0
25 [报告]
发表于 2010-05-19 16:11 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
26 [报告]
发表于 2010-05-19 16:17 |只看该作者
回复 25# 99超人


    呵呵,没有什么大问题。就是把如下的重复行也去掉了。
foo bar
foo bar

这要看LZ的要求了。

论坛徽章:
0
27 [报告]
发表于 2010-05-19 16:20 |只看该作者
本帖最后由 where27 于 2010-05-19 17:14 编辑
  1. awk '{a[$1]=$0;b[$1]=$2}END{for(i in a)if(b[i]!=0||!c[i]++)print a[i]}' file
复制代码
俺也献丑了


。。。这个有问题啊,无视了吧

论坛徽章:
0
28 [报告]
发表于 2010-05-19 16:23 |只看该作者
print 里的fmt怎么用呢?? |sort|uniq 可以对print里使用fmt后的输出结果做消重排序么?

论坛徽章:
16
IT运维版块每日发帖之星
日期:2015-08-24 06:20:00综合交流区版块每日发帖之星
日期:2015-10-14 06:20:00IT运维版块每日发帖之星
日期:2015-10-25 06:20:00IT运维版块每日发帖之星
日期:2015-11-06 06:20:00IT运维版块每日发帖之星
日期:2015-12-10 06:20:00平安夜徽章
日期:2015-12-26 00:06:302016猴年福章徽章
日期:2016-02-18 15:30:34IT运维版块每日发帖之星
日期:2016-04-15 06:20:00IT运维版块每日发帖之星
日期:2016-05-21 06:20:00综合交流区版块每日发帖之星
日期:2016-08-16 06:20:002015七夕节徽章
日期:2015-08-21 11:06:17IT运维版块每日发帖之星
日期:2015-08-14 06:20:00
29 [报告]
发表于 2010-05-19 16:43 |只看该作者
回复 27# where27


    什么意思呢?我没太看明白啊?解释下哈

论坛徽章:
0
30 [报告]
发表于 2010-05-19 17:14 |只看该作者
回复 29# expert1


    我这个有点问题好像。。别用这个了
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP