免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 4307 | 回复: 24
打印 上一主题 下一主题

如何用awk实现以下需求? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-05-11 15:15 |只看该作者 |倒序浏览
小弟今天遇到个问题,煞是疑惑,有文本如下:

      192.168.1.2      http://www.baidu.com/xxxx1
      192.168.1.2      http://www.baidu.com/x
      192.168.1.2      http://www.baidu.com/xxx2
      192.168.1.3      http://www.163.com/xxxx1
      192.168.1.3      http://www.baidu.com/oooo1
      192.168.1.7      http://www.baidu.com/xxxx1/yes
      192.168.1.7      http://www.baidu.com/xx/no1
      192.168.1.11    http://www.google.cn/xx/no1asdd
      192.168.1.12    http://www.google.cn/xx/no1asdd
      
这样的内容还有很多,再次就不一一列举了!

这样的一个文本,要求统计出独立的内网IP数量,每个ip都访问了那些网站,并且要统计出独立的内网ip的总数。我想大致效果应该如下:

     3    192.168.1.2      http://www.baidu.com/xxxx1
                                    http://www.baidu.com/x
                                    http://www.baidu.com/xxx2
     2    192.168.1.3      http://www.163.com/xxxx1
                                    http://www.baidu.com/oooo1
     3    192.168.1.7      http://www.baidu.com/xxxx1/yes
                                    http://www.baidu.com/xx/no1
                                    http://www.baidu.com/xx/no1
     1    192.168.1.11    http://www.google.cn/xx/no1asdd
     1    192.168.1.12    http://www.google.cn/xx/no1asdd

    Total ip : 5

请问这个用awk能实现吗?
谢谢各位朋友!

论坛徽章:
0
2 [报告]
发表于 2010-05-11 15:38 |只看该作者
[root@commserver: /tmp]#awk '{array[$1]=$2"\n              "array[$1];array1[$1]++;if(!($1 in array2)){array2[$1];n++}}END{for(i in array){print array1" "i" "array};print "Total IP:"n}' test70.txt  
2 192.168.1.7 http://www.baidu.com/xx/no1
              http://www.baidu.com/xxxx1/yes
              
1 192.168.1.11 http://www.google.cn/xx/no1asdd
              
1 192.168.1.12 http://www.google.cn/xx/no1asdd
              
3 192.168.1.2 http://www.baidu.com/xxx2
              http://www.baidu.com/x
              http://www.baidu.com/xxxx1
              
2 192.168.1.3 http://www.baidu.com/oooo1
              http://www.163.com/xxxx1
              
Total IP:5

顺序不好控制了,因为AWK循环有自己的模式

论坛徽章:
0
3 [报告]
发表于 2010-05-11 15:59 |只看该作者
  1. awk '{if($1 in arr) arr[$1]=$2"\n\t"arr[$1]; else arr[$1]=$2}END{for(cnt in arr){print split(arr[cnt],tmp,"\n\t"),cnt,arr[cnt]};print "Total IP",length(arr)}' file
复制代码
这样格式能好点

论坛徽章:
0
4 [报告]
发表于 2010-05-11 16:06 |只看该作者
感谢楼上 两位高人的指点!  确实 我也感觉这个要控制起来 那是相当费劲!
   所以我还是转投shell 把他给写出来了!

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
5 [报告]
发表于 2010-05-11 16:23 |只看该作者
回复 4# net17sharplau


把你写的贴出来看看?

论坛徽章:
0
6 [报告]
发表于 2010-05-11 16:56 |只看该作者
回复 3# lkk2003rty


    看不懂,能不能简单介绍一下。

求职 : 技术支持/维
论坛徽章:
0
7 [报告]
发表于 2010-05-11 17:37 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
8 [报告]
发表于 2010-05-11 18:38 |只看该作者
楼上这位高人,你这个是怎么输出来的呢?
   我这边尝试的时候  直接提示错误了:
   awk: (FILENAME=./b FNR=9) fatal: attempt to use array `a' in a scalar context

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
9 [报告]
发表于 2010-05-11 18:45 |只看该作者
回复 9# net17sharplau


8楼的代码是这样的:

  1. awk '{a[$1]++;b[$1,a[$1]]=$2} END{for (i in a) {ip++;for (j=1;j<=a[i];j++) if(j==1) {print a[i]"\t"i"\t"b[i,j]}else{print "\t\t\t"b[i,j]}}print "Total IP:"ip}' b
复制代码

论坛徽章:
0
10 [报告]
发表于 2010-05-11 19:00 |只看该作者
谢谢楼上这位仁兄!  我把这个地方看掉了!
  if(j==1) {print a"\t"i"\t"b[i,j]}else{print "\t\t\t"b[i,j]}}print "Total IP:"ip}'

  原来awk可以用二维数组! 学到一个高招啊!

  感谢各位! 谢谢朋友们!

  另:有没有好一点的讲awk进阶技巧的书或教程之类的资料,若有还恳请发给小弟一份。小弟万分感激!

  小弟邮箱:net17sharplau@163.com
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP