免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3511 | 回复: 10
打印 上一主题 下一主题

一个关于SHELL统计的问题,望高手解答 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-10-15 23:30 |只看该作者 |倒序浏览
5可用积分
有如下文档,a.txt:
文件路径            IP               持续时间
/abc/data/aaa.idr,10.101.3.10,120
/abc/data/aaa.idr,10.101.3.10,500
/abc/data/aaa.idr,10.101.3.8,110
/abc/data/abc.dir,10.101.5.7,210
/abc/data/abc.dir,10.101.5.7,1000
/abc/data/aaa.idr,10.101.3.10,110

要求使用shell脚本处理后,得到
文件路径和IP相同的计数+1,但保留文件路径和IP相同的数据中任意一个持续时间
输出结果例如:
/abc/data/aaa.idr,10.101.3.10 共出现3次,持续时间120
/abc/data/aaa.idr,10.101.3.8共出现1次,持续时间110
/abc/data/abc.dir,10.101.5.7共出现2次,持续时间210

有哪位高手解答下~~执行效率高点最好~

[ 本帖最后由 ahqkxfer 于 2008-10-15 23:31 编辑 ]

论坛徽章:
0
2 [报告]
发表于 2008-10-15 23:30 |只看该作者
  1. cat data
  2. /abc/data/aaa.idr,10.101.3.10,120
  3. /abc/data/aaa.idr,10.101.3.10,500
  4. /abc/data/aaa.idr,10.101.3.8,110
  5. /abc/data/abc.dir,10.101.5.7,210
  6. /abc/data/abc.dir,10.101.5.7,1000
  7. /abc/data/aaa.idr,10.101.3.10,110

  8. aries@ubuntu:/tmp$ awk -F',' '{id[$1" "$2]+=1} END{for(i in id) {print i," appear " id[i] " times"}}' data
  9. /abc/data/abc.dir 10.101.5.7  appear 2 times
  10. /abc/data/aaa.idr 10.101.3.8  appear 1 times
  11. /abc/data/aaa.idr 10.101.3.10  appear 3 times
复制代码

论坛徽章:
95
程序设计版块每日发帖之星
日期:2015-09-05 06:20:00程序设计版块每日发帖之星
日期:2015-09-17 06:20:00程序设计版块每日发帖之星
日期:2015-09-18 06:20:002015亚冠之阿尔艾因
日期:2015-09-18 10:35:08月度论坛发贴之星
日期:2015-09-30 22:25:002015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39程序设计版块每日发帖之星
日期:2015-10-05 06:20:00每日论坛发贴之星
日期:2015-10-05 06:20:002015年亚冠纪念徽章
日期:2015-10-06 10:06:482015亚冠之塔什干棉农
日期:2015-10-19 19:43:35程序设计版块每日发帖之星
日期:2015-10-21 06:20:00每日论坛发贴之星
日期:2015-09-14 06:20:00
3 [报告]
发表于 2008-10-15 23:38 |只看该作者
这也不复杂,自己先写吧

btw,这个用 Perl 或其他支持 hash 的语言来做会更简单些

论坛徽章:
0
4 [报告]
发表于 2008-10-15 23:41 |只看该作者
考虑了一天,主要是想用系统函数来解决它,
但是一直没想到好的方法

论坛徽章:
95
程序设计版块每日发帖之星
日期:2015-09-05 06:20:00程序设计版块每日发帖之星
日期:2015-09-17 06:20:00程序设计版块每日发帖之星
日期:2015-09-18 06:20:002015亚冠之阿尔艾因
日期:2015-09-18 10:35:08月度论坛发贴之星
日期:2015-09-30 22:25:002015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39程序设计版块每日发帖之星
日期:2015-10-05 06:20:00每日论坛发贴之星
日期:2015-10-05 06:20:002015年亚冠纪念徽章
日期:2015-10-06 10:06:482015亚冠之塔什干棉农
日期:2015-10-19 19:43:35程序设计版块每日发帖之星
日期:2015-10-21 06:20:00每日论坛发贴之星
日期:2015-09-14 06:20:00
5 [报告]
发表于 2008-10-15 23:43 |只看该作者
原帖由 ahqkxfer 于 2008-10-15 23:41 发表
考虑了一天,主要是想用系统函数来解决它,
但是一直没想到好的方法

先写一个能用的,然后再改进

论坛徽章:
0
6 [报告]
发表于 2008-10-16 07:31 |只看该作者
能否给点提示呢。。。

论坛徽章:
95
程序设计版块每日发帖之星
日期:2015-09-05 06:20:00程序设计版块每日发帖之星
日期:2015-09-17 06:20:00程序设计版块每日发帖之星
日期:2015-09-18 06:20:002015亚冠之阿尔艾因
日期:2015-09-18 10:35:08月度论坛发贴之星
日期:2015-09-30 22:25:002015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39程序设计版块每日发帖之星
日期:2015-10-05 06:20:00每日论坛发贴之星
日期:2015-10-05 06:20:002015年亚冠纪念徽章
日期:2015-10-06 10:06:482015亚冠之塔什干棉农
日期:2015-10-19 19:43:35程序设计版块每日发帖之星
日期:2015-10-21 06:20:00每日论坛发贴之星
日期:2015-09-14 06:20:00
7 [报告]
发表于 2008-10-16 09:20 |只看该作者
原帖由 ahqkxfer 于 2008-10-16 07:31 发表
能否给点提示呢。。。

不是说了么?用 hash 会比较简单点

论坛徽章:
0
8 [报告]
发表于 2008-10-16 09:48 |只看该作者
楼上的,后面还得跟上一个持续时间~
不过还是谢谢了~

论坛徽章:
0
9 [报告]
发表于 2008-10-16 11:15 |只看该作者
没人来说说吗?
帮下忙吧。。。。。

论坛徽章:
0
10 [报告]
发表于 2008-10-16 14:23 |只看该作者
还是我自己解决了,用
awk 'BEGIN{OFS=FS=","} NR==FNR{a[$1]=$2}NR>FNR&&a[b=($1)]{print $0, a}'  2.log 1.log > 3.log
先把列合并了生成2.log
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP