免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 2166 | 回复: 10
打印 上一主题 下一主题

请教一个数据合并计算的问题(又有新的麻烦了) [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2006-10-23 15:41 |只看该作者 |倒序浏览
有大量(超过10万)的这样的数据
结构是一个ip和一个整数。这些ip有重复,现在想把属于同一个ip的后面的整数加起来,然后生成一份没有重复ip的数据。请问怎么实现比较效率高呢?用awk方便吗?或者有更简单的方法吗?

127.0.0.1  12
127.0.0.2  3
127.0.0.3  3
127.0.0.1 31
127.0.0.1 13
127.0.0.1 23

搭车再问一个和上面的例子有关问题:
现在的数据格式同上,但是每个ip只有1个或者2个记录。其实就是2个不同时间段的一个统计。现在想计算差值。我本想用mysql来实现。但是感觉杀鸡焉用牛刀。所以我想问问用awk怎么实现呢?我搞了版本没弄出来。
比如记录如下
127.0.0.1 12
127.0.0.1 18
我想得到的结果是6或者-6都行。

[ 本帖最后由 archangle 于 2006-10-23 18:10 编辑 ]

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
2 [报告]
发表于 2006-10-23 15:53 |只看该作者
awk '{sum[$1]+=$2}END{for(i in sum)print i,sum[i]}'

论坛徽章:
0
3 [报告]
发表于 2006-10-23 16:19 |只看该作者
perfect,多谢烈火兄了。

论坛徽章:
0
4 [报告]
发表于 2006-10-23 18:11 |只看该作者
搭车再问一个和上面的例子有关问题:
现在的数据格式同上,但是每个ip只有1个或者2个记录。其实就是2个不同时间段的一个统计。现在想计算差值。我本想用mysql来实现。但是感觉杀鸡焉用牛刀。所以我想问问用awk怎么实现呢?我搞了版本没弄出来。
比如记录如下
127.0.0.1 12
127.0.0.1 18
我想得到的结果是6或者-6都行。

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
5 [报告]
发表于 2006-10-23 18:20 |只看该作者
还是用牛刀吧~ ^_^

论坛徽章:
0
6 [报告]
发表于 2006-10-23 18:29 |只看该作者
原帖由 寂寞烈火 于 2006-10-23 18:20 发表
还是用牛刀吧~ ^_^

我占位,等着看lovesaka兄来perl滴!

论坛徽章:
0
7 [报告]
发表于 2006-10-23 22:32 |只看该作者
既然看到了那不来一个也不行

  1. perl -e 'while(<>){@arry=split(/\s+/);$iphash{"$arry[0]"}=$arry[1]-$iphash{"$arry[0]"}};print $_,"\t",$iphash{"$_"},"\n" foreach(keys %iphash)' <1.txt
复制代码

论坛徽章:
0
8 [报告]
发表于 2006-10-24 00:23 |只看该作者
[quote]
既然看到了那不来一个也不行
[/code]
多谢了!数据里如果某个ip只有一行,他会和0做比较吗?
我运行了一下,感觉是会。不知道是否真的会做比较呢?我正需用这个效果。

论坛徽章:
0
9 [报告]
发表于 2006-10-24 02:01 |只看该作者
原帖由 archangle 于 2006-10-24 00:23 发表
[quote]
既然看到了那不来一个也不行
[/code]
多谢了!数据里如果某个ip只有一行,他会和0做比较吗?
我运行了一下,感觉是会。不知道是否真的会做比较呢?我正需用这个效果。

具体的说不会和0比较但每当出现一个没有记录过的IP后就减0一次也就是就每个不相同的IP第一次冒出来的时候会减零一次

论坛徽章:
0
10 [报告]
发表于 2006-10-24 13:13 |只看该作者
awk -F',' 'BEGIN{i=0}{a[i]=$1;b[i]=$2;for(m=0;m<i;m++)if(a[i]==a[m]){b[m]=b[i]-b[m];i--};i++}END{for(k=0;k<i;k++)print a[k],b[k]}'
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP