免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 8593 | 回复: 21
打印 上一主题 下一主题

怎么把相同行数合并到一行,然后原行数后面的数字相加 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-01-08 08:55 |只看该作者 |倒序浏览
遇到一问题:
aaa@domain.com  2
aaa@domain.com 111
bbb@home.com   2222
bbb@home.com   1


类似这种输出,我想把他们变换成下面形式:

aaa@domain.com 113
bbb@home.com 2223
就是将相同邮箱名称后面的数字相加。各位大侠能否给些思路如何用perl来实现。

论坛徽章:
78
双子座
日期:2013-10-15 08:50:09天秤座
日期:2013-10-16 18:02:08白羊座
日期:2013-10-18 13:35:33天蝎座
日期:2013-10-18 13:37:06狮子座
日期:2013-10-18 13:40:31双子座
日期:2013-10-22 13:58:42戌狗
日期:2013-10-22 18:50:04CU十二周年纪念徽章
日期:2013-10-24 15:41:34巨蟹座
日期:2013-10-24 17:14:56处女座
日期:2013-10-24 17:15:30双子座
日期:2013-10-25 13:49:39午马
日期:2013-10-28 15:02:15
2 [报告]
发表于 2010-01-08 09:06 |只看该作者

回复 #1 yj11 的帖子

用hash可以吧

论坛徽章:
0
3 [报告]
发表于 2010-01-08 09:10 |只看该作者

回复 #1 yj11 的帖子

perl -nle'@x=split;$y{$x[0]}+=$x[1];}{ print "$_ $y{$_}" for keys %y'   filename

论坛徽章:
0
4 [报告]
发表于 2010-01-08 09:16 |只看该作者

回复 #1 yj11 的帖子

perl -anle '$cnt{$F[0]}+=$F[1];END{print "$_\t$cnt{$_}" for keys %cnt}' urfile

论坛徽章:
0
5 [报告]
发表于 2010-01-08 09:24 |只看该作者

回复 #3 linuxty 的帖子

学习~~

论坛徽章:
0
6 [报告]
发表于 2010-01-08 09:35 |只看该作者
原帖由 linuxty 于 2010-1-8 09:10 发表
perl -nle'@x=split;$y{$x[0]}+=$x[1];}{ print "$_ $y{$_}" for keys %y'   filename


强人,感谢,感谢。

论坛徽章:
0
7 [报告]
发表于 2010-01-08 09:44 |只看该作者

回复 #6 yj11 的帖子

4楼更好 我忘了用 -a   这个方便多了

论坛徽章:
0
8 [报告]
发表于 2010-01-08 09:47 |只看该作者
都是高手,能否解释一下这语命令的含义吗?

论坛徽章:
0
9 [报告]
发表于 2010-01-08 10:01 |只看该作者

回复 #8 yj11 的帖子

perl -anle '$cnt{$F[0]}+=$F[1];END{print "$_\t$cnt{$_}" for keys %cnt}' urfile

以第一行为例吧
$F[0] 就是 aaa@domain.com , $F[1] 就是2
$cnt{$F[0]} +=$F[1] 就是一个哈希数组, 以$F[0]为key,$F[1]为value,把相同key的数值都叠加起来.然后把文件的每一行都这样处理一次.
END{} 就是在循环完之后再处理.里面的意思就是打印这个%cnt 哈希数组.这个哈希数组的key就是 邮箱名称,value就是叠加后的数字.

[ 本帖最后由 linuxty 于 2010-1-8 10:04 编辑 ]

论坛徽章:
0
10 [报告]
发表于 2010-01-08 10:06 |只看该作者

  1. my %hash
  2. foreach (<>) {
  3.     my array = split;
  4.     $hash{$array[0]} += $array[1];
  5. }

  6. foreach (keys %hash) {
  7.     print "$_\thash{$_}";
  8. }
复制代码

类似这个的简化版
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP