免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1845 | 回复: 6
打印 上一主题 下一主题

[求助]关于BASH中数组的问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-01-03 22:30 |只看该作者 |倒序浏览
大家好,
1. 我想解决一个问题就是,我有一个文本,内容大致如下
aaa 1
bbb 1
aaa 2
ccc 3
ddd 1
aaa 9
ccc 1
.......

我想输出结果为第一列中不同元素的第二列的值之和,即如SQL: select column1, sum(column2) from xxx group by column1;

2. 如果输入不是一个文本,即上面的内容是我从管道中得到,我如何写一个脚本得到上面相同的功能,即我想写一个reduce.sh通过下面命令来得到如上结果
cat test.txt | ./preprocess.sh | ./reduce.sh  #preprocess.sh输出为上面文本的类似输出

我一开始是想用数组来实现,但bash好像不支持多维数组,想尝试用非数字作为index的数组,bash也不支持,有点穷途末路了,希望大侠们看下,谢谢!

论坛徽章:
1
技术图书徽章
日期:2013-09-25 21:06:29
2 [报告]
发表于 2012-01-03 22:54 |只看该作者
awk '{a[$1]=$2+a[$1]}END{for(n in a){print n,a[n]}}'

论坛徽章:
15
2015年辞旧岁徽章
日期:2015-03-03 16:54:15双鱼座
日期:2015-01-15 17:29:44午马
日期:2015-01-06 17:06:51子鼠
日期:2014-11-24 10:11:13寅虎
日期:2014-08-18 07:10:55酉鸡
日期:2014-04-02 12:24:51双子座
日期:2014-04-02 12:19:44天秤座
日期:2014-03-17 11:43:36亥猪
日期:2014-03-13 08:13:51未羊
日期:2014-03-11 12:42:03白羊座
日期:2013-11-20 10:15:18CU大牛徽章
日期:2013-04-17 11:48:45
3 [报告]
发表于 2012-01-04 07:17 |只看该作者
  1. ./preprocess.sh  test.txt |awk '{a[$1]=$2+a[$1]}END{for(n in a){print n,a[n]}}'
复制代码

论坛徽章:
15
2015年辞旧岁徽章
日期:2015-03-03 16:54:15双鱼座
日期:2015-01-15 17:29:44午马
日期:2015-01-06 17:06:51子鼠
日期:2014-11-24 10:11:13寅虎
日期:2014-08-18 07:10:55酉鸡
日期:2014-04-02 12:24:51双子座
日期:2014-04-02 12:19:44天秤座
日期:2014-03-17 11:43:36亥猪
日期:2014-03-13 08:13:51未羊
日期:2014-03-11 12:42:03白羊座
日期:2013-11-20 10:15:18CU大牛徽章
日期:2013-04-17 11:48:45
4 [报告]
发表于 2012-01-04 07:19 |只看该作者
还有,贴些test.txt 的内容, 说不定,一条命令就可以搞定了。 不需要通过 preprocess.sh  。

论坛徽章:
0
5 [报告]
发表于 2012-01-04 09:36 |只看该作者
  1. awk '{a[$1] = a[$1] + $2}END{for (i in a){print i,a[i]}}'
复制代码

论坛徽章:
0
6 [报告]
发表于 2012-01-04 10:49 |只看该作者
我无知了,我想过用awk的array,但想当然的以为是只能number作为index。。。谢谢了!
我主要想试验下hadoop的一些东东,preprocess作为map,然后给reduce做summary,谢!!!

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
7 [报告]
发表于 2012-01-04 20:46 |只看该作者
回复 6# kenshinsee


awk里面是hash array,跟Perl里面类似。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP