免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 4767 | 回复: 12
打印 上一主题 下一主题

[其他] awk关于数组去重的疑问,请教达人 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-07-19 16:37 |只看该作者 |倒序浏览

administrator@:~$ echo 'aa
bb
aa
bb
cc' |awk '{print $0,a[$0]++}END{for(i in a)print i,a[i]}'


aa 0
bb 0
aa 1
bb 1
cc 0

bb 2
cc 1
aa 2
administrator@:~$

请教达人,aa,bb和cc的结果不是为a[aa]=1,a[bb]=1,a[cc]=0,怎么END后打印出来为a[aa]=2,[bb]=2,a[cc]=1的呢

论坛徽章:
16
IT运维版块每日发帖之星
日期:2015-10-02 06:20:00IT运维版块每月发帖之星
日期:2015-09-11 19:30:52IT运维版块每周发帖之星
日期:2015-09-11 19:20:31IT运维版块每日发帖之星
日期:2015-08-26 06:20:00每日论坛发贴之星
日期:2015-08-20 06:20:00IT运维版块每日发帖之星
日期:2015-08-20 06:20:002015年辞旧岁徽章
日期:2015-03-03 16:54:15金牛座
日期:2014-05-04 16:58:09双子座
日期:2013-12-17 16:44:37辰龙
日期:2013-11-22 15:20:59狮子座
日期:2013-11-18 22:55:08射手座
日期:2013-11-12 10:54:26
2 [报告]
发表于 2013-07-19 16:42 |只看该作者
print "a["i"]="a[i]

论坛徽章:
3
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:51:162015年亚洲杯之阿曼
日期:2015-04-07 20:00:59
3 [报告]
发表于 2013-07-19 16:46 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
4 [报告]
发表于 2013-07-19 16:54 |只看该作者
回复 3# zooyo


汗,不会没表述清楚吧,我哭...................

就是对以下去重统计出现次数
×××××
aa
bb
aa
bb
cc
×××××
这个统计结果是对的aa出现两次,bb出现2次,cc出现一次,结果是对的
awk '{print $0,a[$0]++}END{for(i in a)print i,a}'

aa 0
bb 0
aa 1
bb 1
cc 0

bb 2
cc 1
aa 2
awk '{print $0,a[$0]++}'打印的结果不是a[aa]=1,b[bb]=1,a[cc]=0的吗?
怎么END{for(i in a)print i,a}打印的结果是a[aa]=2,a[bb]=2,a[cc]=1的呢?   

论坛徽章:
6
摩羯座
日期:2013-08-24 10:43:10狮子座
日期:2013-08-25 10:27:06天秤座
日期:2013-09-11 20:28:44午马
日期:2014-09-28 16:06:0015-16赛季CBA联赛之八一
日期:2016-12-19 13:55:0515-16赛季CBA联赛之天津
日期:2016-12-20 14:01:23
5 [报告]
发表于 2013-07-19 16:55 |只看该作者
@fangww_uestcEND之前是过程,END之后才是结果。

论坛徽章:
0
6 [报告]
发表于 2013-07-19 16:58 |只看该作者
回复 4# fangww_uestc


上面有误
应该是这个awk '{print $0,a[$0]++}END{for(i in a)print i,a}'
是a,不是a

   

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
7 [报告]
发表于 2013-07-19 17:07 |只看该作者
回复 1# fangww_uestc


a[$0]++ change to ++a[$0]   

论坛徽章:
0
8 [报告]
发表于 2013-07-19 17:11 |只看该作者
回复 5# cao627

不是很明白
×××××
aa
bb
aa
bb
cc
×××××
这个统计结果是对的aa出现两次,bb出现2次,cc出现一次,结果是对的

awk '{print $0,a[$0]++}
第一行,出现aa,a[aa]为0
第二行,出现bb,a[bb]为0
第三行,出现aa,a[aa]++为1
第四行,出现bb,a[bb]++为1
第五行,出现cc,a[cc]为0
同打印结果是一致的
数组元素有aa,bb,cc其值为a[aa]=1,a[bb]=1,a[cc]=0
关联数组是按键和值来定义的吧?那此时数组就是只有a[aa]=1,a[bb]=1,a[cc]=0三个键和值的吧?
但END后发生了什么呢?
不懂.....................





   

论坛徽章:
0
9 [报告]
发表于 2013-07-19 17:13 |只看该作者
awk '{print a[$0],a[$0]++}END{for(i in a)print i,a}'

论坛徽章:
3
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:51:162015年亚洲杯之阿曼
日期:2015-04-07 20:00:59
10 [报告]
发表于 2013-07-19 17:18 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP