免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 5823 | 回复: 1
打印 上一主题 下一主题

一个例子,另关于awk 的二维数组操作一问。 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-03-14 00:17 |显示全部楼层 |倒序浏览
从别处看到有人问一个问题:

一个1万5000多行的文件,如下
  1. 294;F03;2000;40441
  2. 294;F03;2000;40443
  3. 284;F01;5400;44051
  4. 284;F01;5700;45666
  5. 294;F03;2001;40443
复制代码
要求输出第1,2,4列相同,第3列不同的行。比如上面应该输出1和4行:
  1. 294;F03;2000;40443
  2. 294;F03;2001;40443
复制代码
我是这么做的,觉得比较笨。不知道有没有更好点的办法。
  1. awk -F';' '{a[$1 FS $2 FS $4]=a[$1 FS $2 FS $4]?a[$1 FS $2 FS $4]","$3:$3;} END { for (k in a ){ if( split(a[k],t,",")>1 ){ split(k,h,FS); for (i in t) print h[1] FS h[2] FS t[i] FS h[3] } } }' t.txt
复制代码
我最初想法是,弄一个2维数组,类似 (非AWK code,就说明个意思) a[$1$2$4][$3], 然后遍历第一维是[$1$2$4]第2维个数大于1的所有元素并打印。但是不知道怎么折腾这个二维数组。

比如2维下标都是字符串,怎么 array[a,b], [a,c] ...[a,x], 怎么获得有多少元素第一下标是a的?要是2个下标都是变量构成比如[$1,$2],怎么做如下遍历:
[a,b]
[a,c]
...
[a,x]

[b,b]
[b,c]
...
[b,x]
...

google了也没找到合适的,都是说用split来拼下标

论坛徽章:
0
2 [报告]
发表于 2011-03-14 05:08 |显示全部楼层
谢谢两位的精彩awk。

另外关于数组的那个问题希望也给讲解一下。

另加一问,数组的元素还可以是数组么?如果是,怎么操作? 比如 awk -F 'a[1]='foo'; a[2]='bar'; b[1]=a' ....  这样的。 我自己没试出来。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP