免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 5820 | 回复: 6
打印 上一主题 下一主题

一个例子,另关于awk 的二维数组操作一问。 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-03-14 00:17 |只看该作者 |倒序浏览
从别处看到有人问一个问题:

一个1万5000多行的文件,如下
  1. 294;F03;2000;40441
  2. 294;F03;2000;40443
  3. 284;F01;5400;44051
  4. 284;F01;5700;45666
  5. 294;F03;2001;40443
复制代码
要求输出第1,2,4列相同,第3列不同的行。比如上面应该输出1和4行:
  1. 294;F03;2000;40443
  2. 294;F03;2001;40443
复制代码
我是这么做的,觉得比较笨。不知道有没有更好点的办法。
  1. awk -F';' '{a[$1 FS $2 FS $4]=a[$1 FS $2 FS $4]?a[$1 FS $2 FS $4]","$3:$3;} END { for (k in a ){ if( split(a[k],t,",")>1 ){ split(k,h,FS); for (i in t) print h[1] FS h[2] FS t[i] FS h[3] } } }' t.txt
复制代码
我最初想法是,弄一个2维数组,类似 (非AWK code,就说明个意思) a[$1$2$4][$3], 然后遍历第一维是[$1$2$4]第2维个数大于1的所有元素并打印。但是不知道怎么折腾这个二维数组。

比如2维下标都是字符串,怎么 array[a,b], [a,c] ...[a,x], 怎么获得有多少元素第一下标是a的?要是2个下标都是变量构成比如[$1,$2],怎么做如下遍历:
[a,b]
[a,c]
...
[a,x]

[b,b]
[b,c]
...
[b,x]
...

google了也没找到合适的,都是说用split来拼下标

论坛徽章:
0
2 [报告]
发表于 2011-03-14 00:38 |只看该作者
回复 1# sk1418
  1. awk -F ';' '{a[$1","$2","$4]++;b[$1","$2","$4"#"$3]=$0}END{for (i in b) {split(i,m,"#");if (a[m[1]]>1) print b[i]}}' file
复制代码

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
3 [报告]
发表于 2011-03-14 04:13 |只看该作者
  1. awk -v FS=";" '{v=$1 FS $2 FS $4;a[++b[v]"#"v]=$0}b[v]>1{print (b[v]==2)?a["1#"v] RS a[b[v]"#"v]: a[b[v]"#"v]}'file
复制代码

论坛徽章:
0
4 [报告]
发表于 2011-03-14 05:08 |只看该作者
谢谢两位的精彩awk。

另外关于数组的那个问题希望也给讲解一下。

另加一问,数组的元素还可以是数组么?如果是,怎么操作? 比如 awk -F 'a[1]='foo'; a[2]='bar'; b[1]=a' ....  这样的。 我自己没试出来。

论坛徽章:
0
5 [报告]
发表于 2011-03-14 07:55 |只看该作者
awk数组的下标必须是一个确定的值,给数组元素赋的值也必须是一个确定的值
这个确定的值可以是一个变量,可以是字符串

b[1]=a (a为数组名)
这样是非法的

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
6 [报告]
发表于 2011-03-14 09:18 |只看该作者
294;F03;2000;40443
294;F03;2001;40443
294;F03;2000;40443

这样的行如何处理?

论坛徽章:
16
IT运维版块每日发帖之星
日期:2015-08-24 06:20:00综合交流区版块每日发帖之星
日期:2015-10-14 06:20:00IT运维版块每日发帖之星
日期:2015-10-25 06:20:00IT运维版块每日发帖之星
日期:2015-11-06 06:20:00IT运维版块每日发帖之星
日期:2015-12-10 06:20:00平安夜徽章
日期:2015-12-26 00:06:302016猴年福章徽章
日期:2016-02-18 15:30:34IT运维版块每日发帖之星
日期:2016-04-15 06:20:00IT运维版块每日发帖之星
日期:2016-05-21 06:20:00综合交流区版块每日发帖之星
日期:2016-08-16 06:20:002015七夕节徽章
日期:2015-08-21 11:06:17IT运维版块每日发帖之星
日期:2015-08-14 06:20:00
7 [报告]
发表于 2011-03-14 10:33 |只看该作者
回复 6# blackold


    这题我都没看懂什么意思
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP