免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: chaogle
打印 上一主题 下一主题

三个awk问题的讨论 [复制链接]

论坛徽章:
0
11 [报告]
发表于 2012-05-02 20:57 |只看该作者
回复 10# jason680 \


太秒了,兄弟!
你的awk都用到极致了: 数组下标都拿命令来实现!

只有想不到的,没有做不到的!
自由是一种思想,将简单发挥到极致就成了艺术!


   

论坛徽章:
0
12 [报告]
发表于 2012-05-02 23:33 |只看该作者
本帖最后由 MeaCulpa 于 2012-05-02 23:35 编辑

其实真的实际运用的时候你会发现,管道结合 unix sort够用了。这也就是为什么那么多awk实现只有gawk有内建的排序。

AWK最初的作者认为,所谓顺序,只是人类对于数据的view, 而不是数据的本质(多先进的思想!),不必劳烦排序,关联数组大部分时候排序也没有意义.

当数据量非常大的时候,进程fork反而比awk解释器内部阻塞的排序更有效,更容易控制。这也是UNIX的哲学。

AWK处理的数据真的需要排序的时候,很多时候需要复杂的排序逻辑和Human sort, 自己实现更本就是白伤脑筋。

所以还是依赖unix sort吧.

论坛徽章:
3
水瓶座
日期:2014-03-25 17:08:042015亚冠之塔什干棉农
日期:2015-08-10 10:45:122015亚冠之萨济拖拉机
日期:2015-08-13 16:05:24
13 [报告]
发表于 2012-05-02 23:59 |只看该作者
这位,如果你愿意解答的话,我是非常感谢,如果不愿意就请安静点,谢谢合作回复 9# waker


   

论坛徽章:
8
摩羯座
日期:2014-11-26 18:59:452015亚冠之浦和红钻
日期:2015-06-23 19:10:532015亚冠之西悉尼流浪者
日期:2015-08-21 08:40:5815-16赛季CBA联赛之山东
日期:2016-01-31 18:25:0515-16赛季CBA联赛之四川
日期:2016-02-16 16:08:30程序设计版块每日发帖之星
日期:2016-06-29 06:20:002017金鸡报晓
日期:2017-01-10 15:19:5615-16赛季CBA联赛之佛山
日期:2017-02-27 20:41:19
14 [报告]
发表于 2012-05-03 06:32 |只看该作者
本帖最后由 waker 于 2012-05-03 06:33 编辑

回复 13# su8610


    说你还不爱听,大家的\n都定义为换行,只有你家的不是?你定义的FS与RS都和\n一点关系没有,换行和域和记录有毛关系啊,自己还钻在牛角尖里面数123

论坛徽章:
3
水瓶座
日期:2014-03-25 17:08:042015亚冠之塔什干棉农
日期:2015-08-10 10:45:122015亚冠之萨济拖拉机
日期:2015-08-13 16:05:24
15 [报告]
发表于 2012-05-03 09:37 |只看该作者
谢谢啊,不是说我不爱听,而是我刚学,不明白是为什么,你又不解释,不过还是谢谢你回复 14# waker


   

论坛徽章:
8
摩羯座
日期:2014-11-26 18:59:452015亚冠之浦和红钻
日期:2015-06-23 19:10:532015亚冠之西悉尼流浪者
日期:2015-08-21 08:40:5815-16赛季CBA联赛之山东
日期:2016-01-31 18:25:0515-16赛季CBA联赛之四川
日期:2016-02-16 16:08:30程序设计版块每日发帖之星
日期:2016-06-29 06:20:002017金鸡报晓
日期:2017-01-10 15:19:5615-16赛季CBA联赛之佛山
日期:2017-02-27 20:41:19
16 [报告]
发表于 2012-05-03 09:52 |只看该作者
回复 15# su8610


    你只要print NR print NF就明白了

论坛徽章:
0
17 [报告]
发表于 2012-05-03 17:27 |只看该作者
回复 1# chaogle


http://bbs.chinaunix.net/forum.p ... st%3D1%26digest%3D1

看一下这个链接 里面有对RS="",FS为单个字符的解释

论坛徽章:
0
18 [报告]
发表于 2012-05-03 17:32 |只看该作者
for(xx  in  xxx) 这个想要排序输出 可以尝试 使用mawk 去做 而不是使用GNU AWK
  1. [root@localhost ~]# echo "0 b 9 7 8 a 2 3 1 d"|mawk '{for(i=1;i<=NF;i++)arry[$i]=$i}END{for(item in arry)print item,arry[item]}'
  2. a a
  3. b b
  4. d d
  5. 0 0
  6. 1 1
  7. 2 2
  8. 3 3
  9. 7 7
  10. 8 8
  11. 9 9
  12. [root@localhost ~]# echo "0 b 9 7 8 a 2 3 1 d"|awk '{for(i=1;i<=NF;i++)arry[$i]=$i}END{for(item in arry)print item,arry[item]}'
  13. 7 7
  14. 8 8
  15. 9 9
  16. a a
  17. b b
  18. d d
  19. 0 0
  20. 1 1
  21. 2 2
  22. 3 3
复制代码

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
19 [报告]
发表于 2012-05-04 11:40 |只看该作者
for/in这种格式是用来iterate每个元素用的。awk当中的是associated array,1,2,3之类的数组index,其实gawk还是当作string来看的。

论坛徽章:
0
20 [报告]
发表于 2012-05-04 12:15 |只看该作者
RH系的默认awk是gawk
Debian系的默认awk是mawk
Gentoo是gawk

不管默认的输出排序是什么,如果真的在意顺序,都应该人为的sort一下
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP