免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12345
最近访问板块 发新帖
楼主: rm-rf
打印 上一主题 下一主题

[文本处理] 求助: sed取匹配行前面的第3行,然后结束匹配 [复制链接]

论坛徽章:
2
技术图书徽章
日期:2013-12-17 13:52:152015亚冠之萨济拖拉机
日期:2015-07-19 11:07:52
41 [报告]
发表于 2015-07-15 11:42 |只看该作者
ly5066113 发表于 2015-07-15 11:20
回复 39# rm-rf


结果没有多大区别:
  1. $ export LANG=C
  2. $ echo $LANG
  3. C

  4. $ time grep -m1 -B3 '^mbegin' file | awk '{print $2;exit}'
  5. 56

  6. real    0m4.904s
  7. user    0m4.243s
  8. sys     0m0.653s

  9. $ time sed -r '1{N;N};N;/\nmbegin/{s/^[^ ]* ([^ \n]+).*/\1/;q};$d;D' file
  10. 56

  11. real    0m48.769s
  12. user    0m47.642s
  13. sys     0m0.873s

  14. $ time awk '/^mbegin/{print a[NR%3];exit}{a[NR%3]=$2}' file
  15. 56

  16. real    0m29.684s
  17. user    0m28.298s
  18. sys     0m1.029s
复制代码

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
42 [报告]
发表于 2015-07-15 16:11 |只看该作者
回复 41# rm-rf


我这边测试了下,还是 sed 快一点,暂时没找到原因。
  1. $ time awk '/^mbegin/{print a[NR%3];exit}{a[NR%3]=$2}' file
  2. 56

  3. real    1m54.629s
  4. user    1m53.842s
  5. sys     0m0.802s
  6. $ time awk '/^mbegin/{print a[NR%3];exit}{a[NR%3]=$2}' file
  7. 56

  8. real    1m53.477s
  9. user    1m52.826s
  10. sys     0m0.718s
  11. $ time sed -r '1{N;N};N;/\nmbegin/{s/^[^ ]* ([^ \n]+).*/\1/;q};$d;D' file
  12. 56

  13. real    1m37.946s
  14. user    1m37.047s
  15. sys     0m0.888s
  16. $ time sed -r '1{N;N};N;/\nmbegin/{s/^[^ ]* ([^ \n]+).*/\1/;q};$d;D' file
  17. 56

  18. real    1m36.611s
  19. user    1m35.938s
  20. sys     0m0.716s
  21. $ du -sh file
  22. 2.3G    file
  23. $ sed --version
  24. GNU sed version 4.2.1
  25. Copyright (C) 2009 Free Software Foundation, Inc.
  26. $ awk --version
  27. GNU Awk 3.1.7
  28. Copyright (C) 1989, 1991-2009 Free Software Foundation.
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP