免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 6583 | 回复: 25

[文本处理] 提取每行的数字“9”大于15的行 [复制链接]

论坛徽章:
0
发表于 2013-08-14 10:59 |显示全部楼层
  1. --
  2. 2013/08/13 CCTV3196H-1 ttu217 BID 071400409 Z1S02
  3. 2013/08/13 CCTV3196H-1 ttu217      1  2  3  4  5  6  7  8  9 10 11 12 13 14 15
  4. 2013/08/13 CCTV3196H-1 ttu217  12  1  1  1  1  1  1  1  x  1  1  1  1  1  1  1
  5. 2013/08/13 CCTV3196H-1 ttu217  11  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  6. 2013/08/13 CCTV3196H-1 ttu217  10  1  1  1  1  1  1  1  x  1  1  x  1  1  1  1
  7. 2013/08/13 CCTV3196H-1 ttu217   9  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  8. 2013/08/13 CCTV3196H-1 ttu217   8  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  9. 2013/08/13 CCTV3196H-1 ttu217   7  1  1  1  1  1  1  1  1  1  1  1  1  1  1  x
  10. 2013/08/13 CCTV3196H-1 ttu217   6  x  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  11. 2013/08/13 CCTV3196H-1 ttu217   5  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  12. 2013/08/13 CCTV3196H-1 ttu217   4  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  13. 2013/08/13 CCTV3196H-1 ttu217   3  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  14. 2013/08/13 CCTV3196H-1 ttu217   2  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  15. 2013/08/13 CCTV3196H-1 ttu217   1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  16. --
  17. 2013/08/13 CCTV3196H-1 ttu217 BID 071400234 Z1S03
  18. 2013/08/13 CCTV3196H-1 ttu217      1  2  3  4  5  6  7  8  9 10 11 12 13 14 15
  19. 2013/08/13 CCTV3196H-1 ttu217  12  1  1  x  1  1  1  1  1  1  1  1  1  1  1  1
  20. 2013/08/13 CCTV3196H-1 ttu217  11  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  21. 2013/08/13 CCTV3196H-1 ttu217  10  0  1  1  1  1  1  1  1  x  1  1  1  1  1  1
  22. 2013/08/13 CCTV3196H-1 ttu217   9  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  23. 2013/08/13 CCTV3196H-1 ttu217   8  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  24. 2013/08/13 CCTV3196H-1 ttu217   7  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  25. 2013/08/13 CCTV3196H-1 ttu217   6  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  26. 2013/08/13 CCTV3196H-1 ttu217   5  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  27. 2013/08/13 CCTV3196H-1 ttu217   4  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  28. 2013/08/13 CCTV3196H-1 ttu217   3  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  29. 2013/08/13 CCTV3196H-1 ttu217   2  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  30. 2013/08/13 CCTV3196H-1 ttu217   1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  x
  31. --
  32. 2013/08/13 CCTV3196H-1 ttu217 BID 071400238 Z1S04
  33. 2013/08/13 CCTV3196H-1 ttu217      1  2  3  4  5  6  7  8  9 10 11 12 13 14 15
  34. 2013/08/13 CCTV3196H-1 ttu217  12  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  35. 2013/08/13 CCTV3196H-1 ttu217  11  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  36. 2013/08/13 CCTV3196H-1 ttu217  10  1  1  x  1  1  1  1  1  1  1  1  1  1  1  1
  37. 2013/08/13 CCTV3196H-1 ttu217   9  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  38. 2013/08/13 CCTV3196H-1 ttu217   8  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  39. 2013/08/13 CCTV3196H-1 ttu217   7  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  40. 2013/08/13 CCTV3196H-1 ttu217   6  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  41. 2013/08/13 CCTV3196H-1 ttu217   5  1  1  1  1  1  1  x  1  1  1  1  1  1  1  1
  42. 2013/08/13 CCTV3196H-1 ttu217   4  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  43. 2013/08/13 CCTV3196H-1 ttu217   3  1  7  1  1  1  1  1  1  1  1  1  1  1  1  1
  44. 2013/08/13 CCTV3196H-1 ttu217   2  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  45. 2013/08/13 CCTV3196H-1 ttu217   1  x  1  1  1  1  x  1  1  1  1  1  1  1  1  1
  46. --
复制代码
对于我来说一个难度稍微大点的问题:

提取每行的数字“9”大于15的行,但需要输出从上一个“--”到下一个“--”的所有行。



谢谢!

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
发表于 2013-08-14 11:03 |显示全部楼层
本帖最后由 关阴月飞 于 2013-08-14 11:04 编辑

“提取每行的数字“9”大于15的行,但需要输出从上一个“--”到下一个“--”的所有行”   这个看不明白,LZ举个栗子吧

论坛徽章:
0
发表于 2013-08-14 11:09 |显示全部楼层
本帖最后由 秋天的絮儿 于 2013-08-14 11:11 编辑

原文件:
  1. --
  2. 2013/08/13 CCTV3196H-1 ttu217 BID 071400409 Z1S02
  3. 2013/08/13 CCTV3196H-1 ttu217      1  2  3  4  5  6  7  8  9 10 11 12 13 14 15
  4. 2013/08/13 CCTV3196H-1 ttu217  12  1  1  1  1  1  1  1  x  1  1  1  1  1  1  1
  5. 2013/08/13 CCTV3196H-1 ttu217  11  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  6. 2013/08/13 CCTV3196H-1 ttu217  10  1  1  1  1  1  1  1  x  1  1  x  1  1  1  1
  7. 2013/08/13 CCTV3196H-1 ttu217   9  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  8. 2013/08/13 CCTV3196H-1 ttu217   8  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  9. 2013/08/13 CCTV3196H-1 ttu217   7  9  9  9  9  9  9  9  9  9  9  9  9  9  9  9
  10. 2013/08/13 CCTV3196H-1 ttu217   6  x  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  11. 2013/08/13 CCTV3196H-1 ttu217   5  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  12. 2013/08/13 CCTV3196H-1 ttu217   4  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  13. 2013/08/13 CCTV3196H-1 ttu217   3  9  9  9  9  9  9  9  9  9  9  9  9  9  9  9
  14. 2013/08/13 CCTV3196H-1 ttu217   2  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  15. 2013/08/13 CCTV3196H-1 ttu217   1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  16. --
  17. 2013/08/13 CCTV3196H-1 ttu217 BID 071400234 Z1S03
  18. 2013/08/13 CCTV3196H-1 ttu217      1  2  3  4  5  6  7  8  9 10 11 12 13 14 15
  19. 2013/08/13 CCTV3196H-1 ttu217  12  1  1  x  1  1  1  1  1  1  1  1  1  1  1  1
  20. 2013/08/13 CCTV3196H-1 ttu217  11  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  21. 2013/08/13 CCTV3196H-1 ttu217  10  0  1  1  1  1  1  1  1  x  1  1  1  1  1  1
  22. 2013/08/13 CCTV3196H-1 ttu217   9  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  23. 2013/08/13 CCTV3196H-1 ttu217   8  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  24. 2013/08/13 CCTV3196H-1 ttu217   7  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  25. 2013/08/13 CCTV3196H-1 ttu217   6  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  26. 2013/08/13 CCTV3196H-1 ttu217   5  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  27. 2013/08/13 CCTV3196H-1 ttu217   4  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  28. 2013/08/13 CCTV3196H-1 ttu217   3  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  29. 2013/08/13 CCTV3196H-1 ttu217   2  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  30. 2013/08/13 CCTV3196H-1 ttu217   1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  x
  31. --
  32. 2013/08/13 CCTV3196H-1 ttu217 BID 071400238 Z1S04
  33. 2013/08/13 CCTV3196H-1 ttu217      1  2  3  4  5  6  7  8  9 10 11 12 13 14 15
  34. 2013/08/13 CCTV3196H-1 ttu217  12  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  35. 2013/08/13 CCTV3196H-1 ttu217  11  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  36. 2013/08/13 CCTV3196H-1 ttu217  10  1  1  x  1  1  1  1  1  1  1  1  1  1  1  1
  37. 2013/08/13 CCTV3196H-1 ttu217   9  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  38. 2013/08/13 CCTV3196H-1 ttu217   8  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  39. 2013/08/13 CCTV3196H-1 ttu217   7  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  40. 2013/08/13 CCTV3196H-1 ttu217   6  9  9  9  9  9  9  9  9  9  9  9  9  9  9  9
  41. 2013/08/13 CCTV3196H-1 ttu217   5  1  1  1  1  1  1  x  1  1  1  1  1  1  1  1
  42. 2013/08/13 CCTV3196H-1 ttu217   4  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  43. 2013/08/13 CCTV3196H-1 ttu217   3  1  7  1  1  1  1  1  1  1  1  1  1  1  1  1
  44. 2013/08/13 CCTV3196H-1 ttu217   2  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  45. 2013/08/13 CCTV3196H-1 ttu217   1  x  1  1  1  1  x  1  1  1  1  1  1  1  1  1
  46. --
复制代码
需要结果:
  1. --
  2. 2013/08/13 CCTV3196H-1 ttu217 BID 071400409 Z1S02
  3. 2013/08/13 CCTV3196H-1 ttu217      1  2  3  4  5  6  7  8  9 10 11 12 13 14 15
  4. 2013/08/13 CCTV3196H-1 ttu217  12  1  1  1  1  1  1  1  x  1  1  1  1  1  1  1
  5. 2013/08/13 CCTV3196H-1 ttu217  11  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  6. 2013/08/13 CCTV3196H-1 ttu217  10  1  1  1  1  1  1  1  x  1  1  x  1  1  1  1
  7. 2013/08/13 CCTV3196H-1 ttu217   9  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  8. 2013/08/13 CCTV3196H-1 ttu217   8  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  9. 2013/08/13 CCTV3196H-1 ttu217   7  9  9  9  9  9  9  9  9  9  9  9  9  9  9  9
  10. 2013/08/13 CCTV3196H-1 ttu217   6  x  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  11. 2013/08/13 CCTV3196H-1 ttu217   5  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  12. 2013/08/13 CCTV3196H-1 ttu217   4  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  13. 2013/08/13 CCTV3196H-1 ttu217   3  9  9  9  9  9  9  9  9  9  9  9  9  9  9  9
  14. 2013/08/13 CCTV3196H-1 ttu217   2  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  15. 2013/08/13 CCTV3196H-1 ttu217   1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  16. --
  17. --
  18. 2013/08/13 CCTV3196H-1 ttu217 BID 071400238 Z1S04
  19. 2013/08/13 CCTV3196H-1 ttu217      1  2  3  4  5  6  7  8  9 10 11 12 13 14 15
  20. 2013/08/13 CCTV3196H-1 ttu217  12  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  21. 2013/08/13 CCTV3196H-1 ttu217  11  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  22. 2013/08/13 CCTV3196H-1 ttu217  10  1  1  x  1  1  1  1  1  1  1  1  1  1  1  1
  23. 2013/08/13 CCTV3196H-1 ttu217   9  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  24. 2013/08/13 CCTV3196H-1 ttu217   8  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  25. 2013/08/13 CCTV3196H-1 ttu217   7  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  26. 2013/08/13 CCTV3196H-1 ttu217   6  9  9  9  9  9  9  9  9  9  9  9  9  9  9  9
  27. 2013/08/13 CCTV3196H-1 ttu217   5  1  1  1  1  1  1  x  1  1  1  1  1  1  1  1
  28. 2013/08/13 CCTV3196H-1 ttu217   4  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  29. 2013/08/13 CCTV3196H-1 ttu217   3  1  7  1  1  1  1  1  1  1  1  1  1  1  1  1
  30. 2013/08/13 CCTV3196H-1 ttu217   2  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1
  31. 2013/08/13 CCTV3196H-1 ttu217   1  x  1  1  1  1  x  1  1  1  1  1  1  1  1  1
  32. --
复制代码

论坛徽章:
15
2015年辞旧岁徽章
日期:2015-03-03 16:54:15双鱼座
日期:2015-01-15 17:29:44午马
日期:2015-01-06 17:06:51子鼠
日期:2014-11-24 10:11:13寅虎
日期:2014-08-18 07:10:55酉鸡
日期:2014-04-02 12:24:51双子座
日期:2014-04-02 12:19:44天秤座
日期:2014-03-17 11:43:36亥猪
日期:2014-03-13 08:13:51未羊
日期:2014-03-11 12:42:03白羊座
日期:2013-11-20 10:15:18CU大牛徽章
日期:2013-04-17 11:48:45
发表于 2013-08-14 11:10 |显示全部楼层
本帖最后由 rdcwayx 于 2013-08-14 13:50 编辑
  1. awk '{for (i=1;i<=NF;i++) {if (split($i,a," 9")>=16) {print $0;next}}}' RS="--" FS="\n" ORS="--" OFS="\n" infile
复制代码

论坛徽章:
0
发表于 2013-08-14 11:14 |显示全部楼层
回复 4# rdcwayx


    谢谢斑竹关心,我刚开始开始给的原文件有问题,3楼的数据是对的。

论坛徽章:
13
丑牛
日期:2013-08-16 15:08:22技术图书徽章
日期:2013-11-26 10:13:40双鱼座
日期:2013-11-08 15:03:26戌狗
日期:2013-11-08 13:52:30技术图书徽章
日期:2013-11-05 14:06:30戌狗
日期:2013-10-31 11:45:42CU十二周年纪念徽章
日期:2013-10-24 15:41:34天秤座
日期:2013-10-11 14:55:08子鼠
日期:2013-09-26 19:36:35水瓶座
日期:2013-09-26 17:44:56午马
日期:2013-08-26 10:24:23丑牛
日期:2013-08-19 14:43:22
发表于 2013-08-14 11:16 |显示全部楼层
看不懂,不知结果怎么来的

论坛徽章:
0
发表于 2013-08-14 11:20 |显示全部楼层
回复 6# 代号:军刀


    简单点说就是:提取每行数字9的个数大于15的行;但是输出的时候不只是输出该行,需要输出该行的上“--”到下“--”的区域。

论坛徽章:
0
发表于 2013-08-14 11:23 |显示全部楼层
捕获.PNG

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
发表于 2013-08-14 11:26 |显示全部楼层
回复 8# 秋天的絮儿


    好像明白了,但你这里的9也只有15个,不符合大于15的要求吧

论坛徽章:
0
发表于 2013-08-14 11:28 |显示全部楼层
回复 9# 关阴月飞


大于等于,


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

DTCC2020中国数据库技术大会

【架构革新 高效可控】2020年12月21日-23日第十一届中国数据库技术大会将在北京隆重召开。

大会设置2大主会场,20+技术专场,将邀请超百位行业专家,重点围绕数据架构、AI与大数据、传统企业数据库实践和国产开源数据库等内容展开分享和探讨,为广大数据领域从业人士提供一场年度盛会和交流平台。

http://dtcc.it168.com


大会官网>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP