免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 4201 | 回复: 11
打印 上一主题 下一主题

[文本处理] 求一个grep语句的写法 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-04-17 14:35 |只看该作者 |倒序浏览
有文件batt.data,文件内容如下:

程序中断24
程序中断87
程序中断235
程序完成679
-------------

程序中断14
程序中断870
程序中断1054
程序完成57920
----------------

程序中断24
程序中断90
程序中断235
程序中断331
程序完成10563
-----------------

程序中断91
程序中断102
程序中断235
程序完成2138
----------------

程序中断11
程序中断102
程序中断297
程序完成213802
----------------


两行"------"之间为一段,其中数字代表时间,想从文件中使用grep语句将所有 “程序完成” 这一步时间超过29000的整段内容获取,语句怎么写能实现?
即,期望获得的结果是

程序中断14
程序中断870
程序中断1054
程序完成57920
----------------
程序中断11
程序中断102
程序中断297
程序完成213802
----------------

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
2 [报告]
发表于 2014-04-17 14:40 |只看该作者
回复 1# sharp_3791


try:
  1. awk -vRS='-+' -F'[^0-9]+' '$(NF-1)>29000{print $0 RT}' file
复制代码

论坛徽章:
33
荣誉会员
日期:2011-11-23 16:44:17天秤座
日期:2014-08-26 16:18:20天秤座
日期:2014-08-29 10:12:18丑牛
日期:2014-08-29 16:06:45丑牛
日期:2014-09-03 10:28:58射手座
日期:2014-09-03 16:01:17寅虎
日期:2014-09-11 14:24:21天蝎座
日期:2014-09-17 08:33:55IT运维版块每日发帖之星
日期:2016-04-17 06:23:27操作系统版块每日发帖之星
日期:2016-04-18 06:20:00IT运维版块每日发帖之星
日期:2016-04-24 06:20:0015-16赛季CBA联赛之天津
日期:2016-05-06 12:46:59
3 [报告]
发表于 2014-04-17 14:57 |只看该作者
回复 1# sharp_3791

很有难度.
   

论坛徽章:
0
4 [报告]
发表于 2014-04-17 14:59 |只看该作者
本帖最后由 sharp_3791 于 2014-04-17 15:01 编辑

回复 2# ly5066113

谢谢回复,依照您的语句,执行报错了
awk: The field -1 cannot be less than 0.

The input line number is 2. The file is batt.data.
The source line number is 1.


   

论坛徽章:
0
5 [报告]
发表于 2014-04-17 15:00 |只看该作者
回复 3# q1208c

谢谢回复,不强求,用awk能实现也可以的


   

论坛徽章:
36
摩羯座
日期:2013-09-23 16:37:312015年亚洲杯之沙特阿拉伯
日期:2015-04-14 09:10:172015亚冠之柏太阳神
日期:2015-06-25 08:48:212015亚冠之武里南联
日期:2015-07-28 09:01:082015亚冠之莱赫维亚
日期:2015-07-28 15:44:172015亚冠之柏斯波利斯
日期:2015-09-06 14:08:52白银圣斗士
日期:2015-11-25 17:06:2815-16赛季CBA联赛之吉林
日期:2015-12-09 16:59:072016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之辽宁
日期:2016-04-14 09:29:04luobin
日期:2016-06-17 17:46:3615-16赛季CBA联赛之天津
日期:2016-08-16 14:11:01
6 [报告]
发表于 2014-04-17 15:15 |只看该作者
  1. awk -vRS='--*' '{if(gensub(/[^0-9]*/,"\\1",1,$NF)-gensub(/[^0-9]*/,"\\1",1,$1)>29000) print $0}'
复制代码
这个行不?

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
7 [报告]
发表于 2014-04-17 15:33 |只看该作者
回复 4# sharp_3791


    应该是 awk 版本问题。

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
8 [报告]
发表于 2014-04-17 15:57 |只看该作者
回复 4# sharp_3791


如果文本如你一楼所示,段落间有空行,可以这样:
  1. awk -vRS= -F'[^0-9]+' '$(NF-1)>29000' file
复制代码

论坛徽章:
6
处女座
日期:2014-04-02 16:07:17酉鸡
日期:2014-04-14 10:09:22子鼠
日期:2014-04-17 11:57:30辰龙
日期:2014-09-01 17:14:08戌狗
日期:2014-10-28 12:25:54未羊
日期:2014-11-14 11:31:58
9 [报告]
发表于 2014-04-18 10:20 |只看该作者
回复 8# ly5066113


    求指导,为何最后一段数字是$(NF-1),如果以-+为记录分隔符,[^0-9]+为域分隔符的话,那看这内容 $NF应该是最后一段数字才对呀,可为何$NF是" "呢?

论坛徽章:
2
天蝎座
日期:2014-04-22 17:48:21戌狗
日期:2014-04-29 11:24:49
10 [报告]
发表于 2014-04-18 16:10 |只看该作者
回复 9# rulebook
我有个猜测但没找到文档作为依据,看例子
  1. [root@localhost test]# echo "|111||222|333"|awk -F'[|]+' '{print $1}'

复制代码
例子中FS字段分隔符重新定义为|,例子中分隔符出现在行首,但分隔符左边没有东西,所以输出为空.
  1. [root@localhost test]# echo "|111||222|333"|awk -F'[|]+' '{print $2}'
  2. 111
复制代码
@两位大神@blackold@ly5066113   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP