免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 5373 | 回复: 7
打印 上一主题 下一主题

[文本处理] 从匹配行往上找最近的另一个匹配,然后打印两行之间 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-08-19 08:39 |只看该作者 |倒序浏览
本帖最后由 mystérieux 于 2013-08-19 08:41 编辑

从匹配行往上找最近的另一个匹配,然后打印两行之间。这个我已经做出来了,请各位品鉴,再看下如何润色一下,或者还有什么其它的做法。

文本内容:

1 A B C
2 D E F ONE
3 G H I ONE
4 J K L
5 M N O
6 P Q R
7 S T U ONE
8 V W X
9 Y Z TT
10 AA BB CC ONE
11 DD EE FF
12 lu lu la ONE
13 ca ca ca
14 pu pu pi
15 he ha he
16 pe pi pa
17 fi fa fe
18 Ya Yu Yi
19 Ze Zi Zu     TWO
20 Ti Ta Te TWO
21 wahaha
22 qiqiq ONE TWO
23 smith
24 great TWO
25 autumn
26 object       ONE
27 mean TWO
28 TWY
29 Lucie
30 Ppe ONE

找到第一个含有TWO的行,再住上找最近一个含有ONE的行,只把中间的行打印出来。我是这样做的:
  1. sed -n   ':a;/ONE/n;N;/TWO/!ba;p;q'  file
复制代码
思路是,如果碰到ONE,就把多行模式空间用下一行代替,重新开始多行模式空间,在这个循环中如果遇到一个TWO,就跳出该循环。

论坛徽章:
50
15-16赛季CBA联赛之广夏
日期:2018-11-05 09:42:462015年亚冠纪念徽章
日期:2015-07-23 11:58:122015亚冠之广州富力
日期:2015-07-07 08:26:172015亚冠之塔什干棉农
日期:2015-06-29 09:08:072015年亚洲杯之伊朗
日期:2015-03-08 20:51:012015年迎新春徽章
日期:2015-03-04 09:58:11未羊
日期:2014-10-16 22:41:47处女座
日期:2014-10-16 15:33:33酉鸡
日期:2014-03-13 12:54:10巳蛇
日期:2014-03-10 14:39:052015亚冠之德黑兰石油
日期:2015-07-29 12:46:372015亚冠之德黑兰石油
日期:2015-08-07 12:54:11
2 [报告]
发表于 2013-08-19 09:30 |只看该作者
  1. sed -n 'H;/ONE/{n;h};/TWO/{x;p;q}' file
复制代码

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
3 [报告]
发表于 2013-08-19 09:30 |只看该作者
回复 1# mystérieux
  1. sed -n '/TWO/{g;p;q};H;/ONE/{n;h}'
复制代码

论坛徽章:
0
4 [报告]
发表于 2013-08-19 10:02 |只看该作者
awk 'f==1&&/TWO/{for(x=0;x<i;x++)print a[x];exit}/ONE/{if(f==1){delete a;i=0;next;}else{f=1;a[i++]=$0;}}f{a[i++]=$0}' tmp

论坛徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之北京
日期:2016-07-06 15:42:0715-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:0915-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56黄金圣斗士
日期:2015-12-02 11:44:35白银圣斗士
日期:2015-11-25 14:32:43白银圣斗士
日期:2015-11-23 12:53:352015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:482015亚冠之首尔
日期:2015-09-01 16:46:052015亚冠之德黑兰石油
日期:2015-08-31 11:39:192015亚冠之萨济拖拉机
日期:2015-08-28 21:06:5315-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53
5 [报告]
发表于 2013-08-19 10:54 |只看该作者
本帖最后由 reyleon 于 2013-08-19 11:27 编辑
  1. awk '{a[NR]=$0}/ONE/{n=NR}/TWO/{for(i=n+1;i<NR;i++)print a[i];exit}'
复制代码

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
6 [报告]
发表于 2013-08-19 11:08 |只看该作者
回复 1# mystérieux

Would you like it by awk

$ sed -n   ':a;/ONE/n;N;/TWO/!ba;p;q'  file
13 ca ca ca
14 pu pu pi
15 he ha he
16 pe pi pa
17 fi fa fe
18 Ya Yu Yi
19 Ze Zi Zu     TWO

$ awk 'P{S=S$0"\n"}/ONE/{P=1;S=""}/TWO/{printf S;exit}' file
13 ca ca ca
14 pu pu pi
15 he ha he
16 pe pi pa
17 fi fa fe
18 Ya Yu Yi
19 Ze Zi Zu     TWO
   

论坛徽章:
93
2015年辞旧岁徽章
日期:2019-10-10 10:51:15CU大牛徽章
日期:2014-02-21 14:21:56CU十二周年纪念徽章
日期:2020-10-15 16:55:55CU大牛徽章
日期:2014-02-21 14:22:07羊年新春福章
日期:2019-10-10 10:51:39CU大牛徽章
日期:2019-10-10 10:55:38季节之章:春
日期:2020-10-15 16:57:40ChinaUnix元老
日期:2019-10-10 10:54:42季节之章:冬
日期:2019-10-10 10:57:17CU大牛徽章
日期:2014-02-21 14:22:52CU大牛徽章
日期:2014-03-13 10:40:30CU大牛徽章
日期:2014-02-21 14:23:15
7 [报告]
发表于 2013-08-19 13:19 |只看该作者
好的方法上面都有了,弄个不好的:
  1. [seesea@UC ~]$ sed -rn 'H; /TWO/{g; s/.*\n([^\n]*ONE)/\1/; p; q}' file
  2. 12 lu lu la ONE
  3. 13 ca ca ca
  4. 14 pu pu pi
  5. 15 he ha he
  6. 16 pe pi pa
  7. 17 fi fa fe
  8. 18 Ya Yu Yi
  9. 19 Ze Zi Zu     TWO
复制代码

论坛徽章:
0
8 [报告]
发表于 2013-08-19 18:06 |只看该作者
谢谢各位参与,白天还有点事,晚上我再认真看你们的作品。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP