免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 7387 | 回复: 16
打印 上一主题 下一主题

怎么取出文件中匹配行之间的部分 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-07-22 18:41 |只看该作者 |倒序浏览
Hi,

我有一个文件 是:

begin
hello
world
end
this
is
test
begin
hello
world
end

我想取出最后一个 begin 和 end 之间的内容?

论坛徽章:
3
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:51:162015年亚洲杯之阿曼
日期:2015-04-07 20:00:59
2 [报告]
发表于 2011-07-22 19:26 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
3 [报告]
发表于 2011-07-22 20:32 |只看该作者
是否需要考虑begin和end不配对的情况?比如最后一个begin下面没有end

论坛徽章:
15
2015年辞旧岁徽章
日期:2015-03-03 16:54:15双鱼座
日期:2015-01-15 17:29:44午马
日期:2015-01-06 17:06:51子鼠
日期:2014-11-24 10:11:13寅虎
日期:2014-08-18 07:10:55酉鸡
日期:2014-04-02 12:24:51双子座
日期:2014-04-02 12:19:44天秤座
日期:2014-03-17 11:43:36亥猪
日期:2014-03-13 08:13:51未羊
日期:2014-03-11 12:42:03白羊座
日期:2013-11-20 10:15:18CU大牛徽章
日期:2013-04-17 11:48:45
4 [报告]
发表于 2011-07-22 21:05 |只看该作者
  1. awk '/begin/,/end/' infile
复制代码

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
5 [报告]
发表于 2011-07-22 21:20 |只看该作者
回复 4# rdcwayx


楼主要求“最后一个”

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
6 [报告]
发表于 2011-07-23 07:57 |只看该作者
本帖最后由 yinyuemi 于 2011-07-23 08:14 编辑

回复 1# yang200218
  1. echo "aa
  2. begin
  3. bb xxx
  4. end
  5. dd
  6. begin
  7. hello xxx
  8. world xxx
  9. end
  10. this
  11. is
  12. test
  13. begin
  14. hello vvv
  15. world vvv
  16. end" |sed -n '/begin/,/end/{/begin/h;/end/! H;};${g;s/begin\n//gp}'
  17. hello vvv
  18. world vvv

复制代码

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
7 [报告]
发表于 2011-07-23 07:58 |只看该作者
本帖最后由 yinyuemi 于 2011-07-23 07:59 编辑

回复 2# zooyo


    这个可能不行,如果在第一个begin前加一行的话,或者说有多个begin和end区间的话

论坛徽章:
0
8 [报告]
发表于 2011-07-23 09:26 |只看该作者
#!/bin/bash

cat -n 2.txt | sed -n '/begin/p' >temp
startnum=`sed -n '$ p' temp  | awk '{print $1;}'`
startnum=`expr ${startnum} + 1`

echo ${startnum}

cat -n 2.txt | sed -n '/end/p' >temp
endnum=`sed -n '$ p' temp  | awk '{print $1;}'`
endnum=`expr ${endnum} - 1`

echo ${endnum}

sed -n ${startnum},${endnum}p 2.txt > temp


2.txt存放的是最初的内容,temp保存最后你想要的内容,这里不考虑最后一个begin后面没有end的情况

论坛徽章:
0
9 [报告]
发表于 2011-07-23 11:10 |只看该作者
1. jane@jane-desktop:~/Shell$ cat aa.txt
aaaaa
begin
hello
1111111111
world
end
this
is
test
begin
begin
hello
22222222
world
end
3333333333
end

2. jane@jane-desktop:~/Shell$ cat aa.sh
cat aa.txt | sed 's/^begin$/\n&/; s/^end$/&\n/' | tac |awk -v RS='' '{ if( /begin/&&/end/ ){ printf( "%s\n\n", $0 ); } }' | sed '/^$/,$d' | tac | sed '1,1d;$,$d'

3. jane@jane-desktop:~/Shell$ sh aa.sh
hello
22222222
world
方法比较笨, 执行效率可能也不高. 请高手指点.

论坛徽章:
3
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:51:162015年亚洲杯之阿曼
日期:2015-04-07 20:00:59
10 [报告]
发表于 2011-07-23 12:11 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP