免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: rm-rf
打印 上一主题 下一主题

[文本处理] sed 取匹配行的前面的第n行,以及取匹配行后面的第n行 [复制链接]

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
11 [报告]
发表于 2015-12-17 19:46 |只看该作者
回复 1# rm-rf

$ seq 100 | awk '$0=="30"{print a[NR%af];exit}{a[NR%af]=$0}' af=10
20

$ seq 100 | awk '$0=="30"{while(bf--){getline}print;exit}' bf=10
40

   

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
12 [报告]
发表于 2015-12-18 09:40 |只看该作者
回复 1# rm-rf


seq 100 | sed -n '1{:a;N;10!ba};N;/30$/P;D'
seq 100 | sed -n '1{:a;N;10!ba};N;/^30/s/.*\n//p;D'

论坛徽章:
2
技术图书徽章
日期:2013-12-17 13:52:152015亚冠之萨济拖拉机
日期:2015-07-19 11:07:52
13 [报告]
发表于 2015-12-18 12:00 |只看该作者
ly5066113 发表于 2015-12-18 09:40
回复 1# rm-rf


这个效率很高,大哥麻烦解释一下啊

论坛徽章:
24
申猴
日期:2014-10-10 15:56:39射手座
日期:2014-10-10 15:57:18黑曼巴
日期:2018-05-14 11:05:122016科比退役纪念章
日期:2018-05-14 11:05:0715-16赛季CBA联赛之北控
日期:2018-05-14 11:05:0015-16赛季CBA联赛之江苏
日期:2017-02-27 18:11:0715-16赛季CBA联赛之上海
日期:2018-08-15 09:48:5415-16赛季CBA联赛之佛山
日期:2018-07-20 17:14:2315-16赛季CBA联赛之佛山
日期:2019-09-10 18:08:4615-16赛季CBA联赛之山西
日期:2020-03-26 09:40:5115-16赛季CBA联赛之佛山
日期:2020-05-08 09:03:54
14 [报告]
发表于 2015-12-18 13:52 |只看该作者
  1. seq 100 | awk '{a[NR]=$0}/30/{b=NR}END{print a[b-10],a[b+10]}'
  2. 20 40
复制代码

论坛徽章:
2
技术图书徽章
日期:2013-12-17 13:52:152015亚冠之萨济拖拉机
日期:2015-07-19 11:07:52
15 [报告]
发表于 2015-12-18 22:15 |只看该作者
ly5066113 发表于 2015-12-18 09:40
回复 1# rm-rf


请问采用这种方法的话,如果匹配的正则不是正好在结尾怎么办?比如下面的文件 1.txt

sdf 1 area ghh
hgh 2 sdf fdh
gfs 3 bb fgjh
hsf 4 reg hfgh
adn 5 rty  54654
fgj 6 ghgfh 546
df  7 fgh 324
456 8 546 58
fgh 9 3465 67
435 10 657 78
sdf 11 ass frtgy
dfg 12 5468 6578
2d  13 here fg
56  14 sdf j55

想匹配here,匹配行为

2d  13 here fg

然后得出以上行前面的第10行

gfs 3 bb fgjh

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
16 [报告]
发表于 2015-12-21 08:23 |只看该作者
回复 15# rm-rf
  1. sed -n '1{:a;N;10!ba};N;/here[^\n]*$/P;D' file
复制代码

论坛徽章:
2
技术图书徽章
日期:2013-12-17 13:52:152015亚冠之萨济拖拉机
日期:2015-07-19 11:07:52
17 [报告]
发表于 2015-12-22 19:27 |只看该作者
回复 16# ly5066113

高,感谢!我发现如下的脚本更麻烦些,不过在超大文件的情况下执行速度要快很多,不知道为什么:


sed -n '1{:a;N;10!ba};N;/here/{/here[^\n]*$/P};D' file

   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP