免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 8940 | 回复: 29
打印 上一主题 下一主题

[文本处理] 如何用awk实现取两匹配行之间的行但包括第一匹配不包括第二匹配? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-03-13 17:20 |只看该作者 |倒序浏览
本帖最后由 wangmice 于 2015-03-14 15:57 编辑

如何用awk实现取两匹配行之间的行,但包括第一匹配行且不包括第二匹配行?
比如有这样一段文本:
111111111
222222222
333333333
444444444
555555555

匹配22222及55555这两行,输出2-4这三行。
————————————————————————————————————————————————————————
谢谢各位的答疑,说说我的实际问题吧,想用curl自动提交表单登录。表单数据大致是这样的:
  1.                                         <input type="hidden" name="paramStr" id="paramStr" value="9M+7JzF+8VNrE2IAvqV2FUFMyVEsn38h6RiF2+Ue4X9yA+9xDq0lBHiCCI4gVC0cyO9XDXEL6+Wx
  2. 2m0u8T5PpSrUVJ+tcNsqVU7wiqRBCEsUjfVEM9AiH8K02/HAhUeIhPirem6uuy8IT07tav4gmkV3
  3. YaJk2R6lnDwPKifC6mhQ3Pw/rAA2CC9qkK0xSsmvOl2abwaWt9cWgnc8TRSpyspj9Imr8RpsZC7t
  4. jpO2Y0hQ6MPnjEvcWzdRFapyKcqUX4nOcT8BW6tlyLGEgdEvdP0zTDv8T7FHn6wx8pnFgmN6FgLo
  5. FtTIMW+iSbc9lvVapu2eBpBlcnU2PpEt3om/N9uiLyuUOjoZyVNU83OoEoSK9jYYSr0o+Zrr32/Q
  6. MoLHPQd53jNnlO4=" />
  7.                                         <input type="hidden" name="paramStrEnc" id="paramStrEnc" value="CE9O7Wr%2BIJpFd2GiZNkepRRC6cujNLJjXDED1FtB5UAn%2Fn4IGzDg88fzX1I%2BH%2FYDB1sW%2BVQmKvag%0A0qNso4FuRdFstj%2FdpprHwmIYP9emmCTUSxIUSH5gArE6gUvP0bzdUhf%2FxDJRePPAIhFsvdW2nGhV%0ARsjfcjeFLnvfLIee%2F4M8Jjm89iJwTPj8rnfI0j%2F%2Bb9kY4EHLaaOqLEPwatzaKDob8jf0MA%2BZbshC%0AHlAAc%2FhdsLpj75ZhUg52oRijEiB86kj0ctcBCZZEg2trACgFexQLJqO4Z1pz5bInGBlxYkOqiBQu%0AEleCbauY9%2B3Y9%2FolQE3hQ2h64hVM7IIyOR%2BBN4GNQmg49HCSIVZitAiHyU4uGpY6WlbSPttKaDrk%0AyWWfCeYzCvXni%2BalDYmmkdcMf8%2Fgq80qnDn4" />
复制代码
paramStrEnc的值基本上我知道获取了。paramStr的值行数不定,有时是六行,有时4行或5行。就是想截取这个paramStr的值。
  1. 9M+7JzF+8VNrE2IAvqV2FUFMyVEsn38h6RiF2+Ue4X9yA+9xDq0lBHiCCI4gVC0cyO9XDXEL6+Wx
  2. 2m0u8T5PpSrUVJ+tcNsqVU7wiqRBCEsUjfVEM9AiH8K02/HAhUeIhPirem6uuy8IT07tav4gmkV3
  3. YaJk2R6lnDwPKifC6mhQ3Pw/rAA2CC9qkK0xSsmvOl2abwaWt9cWgnc8TRSpyspj9Imr8RpsZC7t
  4. jpO2Y0hQ6MPnjEvcWzdRFapyKcqUX4nOcT8BW6tlyLGEgdEvdP0zTDv8T7FHn6wx8pnFgmN6FgLo
  5. FtTIMW+iSbc9lvVapu2eBpBlcnU2PpEt3om/N9uiLyuUOjoZyVNU83OoEoSK9jYYSr0o+Zrr32/Q
  6. MoLHPQd53jNnlO4=
复制代码
能否将此值合并成一行然后赋值给变量?

求职 : 机器学习
论坛徽章:
79
2015年亚洲杯纪念徽章
日期:2015-05-06 19:18:572015七夕节徽章
日期:2015-08-21 11:06:172015亚冠之阿尔纳斯尔
日期:2015-09-07 09:30:232015亚冠之萨济拖拉机
日期:2015-10-21 08:26:3915-16赛季CBA联赛之浙江
日期:2015-12-30 09:59:1815-16赛季CBA联赛之浙江
日期:2016-01-10 12:35:21技术图书徽章
日期:2016-01-15 11:07:2015-16赛季CBA联赛之新疆
日期:2016-02-24 13:46:0215-16赛季CBA联赛之吉林
日期:2016-06-26 01:07:172015-2016NBA季后赛纪念章
日期:2016-06-28 17:44:45黑曼巴
日期:2016-06-28 17:44:4515-16赛季CBA联赛之浙江
日期:2017-07-18 13:41:54
2 [报告]
发表于 2015-03-13 17:26 |只看该作者
本帖最后由 zsszss0000 于 2015-03-13 18:45 编辑
  1. awk '/22/{p=1}/55/{p=0}p' file
复制代码
  1. 222222222
  2. 333333333
  3. 444444444
复制代码
  1. sed -n '/22/{:a;H;n;/55/bb;ba;:b;x;s/\n//1;p}' file
复制代码
  1. sed -n '/22/{:a;h;N;/55/bb;ba;:b;x;p}' file
复制代码

论坛徽章:
8
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015小元宵徽章
日期:2015-03-06 15:58:18每日论坛发贴之星
日期:2015-06-08 22:20:00每日论坛发贴之星
日期:2015-06-08 22:20:00操作系统版块每日发帖之星
日期:2015-06-14 22:20:00数据库技术版块每日发帖之星
日期:2015-11-09 06:20:00数据库技术版块每日发帖之星
日期:2016-02-22 06:20:0015-16赛季CBA联赛之上海
日期:2017-01-01 23:58:53
3 [报告]
发表于 2015-03-13 17:34 |只看该作者
awk '/1/{while(getline)if($0!~/5/)print;else exit}' inputfile
or
awk '/1/,/5/{if(i>1)print x;x=$0;i++}' inputfile

论坛徽章:
0
4 [报告]
发表于 2015-03-13 21:00 |只看该作者
可实现,但是还没太看懂

论坛徽章:
28
2015年迎新春徽章
日期:2015-03-04 10:16:53午马
日期:2015-03-20 17:11:07亥猪
日期:2015-03-20 17:11:23戌狗
日期:2015-03-20 17:11:33酉鸡
日期:2015-03-20 17:11:47申猴
日期:2015-03-20 17:11:58未羊
日期:2015-03-20 17:12:10子鼠
日期:2015-03-20 17:12:23丑牛
日期:2015-03-20 17:12:40卯兔
日期:2015-03-20 17:12:51辰龙
日期:2015-03-20 17:13:00巳蛇
日期:2015-03-20 17:13:12
5 [报告]
发表于 2015-03-13 22:50 |只看该作者
本帖最后由 我是一隻羊 于 2015-03-13 23:01 编辑
  1. sed -n '/2/{:1;/2$/{h;n};H;n;/5/!b1;x;p}' inputfile
复制代码

论坛徽章:
0
6 [报告]
发表于 2015-03-14 07:51 来自手机 |只看该作者
3楼其实匹配的是第一行,真实数据第一行没规律,不好捕捉。

论坛徽章:
13
双鱼座
日期:2013-10-23 09:30:05数据库技术版块每日发帖之星
日期:2016-04-20 06:20:00程序设计版块每日发帖之星
日期:2016-03-09 06:20:002015亚冠之塔什干火车头
日期:2015-11-02 10:07:452015亚冠之德黑兰石油
日期:2015-08-30 10:07:07数据库技术版块每日发帖之星
日期:2015-08-28 06:20:00数据库技术版块每日发帖之星
日期:2015-08-05 06:20:002015年迎新春徽章
日期:2015-03-04 09:57:09辰龙
日期:2014-12-03 14:45:52酉鸡
日期:2014-07-23 09:46:23亥猪
日期:2014-03-13 08:46:22金牛座
日期:2014-02-11 09:36:21
7 [报告]
发表于 2015-03-14 09:28 |只看该作者
本帖最后由 bikong0411 于 2015-03-14 09:28 编辑
  1. awk '/2222/,/5555/{if($0 !~ /5555/) print $0}' urfile
  2. sed -n '/2222/,/5555/{/5555/d;p;}' urfile
复制代码

论坛徽章:
22
2015年亚洲杯之科威特
日期:2015-04-18 15:27:07每日论坛发贴之星
日期:2016-01-27 06:20:0015-16赛季CBA联赛之广夏
日期:2016-03-28 16:20:51程序设计版块每日发帖之星
日期:2016-04-09 06:20:00CU十四周年纪念徽章
日期:2016-05-03 09:35:1415-16赛季CBA联赛之天津
日期:2016-11-18 08:31:3115-16赛季CBA联赛之山西
日期:2016-12-07 16:29:5315-16赛季CBA联赛之八一
日期:2017-01-10 11:34:3415-16赛季CBA联赛之吉林
日期:2017-03-30 22:51:1915-16赛季CBA联赛之广夏
日期:2017-04-13 20:51:52程序设计版块每日发帖之星
日期:2016-01-27 06:20:00每日论坛发贴之星
日期:2015-12-28 06:20:00
8 [报告]
发表于 2015-03-14 09:58 来自手机 |只看该作者
本帖最后由 Windows19 于 2015-03-14 13:02 编辑

顶题      借楼主贴子问2个问题,如果是需求要全部隔行输出呢

需求1:
222222222
444444444


需求2:
111111111
333333333
555555555

直到结尾

论坛徽章:
0
9 [报告]
发表于 2015-03-14 10:31 |只看该作者
回复 8# Windows19
  1. awk '{if(NR%2==0){print $0>"a"}else{print $0>"b"}}'
复制代码

论坛徽章:
0
10 [报告]
发表于 2015-03-14 10:51 |只看该作者
回复 7# bikong0411


   这个好像不错。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP