免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 7177 | 回复: 12
打印 上一主题 下一主题

[文本处理] 提取文本指定内容 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-08-20 22:53 |只看该作者 |倒序浏览
  1. 如文本
  2. 1
  3. 3
  4. 2
  5. 5
  6. B
  7. 2
  8. 3
  9. B
  10. 5
  11. 6
  12. B
复制代码
提取紧挨这B的前一行数据,如例子中提取为
  1. 5
  2. 3
  3. 6
复制代码

论坛徽章:
50
15-16赛季CBA联赛之广夏
日期:2018-11-05 09:42:462015年亚冠纪念徽章
日期:2015-07-23 11:58:122015亚冠之广州富力
日期:2015-07-07 08:26:172015亚冠之塔什干棉农
日期:2015-06-29 09:08:072015年亚洲杯之伊朗
日期:2015-03-08 20:51:012015年迎新春徽章
日期:2015-03-04 09:58:11未羊
日期:2014-10-16 22:41:47处女座
日期:2014-10-16 15:33:33酉鸡
日期:2014-03-13 12:54:10巳蛇
日期:2014-03-10 14:39:052015亚冠之德黑兰石油
日期:2015-07-29 12:46:372015亚冠之德黑兰石油
日期:2015-08-07 12:54:11
2 [报告]
发表于 2013-08-20 23:07 |只看该作者
  1. sed -n '/B/{x;p};h' file
复制代码
  1. awk '/B/{print S}{S=$0}' file
复制代码

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
3 [报告]
发表于 2013-08-21 09:02 |只看该作者
如果B上面没有--
  1. grep -B 1 "^B$" urfile | grep -vE "^B$|^--$"
复制代码

论坛徽章:
93
2015年辞旧岁徽章
日期:2019-10-10 10:51:15CU大牛徽章
日期:2014-02-21 14:21:56CU十二周年纪念徽章
日期:2020-10-15 16:55:55CU大牛徽章
日期:2014-02-21 14:22:07羊年新春福章
日期:2019-10-10 10:51:39CU大牛徽章
日期:2019-10-10 10:55:38季节之章:春
日期:2020-10-15 16:57:40ChinaUnix元老
日期:2019-10-10 10:54:42季节之章:冬
日期:2019-10-10 10:57:17CU大牛徽章
日期:2014-02-21 14:22:52CU大牛徽章
日期:2014-03-13 10:40:30CU大牛徽章
日期:2014-02-21 14:23:15
4 [报告]
发表于 2013-08-21 09:14 |只看该作者
纯shell:
  1. [seesea@UC ~]$ while read line; do [ "$line" = "B" ] && echo $old; old=$line; done < file
  2. 5
  3. 3
  4. 6
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
5 [报告]
发表于 2013-08-21 09:31 |只看该作者
  1. [root@localhost ~]# sed '$!N;/\nB$/{P;D};D' i
  2. 5
  3. 3
  4. 6
  5. [root@localhost ~]# awk '/^B$/{print s}{s=$0}' i
  6. 5
  7. 3
  8. 6
  9. [root@localhost ~]#
复制代码

论坛徽章:
0
6 [报告]
发表于 2013-08-21 09:54 |只看该作者
回复 2# WilliBhamlll


   awk实现那里看不明白,为什么把$0赋值给S就可以匹配到上一行表示不懂。能否讲讲?

论坛徽章:
50
15-16赛季CBA联赛之广夏
日期:2018-11-05 09:42:462015年亚冠纪念徽章
日期:2015-07-23 11:58:122015亚冠之广州富力
日期:2015-07-07 08:26:172015亚冠之塔什干棉农
日期:2015-06-29 09:08:072015年亚洲杯之伊朗
日期:2015-03-08 20:51:012015年迎新春徽章
日期:2015-03-04 09:58:11未羊
日期:2014-10-16 22:41:47处女座
日期:2014-10-16 15:33:33酉鸡
日期:2014-03-13 12:54:10巳蛇
日期:2014-03-10 14:39:052015亚冠之德黑兰石油
日期:2015-07-29 12:46:372015亚冠之德黑兰石油
日期:2015-08-07 12:54:11
7 [报告]
发表于 2013-08-21 10:07 |只看该作者
回复 6# 一轮秋影

awk '/B/{print S}{S=$0}' file

读取输入文件第1行,/B/条件不满足,不执行{print S},执行{S=$0},第1行内容被赋值给变量S,此时S值为1.
读取输入文件第2行,/B/条件不满足,不执行{print S},执行{S=$0},第2行内容被赋值给变量S,S原来的值被覆盖,此时值为2.
读取输入文件第2行,。。。。。
读取输入文件第4行,/B/条件不满足,不执行{print S},执行{S=$0},第4行内容被赋值给变量S,此时S值为5.
读取输入文件第5行,/B/条件满足,执行{print S},S的值为5(上一行),正好被打印出来。
后面的同理。
   

论坛徽章:
0
8 [报告]
发表于 2013-08-21 10:15 |只看该作者
回复 7# WilliBhamlll


    看懂了,原来是awk有多个{}时的执行方式。谢谢。。

论坛徽章:
8
双子座
日期:2013-08-31 07:37:12金牛座
日期:2013-09-09 18:49:12处女座
日期:2013-09-23 11:43:14处女座
日期:2013-10-09 19:48:21狮子座
日期:2014-03-24 18:22:12丑牛
日期:2014-04-22 22:07:51申猴
日期:2014-06-12 21:54:13双鱼座
日期:2014-06-13 21:52:31
9 [报告]
发表于 2013-08-21 11:21 |只看该作者
感谢大牛们的思路
  1. perl -ne '/^B$/?{print $s}:{$s=$_}'  filename
复制代码
回复 1# debateshang


   

论坛徽章:
14
15-16赛季CBA联赛之辽宁
日期:2019-06-16 15:47:3515-16赛季CBA联赛之广夏
日期:2016-08-13 21:24:352015亚冠之武里南联
日期:2015-07-07 17:37:372015亚冠之萨济拖拉机
日期:2015-07-06 17:07:482015亚冠之全北现代
日期:2015-06-04 13:54:272015亚冠之城南
日期:2015-05-21 15:43:212015年亚洲杯之伊朗
日期:2015-04-25 18:20:362015年亚洲杯之伊朗
日期:2015-04-20 16:06:052015年亚洲杯之科威特
日期:2015-03-07 12:51:26丑牛
日期:2014-12-30 10:26:38申猴
日期:2014-09-28 22:40:18金牛座
日期:2014-09-13 21:12:22
10 [报告]
发表于 2013-08-21 14:10 |只看该作者
回复 2# WilliBhamlll

awk讲解的很详细,谢谢

   sed 没看懂,求大牛再指点下。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP