免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4466 | 回复: 6
打印 上一主题 下一主题

[文本处理] 提取指定字符串之间的内容 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-11-25 17:52 |只看该作者 |倒序浏览

  1. <!--date_start-->
  2. <tr>
  3. <td align=center id=1 >星期一</td>
  4. </tr>
  5. <tr>
  6. <td align=center id=2 >星期二</td>
  7. </tr>
  8. <tr>
  9. <td align=center id=3 >星期三</td>
  10. </tr>
  11. <tr>
  12. <td align=center id=4 >星期四</td>
  13. </tr>
  14. <tr>
  15. <td  align=center id=5 >星期五</td>
  16. </tr>
  17. <tr>
  18. <td align=center id=6 >星期六</td>
  19. </tr>
  20. <tr>
  21. <td align=center id=7 >星期日</td>
  22. </tr>
  23. <!--date_end-->
复制代码
提取  <!--date_start-->  与 <!--date_end-->  之间的内容?

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
2 [报告]
发表于 2013-11-25 17:55 |只看该作者
  1. sed '/<!--date_start-->/,/<!--date_end-->/!d'
复制代码
  1. awk '/<!--date_start-->/,/<!--date_end-->/'
复制代码

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
3 [报告]
发表于 2013-11-25 17:58 |只看该作者
回复 1# yong1610yy
  1. awk  '/<!--date_start-->/{p=1;next}/<!--date_end-->/{p=0}p' urfile
复制代码

论坛徽章:
0
4 [报告]
发表于 2013-11-25 18:13 |只看该作者
回复 3# 关阴月飞


谢谢大神, 如果我把这些内容提取出来了,想要把这些内容插到到另一个文件a.txt的指定行后面如17行后面该如何做?

   

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
5 [报告]
发表于 2013-11-25 18:39 |只看该作者
回复 4# yong1610yy


    先把提取出来的内容写到文件 tmp.txt 再用awk 或 sed 操作:

  1. sed -i '17rtmp.txt' a.txt
  2. awk 'NR==18{system("cat tmp.txt")}1' a.txt
复制代码

论坛徽章:
1
2015年迎新春徽章
日期:2015-03-04 09:58:11
6 [报告]
发表于 2013-11-26 10:38 |只看该作者
  1. :/<!--date_start-->/+1,/<!--date_end-->/-1 w  test3
复制代码
vim 实现
只能写到另一个文件中了,不能插入到一个文件中的某一行,除非 用俩条命令
:17read !cat test3

论坛徽章:
36
摩羯座
日期:2013-09-23 16:37:312015年亚洲杯之沙特阿拉伯
日期:2015-04-14 09:10:172015亚冠之柏太阳神
日期:2015-06-25 08:48:212015亚冠之武里南联
日期:2015-07-28 09:01:082015亚冠之莱赫维亚
日期:2015-07-28 15:44:172015亚冠之柏斯波利斯
日期:2015-09-06 14:08:52白银圣斗士
日期:2015-11-25 17:06:2815-16赛季CBA联赛之吉林
日期:2015-12-09 16:59:072016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之辽宁
日期:2016-04-14 09:29:04luobin
日期:2016-06-17 17:46:3615-16赛季CBA联赛之天津
日期:2016-08-16 14:11:01
7 [报告]
发表于 2013-11-27 14:56 |只看该作者
本帖最后由 LikeLx 于 2013-11-27 14:56 编辑
  1. sed -n '/<!--date_start-->/,/<!--date_end-->/{//!p}'
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP