免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: 18800375280
打印 上一主题 下一主题

[文本处理] sed处理多行中首尾拼接的行 [复制链接]

论坛徽章:
3
15-16赛季CBA联赛之北控
日期:2016-06-06 21:01:08程序设计版块每日发帖之星
日期:2016-06-19 06:20:00程序设计版块每日发帖之星
日期:2016-07-17 06:20:00
11 [报告]
发表于 2016-07-14 17:10 |只看该作者
回复 6# liion631818
是我自己的文本的格式问题导致的,其实你们的答案都是OK的,流弊, 学习了!

论坛徽章:
3
15-16赛季CBA联赛之北控
日期:2016-06-06 21:01:08程序设计版块每日发帖之星
日期:2016-06-19 06:20:00程序设计版块每日发帖之星
日期:2016-07-17 06:20:00
12 [报告]
发表于 2016-07-14 17:12 |只看该作者
回复 7# moperyblue
牛,学习了!

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
13 [报告]
发表于 2016-07-14 22:46 |只看该作者
  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;

  4. my @aData;
  5. while (<>){
  6.     if (/omega/){
  7.         print;
  8.         @aData = ();
  9.         next;
  10.     }
  11.     s/\s+\z//;
  12.     {
  13.         local $" = "";
  14.         next if (push (@aData, $_) and "@aData" eq $_);
  15.         if ("@aData" =~ /omega/){
  16.             my @aTmp = ();
  17.             unshift (@aTmp, pop @aData) until ("@aTmp" =~ /omega/);
  18.             print "@aTmp\n";
  19.             splice (@aData, 0, @aData, pop @aTmp);
  20.         }
  21.     }
  22. }
复制代码
omega ,omega
cding .cd dzzz erg omega bc dde ome
a bc dde omega zerg ome
bbb cc dde omega zz
omega zzz ome
cc omega
omega,cc

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
14 [报告]
发表于 2016-07-14 23:39 |只看该作者
回复 1# 18800375280
  1. sed ':n;$!N;h;s/.*\(\<\w\+\) *\n *\(\w\+\>\).*/\1\2/;/\<omega\>/!{g;/\<omega\>.*\n/P;D};g;s/ *\n *//;bn;' urfile
复制代码
如果有这样的行:
omega ,omeg
a foobar


输出什么?

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
15 [报告]
发表于 2016-07-14 23:58 |只看该作者
回复 2# jason680


    语义有问题吧,

foobar omeg
omega ,omeg
a foobar


输出:

omega ,omeg
foobar omega foobar

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
16 [报告]
发表于 2016-07-15 00:03 |只看该作者
回复 1# 18800375280


    line2和line3"匹配“, 同时line3和line4匹配,这时应该把它们连起来——line2line3line4。你要求不合理吧。

论坛徽章:
3
15-16赛季CBA联赛之北控
日期:2016-06-06 21:01:08程序设计版块每日发帖之星
日期:2016-06-19 06:20:00程序设计版块每日发帖之星
日期:2016-07-17 06:20:00
17 [报告]
发表于 2016-07-17 19:23 |只看该作者
回复 16# blackold
对,需求有问题,黑哥请忽略!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP