免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3245 | 回复: 13
打印 上一主题 下一主题

请教一个识别后删除的问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-10-24 15:51 |只看该作者 |倒序浏览
11111

/begin a
22222
/end a

333333

/begin b
44444
/end b

555555

/begin a
66666
77777
/end a

探测到begin后的名字一样的话,就消除/begin到/end行之间的内容.比如上面的文件中删除
/begin a
66666
77777
/end a

一行的删除还有头绪,多行的删除有点没头绪了,
请高手指点!!!谢谢!!

论坛徽章:
46
15-16赛季CBA联赛之四川
日期:2018-03-27 11:59:132015年亚洲杯之沙特阿拉伯
日期:2015-04-11 17:31:45天蝎座
日期:2015-03-25 16:56:49双鱼座
日期:2015-03-25 16:56:30摩羯座
日期:2015-03-25 16:56:09巳蛇
日期:2015-03-25 16:55:30卯兔
日期:2015-03-25 16:54:29子鼠
日期:2015-03-25 16:53:59申猴
日期:2015-03-25 16:53:29寅虎
日期:2015-03-25 16:52:29羊年新春福章
日期:2015-03-25 16:51:212015亚冠之布里斯班狮吼
日期:2015-07-13 10:44:56
2 [报告]
发表于 2010-10-24 16:30 |只看该作者
本帖最后由 zhlong8 于 2010-10-24 16:48 编辑
  1. use 5.012;
  2. use warnings;

  3. my %tags;       #为 key => [行号1, 行号2, 行号3,...]结构
  4. my @result;
  5. my $line = -1;

  6. while (<>) {
  7.     chomp;
  8.     push @result, $_;
  9.     $line ++;
  10.     if (m!^/begin (\w+)!) {  #记录行号
  11.         exists $tags{$1} ? push(@{$tags{$1}}, $line) : ($tags{$1} = [$line]);
  12.         next;
  13.     }

  14.     if (m!^/end (\w+)!) {    #寻找匹配行号并删除,
  15.                             #不支持 \begin a \begin b \end a \end b这样的交叉结构
  16.         die "not match" unless exists $tags{$1} and @{$tags{$1}};
  17.         splice @result, (pop @{$tags{$1}})-1, $#result; #行号从1 开始,所以要减 1
  18.         $line = $#result;
  19.         next;
  20.     }
  21. }
  22. say for @result;
复制代码
有bug不应该用 $. 已修正

测试数据
  1. 11111

  2. /begin a
  3. 22222
  4. /begin c
  5. 324333
  6. 324234
  7. /end c
  8. /end a

  9. 333333

  10. /begin b
  11. 44444
  12. /end b

  13. 555555
  14. /begin a
  15. 66666
  16. 77777
  17. /end a
复制代码
输出
  1. 11111

  2. 333333

  3. 555555
复制代码

论坛徽章:
7
巳蛇
日期:2014-04-10 08:54:57白羊座
日期:2014-04-22 20:06:262015年亚洲杯之沙特阿拉伯
日期:2015-02-10 14:18:532015年辞旧岁徽章
日期:2015-03-03 16:54:152015亚冠之吉达阿赫利
日期:2015-06-02 11:34:112015亚冠之武里南联
日期:2015-06-24 12:13:082015亚冠之阿尔纳斯尔
日期:2015-08-03 09:08:25
3 [报告]
发表于 2010-10-24 16:57 |只看该作者
回复 1# yilong777jp
  1. perl -lnE '
  2. if (m#/begin (\w+)# .. m#/end ($1)#) {
  3.     say unless $hash{$1};
  4.     m#/end (\w+)# and $hash{$1} = 1;
  5. } else {
  6.     say;
  7. }' txt
复制代码
txt 就是楼主提供的文件,不支持嵌套。

论坛徽章:
0
4 [报告]
发表于 2010-10-24 17:07 |只看该作者
谢谢大家的及时回复,但我想删除的是begin后名字重复的部分,就是说如果有2个begin a 就删除一个begin a到end a的内容,保留一个和其余不重复的
输出为
11111

/begin a
22222
/end a

333333

/begin b
44444
/end b

555555

谢谢

论坛徽章:
7
巳蛇
日期:2014-04-10 08:54:57白羊座
日期:2014-04-22 20:06:262015年亚洲杯之沙特阿拉伯
日期:2015-02-10 14:18:532015年辞旧岁徽章
日期:2015-03-03 16:54:152015亚冠之吉达阿赫利
日期:2015-06-02 11:34:112015亚冠之武里南联
日期:2015-06-24 12:13:082015亚冠之阿尔纳斯尔
日期:2015-08-03 09:08:25
5 [报告]
发表于 2010-10-24 17:09 |只看该作者
回复 4# yilong777jp
你都没试过上面的例子,我给的代码就可以办到。只是不支持嵌套的而已。是完全按照你的意思和例子给的方案。

论坛徽章:
46
15-16赛季CBA联赛之四川
日期:2018-03-27 11:59:132015年亚洲杯之沙特阿拉伯
日期:2015-04-11 17:31:45天蝎座
日期:2015-03-25 16:56:49双鱼座
日期:2015-03-25 16:56:30摩羯座
日期:2015-03-25 16:56:09巳蛇
日期:2015-03-25 16:55:30卯兔
日期:2015-03-25 16:54:29子鼠
日期:2015-03-25 16:53:59申猴
日期:2015-03-25 16:53:29寅虎
日期:2015-03-25 16:52:29羊年新春福章
日期:2015-03-25 16:51:212015亚冠之布里斯班狮吼
日期:2015-07-13 10:44:56
6 [报告]
发表于 2010-10-24 17:12 |只看该作者
回复 4# yilong777jp


    遇到一个 \begin X 先看是不是已经存在,不存在记录下存在然后继续,存在就吃到 \end X ……

论坛徽章:
0
7 [报告]
发表于 2010-10-24 17:17 |只看该作者
楼上的能给个代码么?
我是初学者,向大家多多学习,谢谢!!

论坛徽章:
46
15-16赛季CBA联赛之四川
日期:2018-03-27 11:59:132015年亚洲杯之沙特阿拉伯
日期:2015-04-11 17:31:45天蝎座
日期:2015-03-25 16:56:49双鱼座
日期:2015-03-25 16:56:30摩羯座
日期:2015-03-25 16:56:09巳蛇
日期:2015-03-25 16:55:30卯兔
日期:2015-03-25 16:54:29子鼠
日期:2015-03-25 16:53:59申猴
日期:2015-03-25 16:53:29寅虎
日期:2015-03-25 16:52:29羊年新春福章
日期:2015-03-25 16:51:212015亚冠之布里斯班狮吼
日期:2015-07-13 10:44:56
8 [报告]
发表于 2010-10-24 17:34 |只看该作者
本帖最后由 zhlong8 于 2010-10-24 17:36 编辑
  1. use strict;
  2. use warnings;

  3. my %tags;

  4. LOOP:
  5. while (<>) {
  6.     if (m!^/begin (\w+)!) {
  7.         if ($tags{$1}++) {
  8.             while (<>) {
  9.                 next LOOP if m!^/end $1!;
  10.             }
  11.         } else {
  12.             print;
  13.             next;
  14.         }
  15.     }
  16.     print;
  17. }
复制代码

论坛徽章:
0
9 [报告]
发表于 2010-10-24 17:47 |只看该作者
谢谢 楼上,
好好学习学习

论坛徽章:
0
10 [报告]
发表于 2010-11-06 01:25 |只看该作者
本帖最后由 yilong777jp 于 2010-11-06 03:51 编辑

$tags{$1}++

好像是找重复的值......

怎么理解这句呢???请指点!!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP