论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2010-10-24 15:51 |只看该作者 |倒序浏览

11111

/begin a
22222
/end a

333333

/begin b
44444
/end b

555555

/begin a
66666
77777
/end a

探测到begin后的名字一样的话,就消除/begin到/end行之间的内容.比如上面的文件中删除
/begin a
66666
77777
/end a

一行的删除还有头绪，多行的删除有点没头绪了，
请高手指点！！！谢谢！！

文库|博客

zhlong8

版主

论坛徽章:: 46

2楼 [报告]

发表于 2010-10-24 16:30 |只看该作者

本帖最后由 zhlong8 于 2010-10-24 16:48 编辑

use 5.012;
use warnings;
my %tags; #为 key => [行号1, 行号2, 行号3,...]结构
my @result;
my $line = -1;
while (<>) {
chomp;
push @result, $_;
$line ++;
if (m!^/begin (\w+)!) { #记录行号
exists $tags{$1} ? push(@{$tags{$1}}, $line) : ($tags{$1} = [$line]);
next;
}
if (m!^/end (\w+)!) { #寻找匹配行号并删除，
#不支持 \begin a \begin b \end a \end b这样的交叉结构
die "not match" unless exists $tags{$1} and @{$tags{$1}};
splice @result, (pop @{$tags{$1}})-1, $#result; #行号从1 开始，所以要减 1
$line = $#result;
next;
}
}
say for @result;

复制代码

有bug不应该用 $. 已修正

测试数据

11111
/begin a
22222
/begin c
324333
324234
/end c
/end a
333333
/begin b
44444
/end b
555555
/begin a
66666
77777
/end a

复制代码

输出

11111
333333
555555

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

Monox

家境小康

论坛徽章:: 7

3楼 [报告]

发表于 2010-10-24 16:57 |只看该作者

回复 1# yilong777jp

perl -lnE '
if (m#/begin (\w+)# .. m#/end ($1)#) {
say unless $hash{$1};
m#/end (\w+)# and $hash{$1} = 1;
} else {
say;
}' txt

复制代码

txt 就是楼主提供的文件，不支持嵌套。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

yilong777jp

白手起家

论坛徽章:: 0

4楼 [报告]

发表于 2010-10-24 17:07 |只看该作者

谢谢大家的及时回复，但我想删除的是begin后名字重复的部分，就是说如果有2个begin a 就删除一个begin a到end a的内容，保留一个和其余不重复的
输出为
11111

/begin a
22222
/end a

333333

/begin b
44444
/end b

555555

谢谢