论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2011-01-20 11:20 |只看该作者 |倒序浏览

本帖最后由 paktc 于 2011-01-20 11:27 编辑

在文本中，找出10行以内里面有
"folder"也有"size"的段落。

比如:

folder size

fsafdsa
f size
ds
fsd folder
f
sa s
fsd
fsd folder
f
d346s
f346
3521
f35
2365
4523161
dfs2355
6436
3147
2666666size 这个超出10行

1 : folder size <- 这一行有folder 和size
=======
1 : folder size <-
2 :
3 : fsafdsa
4 : f size       <- 这一段有folder 和size
=======
1 : folder size <-
2 :
3 : fsafdsa
4 : f size
5 : ds
6 : fsd folder <- 这一段有size 和folder
=======
4 : f size    <-
5 : ds
6 : fsd folder <- 这一段有size 和folder
=======

我只是……  偶然在搜索的时候想要用到这样的方式。
好像蛮有思考空间的。  如果说同时出现在同一行的话大概就是以上的情况

貌似可以先筛选出所有包含字串A 和字串B的行号然后对比出来额，编写中

文库|博客

toniz

富足长乐

论坛徽章:: 0

2楼 [报告]

发表于 2011-01-20 12:50 |只看该作者

use strict;
my $str=join '^&*',<DATA>;
$str=~s/(\r|\n)//g;
my $i;
$str=~m{(folder.*?size)(?{evalsub($1)})(?!)};
$str=~m{(size.*?folder)(?{evalsub($1)})(?!)};
sub evalsub(){
my $tmp=shift;
my @tmp=split /\^\&\*/,$tmp;
if($#tmp<9){
print "第".$i++."个:\n";
my $j=0;
foreach(@tmp){
print "row".$j++."\t: $_\n";
}
}
}
__DATA__
folder size
fsafdsa
f size
ds
fsd folder
f
sa s
fsd
fsd folder
f
d346s
f346
3521
f35
2365
4523161
dfs2355
6436
3147
2666666size

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

toniz

富足长乐

论坛徽章:: 0

3楼 [报告]

发表于 2011-01-20 12:53 |只看该作者

[quote]perl k.t
第0个:
row0 :folder size
第1个:
row0 :folder size
row1 :
row2 :fsafdsa
row3 :f size
第2个:
row0 :size
row1 :
row2 :fsafdsa
row3 :f size
row4 :ds
row5 :fsd folder
第3个:
row0 :size
row1 :ds
row2 :fsd folder
第4个:
row0 :size
row1 :ds
row2 :fsd folder
row3 :f
row4 :sa s
row5 :fsd
row6 :fsd folder

[/quote]

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

paktc

稍有积蓄

论坛徽章:: 0

4楼 [报告]

发表于 2011-01-20 15:55 |只看该作者

本帖最后由 paktc 于 2011-01-20 16:20 编辑

谢谢楼上大侠提供的思路，慢慢消化

靠包含字符串的行号来判断的思路。弄到现在=_=

open READ,"<test.txt" or die "$!";
@all=<READ>;
close READ;
($line,$a,$b)=(0,0,0);
foreach (@all) {
if (/folder/) {$a[$a++]=$line};
if (/size/) {$b[$b++]=$line};
$line++;
}
foreach $a (@a) {
foreach $b (@b) {
($ta,$tb)=($a,$b);
if ($tb<$ta) {($ta,$tb)=($b,$a)};
if (($tb-$ta)<10) {
foreach $line ($ta..$tb) {
print "$line : $all[$line]";
}
print "\n";
}
}
}
<STDIN>;

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

返回列表

Chinaunix › 论坛 › 程序设计 › Perl › 找出10行以内包含两个指定字符串的段落

找出10行以内包含两个指定字符串的段落 [复制链接]

浏览过的版块