12 / 2 页

论坛徽章:: 307

11楼 [报告]

发表于 2016-08-14 12:13 |只看该作者

本帖最后由 sunzhiguolu 于 2016-08-14 12:48 编辑

回复 6# stanley_tam

#!/usr/bin/perl
use strict;
use warnings;
open (my $FHb, '<', './b');
my (@aChars, %hStat) = ('A' .. 'C');
map {my @aT = split; $hStat{$aT[1]}{$aT[0]}{'Values'} = [@aT[2, -1]]; @{$hStat{$aT[1]}{$aT[0]}}{@aChars} = (0) x 3} <$FHb>;
close ($FHb);
open (my $FHa, '<', './a');
while (defined (local $_ = <$FHa>)){
my @aA = split;
while (my ($sKey, $v) = each %{$hStat{$aA[0]}}){
if ($aA[1] >= $v->{'Values'}->[0] and $aA[1] <= $v->{'Values'}->[-1]){
$hStat{$aA[0]}{$sKey}{$aA[-1]}++;
}
}
}
close ($FHa);
while (my ($id, $v) = each %hStat){
foreach (keys %$v){
my $rh = $hStat{$id}{$_};
print join ("\t", $_, $id, @{$rh->{'Values'}}, @{$rh}{@aChars}), "\n";
}
}

复制代码

perl abc.pl
----------------------------------------------------------------------------
len_2 01    432    452    0    0    1
len_1 01    330    401    1    3    0
len_3 01    500    600    0    3    4

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

sunzhiguolu

巨富豪门

论坛徽章:: 307

12楼 [报告]

发表于 2016-08-14 12:33 |只看该作者

本帖最后由 sunzhiguolu 于 2016-08-14 12:52 编辑

如果只是提取文件 a, b 中某一相关值相等的记录来说, 谁在内, 谁在外应该结果是一样的. 如果要将文件 a 中的每一条记录都对文件 b 进行统计的话, 那就需要与 a 相关联的句柄在外, 与 b 相关联的句柄在内.
是这个意思吗? 请大家指点一下... 谢谢!!!