论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2005-12-25 17:00 |只看该作者 |倒序浏览

#! /bin/perl
%occurrence = ("sum" => 0, "a" => 0, "b" => 0, "c" => 0, "d" => 0,
"e" => 0, "f" => 0, "g" => 0, "h" => 0, "i" => 0,
"j" => 0, "k" => 0, "l" => 0, "m" => 0, "n" => 0);
open TEXT, "/root/test.txt"
or die "Can't open file!";
while (<TEXT>){
chomp;
if (/a/gi) {
$occurrence{"a"}++;
$occurrence{"sum"}++;
}
}
foreach (sort keys %occurrence){
print "$_ : $occurrence{$_}\n";
}

复制代码

test.txt如下:
aa
输出为a => 1; sum =>1;

上面这个程序的问题就是:如果一行里面有许多a, 程序仍然只讲a的occurrence加1?
请问这个应该怎么解决?然后就是我怎么才能计算所有英文字符的总出现率?

谢谢了!

文库|博客

angelanpan

丰衣足食

论坛徽章:: 0

2楼 [报告]

发表于 2005-12-25 17:15 |只看该作者

好像问题很多,或者说是思路完全错了
请教各位高手

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

angelanpan

丰衣足食

论坛徽章:: 0

3楼 [报告]

发表于 2005-12-25 17:46 |只看该作者

#! /bin/perl

my %occurrence = ("sum" => 0, "a" => 0, "b" => 0, "c" => 0, "d" => 0,
               "e" => 0, "f" => 0, "g" => 0, "h" => 0, "i" => 0,
            "j" => 0, "k" => 0, "l" => 0, "m" => 0, "n" => 0);

#while ( ($key, $value) = each %occurrence){
# print "$key => $value\n";
#}

open TEXT, "d:/test.txt"
  or die "Can't open file!";
while (<TEXT>){
chomp;
$_ = lc($_);
$_ =~ s/[\W]//gi;
my $len = length($_);
$occurrence{"sum"} = $occurrence{"sum"} + $len;
foreach my $i (split//,$_){
if ($i ge "a" and $i le "n"){
$occurrence{$i}++;
}
};
}

foreach (sort keys %occurrence){
print "$_ : $occurrence{$_}\n";
}

这个好像就可以了
统计所有英文字符出现次数, 同时计算a到n所有字符出现次数,忽略大小写

[ 本帖最后由 angelanpan 于 2005-12-25 18:08 编辑 ]

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

兰花仙子

版主

论坛徽章:: 0

4楼 [报告]

发表于 2005-12-25 17:51 |只看该作者

[web01@admin ~/angelflower/tmp]$ cat 1.txt
afsafdf
dfdfdf
eejfjnfdsfm
dfdjifjdf
eeffhhh
zvmmvww

[web01@admin ~/angelflower/tmp]$ cat 1.pl
#!/usr/bin/perl
use strict;

my %tmp;
open (HD,"1.txt") or die "$!";

map { $tmp{$_}++; $tmp{sum}++ }
map { chomp; split //,$_ } <HD>;

close HD;

print "$_: $tmp{$_}\n"
foreach (sort { $tmp{$b} <=> $tmp{$a} } keys %tmp);

[web01@admin ~/angelflower/tmp]$ perl 1.pl
sum: 47
f: 14
d: 8
e: 4
j: 4
m: 3
h: 3
w: 2
a: 2
v: 2
s: 2
n: 1
z: 1
i: 1

这是偶以前测试时写着玩的，你看看是否有用？