论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2015-04-21 23:41 |只看该作者 |倒序浏览

我编的是这样的

生成的数组是这样的

但是得出的结果竟然是这样的

请问哈希那里有什么问题吗？

如何, 统计

文库|博客

程序猿zy

白手起家

论坛徽章:: 0

2楼 [报告]

发表于 2015-04-22 00:22 |只看该作者

回复 1# 驴小兔

if( $_ =~ /^\d+/ ) {
push( @array, $_ )
你这里是把那个文件里以数字开头的一整行当作列表里面的一个元素放进去了，hash计数那里你打印以下那个$_就知道有问题了，你是想统计这一串数字中重复出现的次数？？那个文件里面有很多行这样的数字？？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

104359176

丰衣足食

求职 : 软件工程师

论坛徽章:: 3

3楼 [报告]

发表于 2015-04-22 01:12 |只看该作者

关于输入输出，有很好的模块 File::Slurp，省略了繁冗的文件句柄操作。

对于文件中的数字，可以按照空格拆分。如果要按照正则匹配。要用下面的表达式来匹配小数和整数：

/\d(\.\d+)?/

复制代码

#!perl
use 5.016;
use File::Slurp qw(read_file write_file);
use YAML qw(Dump);
use JSON qw(to_json from_json);
my $text = read_file 'D:/CG_rate.txt';
my @numbers = split /\s+/, $text;
my $count = {};
for (@numbers) { $count->{$_}++ }
say Dump( $count );
write_file('D:/total_gc_rate.txt', to_json($count) );

复制代码

有两个模块要装：

C:\> ppm install File::Slurp
C:\> ppm install YAML

复制代码

JSON 这个模块内置，数据类型可读性较好。建议用这个作为输出。

另外，哈希用标量引用形式，这样保存为外部数据结构时，比较方便。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

驴小兔

白手起家

论坛徽章:: 0

4楼 [报告]

发表于 2015-04-22 09:16 |只看该作者

回复 2# 程序猿zy
原来的是这样的

就是想把所有的数字都放一起统计

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

104359176

丰衣足食

求职 : 软件工程师

论坛徽章:: 3

5楼 [报告]

发表于 2015-04-22 09:48 |只看该作者

本帖最后由 104359176 于 2015-04-22 09:49 编辑

这样的文档就需要用正则匹配了：

my @nums = $text =~ / \d+ (?:\.\d+)? /xmsg;

#!perl
use 5.016;
use File::Slurp qw(read_file write_file);
use YAML qw(Dump);
use JSON qw(to_json from_json);
my $text = read_file 'D:/CG_rate.txt';
my @nums = $text =~ / \d+ (?:\.\d+)? /xmsg;
my $count = {};
for (@nums) { $count->{$_}++ }
say Dump( $count );
write_file('D:/total_gc_rate.txt', to_json($count) );

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

104359176

丰衣足食

求职 : 软件工程师

论坛徽章:: 3

6楼 [报告]

发表于 2015-04-22 10:04 |只看该作者

用 Perl 6 更简洁，因为 Perl 6 内置了数据的结构化显示功能：

use v6;
my $text = 'input.txt'.IO.slurp;
my @nums = $text ~~ m:g/ \d+ [\.\d+]? /;
my %count;
for @nums { %count{$_}++ }
say %count;
'output.txt'.IO.spurt(%count.perl);

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

程序猿zy

白手起家

论坛徽章:: 0

7楼 [报告]

发表于 2015-04-22 21:50 |只看该作者

回复 4# 驴小兔

#!/usr/bin/perl -w

use strict;

my $GC_RATE ;
my @array ;
my %count ;

open $GC_RATE, '<', './a' ;

while( <$GC_RATE> ) {
chomp( $_ ) ;
if( $_ =~ /^\d+/ ) {
      my @tmp_list = split/ /,$_;
      foreach my $tmp_val ( @tmp_list ) {
         $count{$tmp_val}++;
      }
}
}

foreach my $key ( keys %count ) {
print "$key -- $count{$key}\n";
}

close $GC_RATE ;

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

返回列表

Chinaunix › 论坛 › 程序设计 › Perl › 请问如何用哈希统计一个数组中某个词出现的次数

请问如何用哈希统计一个数组中某个词出现的次数 [复制链接]