12 / 2 页下一页

perl hash实现文件内容合并 [复制链接]

小鬼啊不小鬼啊不当前离线禁止发言好友博客消息论坛徽章: 0	电梯直达 1楼 [收藏(0)] [报告] 发表于 2015-09-08 21:44 \|只看该作者 \|倒序浏览提示: 作者被禁止或删除内容自动屏蔽
小鬼啊不小鬼啊不当前离线禁止发言好友博客消息论坛徽章: 0	文库\|博客使用正则表达式与lex实现词法分析器 C语言的MIPS汇编实现（四）SWITCH Requested init /linuxrc failed (error -2). 比较 csv 文件中数据差异 LMD ElPack v2019.7新版亮点：Transparent mode全新升级\|附下载

jason680

富可敌国

论坛徽章:: 145

2楼 [报告]

发表于 2015-09-09 10:30 |只看该作者

http://bbs.chinaunix.net/thread-4183582-1-1.html

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

815138698

白手起家

论坛徽章:: 0

3楼 [报告]

发表于 2015-09-09 14:11 |只看该作者

回复 1# 小鬼啊不

如果只是解决题目，按照name列来写简单点，
LZ的本意应该是按照start end列的关系来解决
按照name列规则写个，嘎嘎~~~

#!/usr/bin/perl -w

my %hash;
while(<DATA>){
chomp;
my ($number,$start,$end,$name)=split;
if(!exists $hash{$number}{$name} ){
$hash{$number}{$name}=[$start,$end];
}
else{
$start<$hash{$number}{$name}[0] ? $hash{$number}{$name}[0]=$start:0;
$end>$hash{$number}{$name}[1] ? $hash{$number}{$name}[1]=$end:0;
}
}

print "Number    start    end       name \n";

foreach $number(sort {$a cmp $b} (keys %hash)){
foreach $name(sort {$hash{$number}{$a}[0] <=> $hash{$number}{$b}[0]} (keys $hash{$number})){
printf "%s%10s%10s%10s\n",$number,$hash{$number}{$name}[0],$hash{$number}{$name}[1],$name;
}
}

__DATA__
NO.1       1    10       wf
NO.1       11    22       wf
NO.1       29    38       cz
NO.1       39    51       cz
NO.1       52    60       cz
NO.2       2    9          gx
NO.2       10    22       gx
NO.2       23    40       gx

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

ba_du_co

白手起家

论坛徽章:: 0

4楼 [报告]

发表于 2015-09-09 15:45 |只看该作者

类似于这样

use 5.010;
say join "\t", split /\s+/, <DATA>;
my @data = split /\s+/, <DATA>;
while (<DATA>) {
my @nusten = split;
$data[2] = $nusten[2], next if $nusten[-1] eq $data[-1];
say join "\t", @data;
@data = @nusten;
}
say join "\t", @data;
__DATA__
Number start end name
NO.1 1 10 wf
NO.1 11 22 wf
NO.1 29 38 cz
NO.1 39 51 cz
NO.1 52 60 cz
NO.2 2 9 gx
NO.2 10 22 gx
NO.2 23 40 gx

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

kggg

丰衣足食

论坛徽章:: 0

5楼 [报告]

发表于 2015-09-10 15:28 |只看该作者

回复 4# ba_du_co

这一句怎么理解
$data[2] = $nusten[2], next if $nusten[-1] eq $data[-1];

中间的逗号有什么作用？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

MMMIX

广告杀手

论坛徽章:: 95

6楼 [报告]

发表于 2015-09-10 15:36 |只看该作者

kggg 发表于 2015-09-10 15:28
回复 4# ba_du_co
$data[2] = $nusten[2], next if $nusten[-1] eq $data[-1];

等价于

if ($nusten[-1] eq $data[-1]) {
$data[2] = $nusten[2];
next;
}

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

kggg

丰衣足食

论坛徽章:: 0

7楼 [报告]

发表于 2015-09-10 16:09 |只看该作者

回复 6# MMMIX

谢谢，很少这样用。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

MMMIX

广告杀手

论坛徽章:: 95

8楼 [报告]

发表于 2015-09-10 16:12 |只看该作者

回复 7# kggg

最好永远都别那么用。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

kggg

丰衣足食

论坛徽章:: 0

9楼 [报告]

发表于 2015-09-10 16:25 |只看该作者

回复 8# MMMIX

修改一下，当数字不是按顺序由小到大时。

#!/usr/bin/perl

use 5.010;
say join "\t", split /\s+/, <DATA>;
my @data = split /\s+/, <DATA>;

while (<DATA>) {
my @nusten = split;
if($nusten[-1] eq $data[-1]){
      if( $nusten[1] < $data[1]){
            $data[1] = $nusten[1];
      }
      if( $nusten[2] > $data[2]){
            $data[2] = $nusten[2];
      }
      next;
}
say join "\t", @data;
@data = @nusten;
}

say join "\t", @data;

__DATA__
Number    start end       name
NO.1       1    10       wf
NO.1       11    22       wf
NO.1       29    38       cz
NO.1       39    51       cz
NO.1       52    60       cz
NO.2       2    9          gx
NO.2       10    22       gx
NO.2       23    40       gx
NO.2       23    90       gx
NO.2       23    40       cx
NO.2       23    30       cx

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

鉩中心思想

白手起家

论坛徽章:: 0

10楼 [报告]

发表于 2015-09-15 10:19 |只看该作者

看不懂～～～～～～·

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

12 / 2 页下一页

返回列表

Chinaunix › 论坛 › 程序设计 › Perl › perl hash实现文件内容合并

小鬼啊不小鬼啊不当前离线禁止发言好友博客消息论坛徽章: 0	电梯直达 1楼 [收藏(0)] [报告] 发表于 2015-09-08 21:44 \|只看该作者 \|倒序浏览提示: 作者被禁止或删除内容自动屏蔽
小鬼啊不小鬼啊不当前离线禁止发言好友博客消息论坛徽章: 0	文库\|博客使用正则表达式与lex实现词法分析器 C语言的MIPS汇编实现（四）SWITCH Requested init /linuxrc failed (error -2). 比较 csv 文件中数据差异 LMD ElPack v2019.7新版亮点：Transparent mode全新升级\|附下载