论坛徽章:: 3

电梯直达

1楼 [收藏(0)] [报告]

发表于 2015-06-10 15:36 |只看该作者 |倒序浏览

刚接触perl
现在编写程序就会简单的
open（）
my %hash
while()
print
close

求高人指点一下面程序！！！先谢过！

问题是：

表1：
chr1 53662616 513
chr1 53662617 524
chr1 53662618 526
chr1 53662619 530
chr1 53662620 530
chr1 53662621 530
chr1 53662622 511
chr3 48895204 3550
chr3 48896063 598
chr3 48896633 1521
chr3 48897059 3438
chr3 48900091 4553

表2：
chr1 CPT2 53662616 53679267
chr2 ACADL 211053685 211089987
chr3 SLC25 48895143 48936227
chr3 ACAD9 128598535 128631450

输出：
chr1 CPT2 XXX YYY
chr2 ACADL XXX YYY
chr3 SLC25A20 XXX YYY
chr3 ACAD9 XXX YYY
XXX：
统计表1中符合条件的个数
条件：表1的第一列和表2的第一列相同，并且表1的第二列在表2的3,4列区间里
YYY：
为符合上述条件的所有表1第三列的加和。

在线求助

文库|博客

54red

稍有积蓄

论坛徽章:: 3

2楼 [报告]

发表于 2015-06-10 15:44 |只看该作者

自己顶一顶

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

54red

稍有积蓄

论坛徽章:: 3

3楼 [报告]

发表于 2015-06-10 16:12 |只看该作者

继续顶

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

104359176

丰衣足食

求职 : 软件工程师

论坛徽章:: 3

4楼 [报告]

发表于 2015-06-10 16:54 |只看该作者

本帖最后由 104359176 于 2015-06-10 17:07 编辑

学生物的弟兄们，Perl 还没让学毕业，就赶鸭子上架干活了，真是同情！

这个要用到这个特性：

Extracting a Range of Lines
#-----------------------------
while (<>) {
if (/BEGIN PATTERN/ .. /END PATTERN/) {
# line falls between BEGIN and END in the
# text, inclusive.
}
}
while (<>) {
if ($FIRST_LINE_NUM .. $LAST_LINE_NUM) {
# operate only between first and last line, inclusive.
}
}
#-----------------------------
while (<>) {
if (/BEGIN PATTERN/ ... /END PATTERN/) {
# line is between BEGIN and END on different lines
}
}
while (<>) {
if ($FIRST_LINE_NUM ... $LAST_LINE_NUM) {
# operate only between first and last line, but not same
}
}
#-----------------------------
# command-line to print lines 15 through 17 inclusive (see below)
perl -ne 'print if 15 .. 17' datafile
# print out all <XMP> .. </XMP> displays from HTML doc
while (<>) {
print if m#<XMP>#i .. m#</XMP>#i;
}
# same, but as shell command
# perl -ne 'print if m#<XMP>#i .. m#</XMP>#i' document.html
#-----------------------------
# perl -ne 'BEGIN { $top=3; $bottom=5 } print if $top .. $bottom' /etc/passwd # previous command FAILS
# perl -ne 'BEGIN { $top=3; $bottom=5 } \
# print if $. == $top .. $. == $bottom' /etc/passwd # works
# perl -ne 'print if 3 .. 5' /etc/passwd # also works
#-----------------------------
print if /begin/ .. /end/;
print if /begin/ ... /end/;
#-----------------------------
while (<>) {
$in_header = 1 .. /^$/;
$in_body = /^$/ .. eof();
}
#-----------------------------
%seen = ();
while (<>) {
next unless /^From:?\s/i .. /^$/;
while (/([^<>(),;\s]+\@[^<>(),;\s]+)/g) {
print "$1\n" unless $seen{$1}++;
}
}
#-----------------------------

复制代码

这是一个教程：

perlexample.chm (347.96 KB, 下载次数: 4)

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

104359176

丰衣足食

求职 : 软件工程师

论坛徽章:: 3

5楼 [报告]

发表于 2015-06-10 18:03 |只看该作者

#!perl
use 5.016;
# 这个模块是为了把多个外置文本放在一个文件中
use Inline::Files;
use List::Util qw(reduce sum);
# 用内嵌文本是为了演示，实际中请使用外置文本
# my @table_one = read_file $file;
# 并加载 File::Slurp 模块
my $table_one = table_array(<TABLEONE>);
my $table_two = table_array(<TABLETWO>);
foreach my $line (@$table_two) {
my $item = $line->[0];
my $from = $line->[2];
my $to = $line->[3];
my ($xxx, $yyy) = filter_data($table_one, $item, $from, $to);
say "$item $line->[1] $xxx $yyy";
}
sub filter_data {
my ($data, $item, $from, $to) = @_;
my @result;
foreach my $line (@$data) {
next unless $line->[0] eq $item;
if ( +$line->[1] >= $from and +$line->[1] <= $to ) {
# say $line->[2];
push @result, $line->[2];
}
}
my $xxx = scalar @result;
# my $yyy = reduce { $a + $b } @result;
my $yyy = sum @result;
return ($xxx, $yyy);
}
sub table_array {
my @table = @_;
my @array;
foreach my $line (@table) {
next if $line =~ /^$/;
push @array, [ split(/\s+/, $line) ];
}
return [ @array ];
}
__TABLEONE__
chr1 53662616 513
chr1 53662617 524
chr1 53662618 526
chr1 53662619 530
chr1 53662620 530
chr1 53662621 530
chr1 53662622 511
chr3 48895204 3550
chr3 48896063 598
chr3 48896633 1521
chr3 48897059 3438
chr3 48900091 4553
__TABLETWO__
chr1 CPT2 53662616 53679267
chr2 ACADL 211053685 211089987
chr3 SLC25 48895143 48936227
chr3 ACAD9 128598535 128631450

复制代码

output:

chr1 CPT2 7 3664
chr2 ACADL 0
chr3 SLC25 5 13660
chr3 ACAD9 0

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

54red

稍有积蓄

论坛徽章:: 3

6楼 [报告]

发表于 2015-06-11 09:37 |只看该作者

真不知道如何感谢你了，

！刚用了几天perl,确实很好用，可惜我写的太烂了，只能边做边学了，再次谢谢啦！回复 5# 104359176

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

sunzhiguolu

巨富豪门

论坛徽章:: 307

7楼 [报告]

发表于 2016-09-15 11:24 |只看该作者

#!/usr/bin/perl
use strict;
use warnings;
my (%hStat, %hData);
while (<>){
my @aList = split;
my $id = splice (@aList, 0, 1);
if (@ARGV){
push (@{$hStat{$id}}, [@aList]);
@{$hData{$id}{$aList[0]}}{"Cnt", "Sum"} = (0) x 2;
next;
}
my $ra = $hStat{$id};
next unless ($ra);
for (@$ra){
if ($_->[1] <= $aList[0] and $_->[-1] >= $aList[0]){
$hData{$id}{$_->[0]}{"Cnt"}++;
$hData{$id}{$_->[0]}{"Sum"} += $aList[-1];
}
}
}
foreach my $id (sort keys %hData){
print join ("\t", $id, $_, @{$hData{$id}{$_}}{"Cnt", "Sum"}), "\n" for keys %{$hData{$id}};
}

复制代码

perl abc.pl b a
--------------------------------------------------------
chr1 CPT2 7    3664
chr2 ACADL 0    0
chr3 SLC25 5    13660
chr3 ACAD9 0    0

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

华小飞_Perl

稍有积蓄

论坛徽章:: 0

8楼 [报告]

发表于 2016-09-16 07:30 |只看该作者

问一下，不是太明白，每条统计的都是针对同一条染色体而言的吗？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

返回列表

Chinaunix › 论坛 › 程序设计 › Perl › 新手在线求助！比较两个文件符合条件的输出到第三个文件 ...

新手在线求助！比较两个文件符合条件的输出到第三个文件。 [复制链接]