免费注册	查看新帖 \|


平台论坛博客文库

› 论坛 › 程序设计 › Perl › 大家帮忙解决个问题，谢谢

12 / 2 页下一页

最近访问板块

发新帖

查看: 6916 | 回复: 11

上一主题

下一主题

大家帮忙解决个问题，谢谢 [复制链接]

论坛徽章:: 0

电梯直达

跳转到指定楼层

1楼 [收藏(0)] [报告]

发表于 2013-08-21 19:18 |只看该作者 |倒序浏览

A文件：
ENST00000369829 ENSG00000213366
ENST00000598454 ENSG00000224699
ENST00000448586 ENSG00000224246
ENST00000522182 ENSG00000034677
ENST00000371910 ENSG00000160323
ENST00000491059 ENSG00000136883
ENST00000559981 ENSG00000054690
ENST00000553993 ENSG00000258905
ENST00000511269 ENSG00000196104
ENST00000522231 ENSG00000029534

B文件：
chr10 100007446    100028007    ENST00000260702 273
chr10 100011779    100016332    ENST00000433374 75
chr10 100143321    100171634    ENST00000483923 390
chr10 100143321    100174941    ENST00000370575 429
chr10 100146957    100148193    ENST00000464808 59
chr10 100154974    100155064    ENST00000408492 2
chr10 100173704    100174815    ENST00000494941 27
chr10 100173923    100174915    ENST00000462874 25
chr10 100175954    100206667    ENST00000361490 468
chr10 100175954    100206683    ENST00000325103 468
我把A文件的第一列作为hash1的keys，第二列作为hash1的value；B文件的第四列作为hash2的keys，第五列作为hash2的value，我的目的是hash2的keys用hash1的value替换，并且把对应相同hash1 value的hash2 keys进行合并，也就是相应的hash2 value相加，怎么做？我做的时候是把hash2的keys循环两次，对应的ENSG号相同就把它们的值相加，然后删除一个，但是总是会提示相加的等式中有为初始化的值，而且有1万多个keys，循环两次需要很长时间，虽然是用服务器跑的，估计也很慢。谢谢

文库|博客

论坛徽章:: 8

技术图书徽章
日期:2013-09-30 08:51:28

技术图书徽章
日期:2013-12-11 09:26:39

白羊座
日期:2013-12-27 15:27:13

金牛座
日期:2014-01-06 09:13:05

天蝎座
日期:2014-01-21 14:23:28

酉鸡
日期:2014-05-09 16:51:12

卯兔
日期:2014-08-11 16:49:15

15-16赛季CBA联赛之八一
日期:2017-08-14 23:24:57

2楼 [报告]

发表于 2013-08-21 20:04 |只看该作者

看了半天好绕····是不是意思说B文件中ENST号，有相同的？你可以先把B文件处理下···

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

3楼 [报告]

发表于 2013-08-21 20:15 |只看该作者

不是，ENST号和ENSG号是关联的，一个ENST号对应一个ENSG号，但是有可能多个ENST号对应一个ENSG号，我的目的是把B中ENST号用ENSG号替换后，把ENSG号相同的整合成一个，也就是对应的value相加

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

4楼 [报告]

发表于 2013-08-21 20:16 |只看该作者

回复 2# xiumu2280

不是，ENST号和ENSG号是关联的，一个ENST号对应一个ENSG号，但是有可能多个ENST号对应一个ENSG号，我的目的是把B中ENST号用ENSG号替换后，把ENSG号相同的整合成一个，也就是对应的value相加

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 8

技术图书徽章
日期:2013-09-30 08:51:28

技术图书徽章
日期:2013-12-11 09:26:39

白羊座
日期:2013-12-27 15:27:13

金牛座
日期:2014-01-06 09:13:05

天蝎座
日期:2014-01-21 14:23:28

酉鸡
日期:2014-05-09 16:51:12

卯兔
日期:2014-08-11 16:49:15

15-16赛季CBA联赛之八一
日期:2017-08-14 23:24:57

5楼 [报告]

发表于 2013-08-21 20:16 |只看该作者

本帖最后由 xiumu2280 于 2013-08-21 20:22 编辑

#!/usr/bin/perl
use strict;
use warnings;
open (IN,"B");
my %hash_b;
while (<IN>) {
chomp;
my @line_b = split /\t/,$_;
push @{$hash_b{$line_b[3]}},$line_b[-1];
}
close IN;
open (IN1,"A");
while (<IN1>) {
chomp;
my $line = $_;
my @line_a = split /\t/,$line;
my $n = 0;
if ($hash_b{$line_a[1]}) {
foreach my $value (@{$hash_b{$line_a[0]}}) {
$n = $value+$n;
}
print "$line\t$n\n";
}else{
print "$line\n"；
}
}

复制代码

楼主你试试这个，我现在没有环境，这个没测试 ···
其实你低估服务器的能力了···
那这个不对了···我在写写看

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 8

技术图书徽章
日期:2013-09-30 08:51:28

技术图书徽章
日期:2013-12-11 09:26:39

白羊座
日期:2013-12-27 15:27:13

金牛座
日期:2014-01-06 09:13:05

天蝎座
日期:2014-01-21 14:23:28

酉鸡
日期:2014-05-09 16:51:12

卯兔
日期:2014-08-11 16:49:15

15-16赛季CBA联赛之八一
日期:2017-08-14 23:24:57

6楼 [报告]

发表于 2013-08-21 20:24 |只看该作者

ENST号也是无重复的吧回复 5# jin978347005

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

7楼 [报告]

发表于 2013-08-21 20:26 |只看该作者

回复 6# xiumu2280

嗯，没有重复

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 8

技术图书徽章
日期:2013-09-30 08:51:28

技术图书徽章
日期:2013-12-11 09:26:39

白羊座
日期:2013-12-27 15:27:13

金牛座
日期:2014-01-06 09:13:05

天蝎座
日期:2014-01-21 14:23:28

酉鸡
日期:2014-05-09 16:51:12

卯兔
日期:2014-08-11 16:49:15

15-16赛季CBA联赛之八一
日期:2017-08-14 23:24:57

8楼 [报告]

发表于 2013-08-21 20:39 |只看该作者

#!/usr/bin/perl
use strict;
use warnings;
open (IN,"a");
my %hash_a;
########取其中SG号相同的ST号的合集
while (<IN>) {
chomp;
my @line_a = split /\t/,$_;
push @{$hash_a{$line_a[1]}},$line_a[0];
}
close IN;
########对B文件建立HASH
open (IN1,"b");
my %hash_b;
while (<IN1>) {
chomp;
my @line_b = split /\t/,$_;
$hash_b{$line_b[-2]} = $line_b[-1];
}
close IN1;
########进行遍历输出
foreach my $key (keys %hash_a) {
my $n = 0;
foreach my $key1 (@{$hash_a{$key}}) {
$n = $hash_b{$key1} + $n;
}
print "$key:$n\n";
}

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 7

戌狗
日期:2013-12-15 20:43:38

技术图书徽章
日期:2014-03-05 01:33:12

技术图书徽章
日期:2014-03-15 20:31:17

未羊
日期:2014-03-25 23:48:20

丑牛
日期:2014-04-07 22:37:44

巳蛇
日期:2014-04-11 21:58:09

15-16赛季CBA联赛之青岛
日期:2016-03-17 20:36:13

9楼 [报告]

发表于 2013-08-21 21:02 |只看该作者

本帖最后由 rubyish 于 2013-08-21 17:19 编辑

试试这个:

#!/usr/bin/perl
open my $A, 'a';
open my $B, 'b';
my ( %A, %B ) = map split, <$A>;
while (<$B>) {
my ( $k, $v ) = (split)[ -2, -1 ];
$B{ $A{$k} } += $v;
}
print join( "\t", $_, $B{$_} ) . $/ for keys %B;

复制代码

a:
A a
B b
C c
D a
b:
1 2 3 A 12
1 2 3 A 11
2 3 4 B 2
3 4 5 B 3
1 1 1 C 5
1 2 3 C 5
2 2 3 D 5
result:
a 28
b 5
c 10

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

10楼 [报告]

发表于 2013-08-21 21:18 |只看该作者

回复 8# xiumu2280
谢谢，可以

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

12 / 2 页下一页

发新帖

Chinaunix › 论坛 › 程序设计 › Perl › 大家帮忙解决个问题，谢谢

北京盛拓优讯信息技术有限公司. 版权所有京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号：11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员联系我们：huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP