免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 2048 | 回复: 11
打印 上一主题 下一主题

急求解!!程序不会写 [复制链接]

论坛徽章:
2
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:58:11
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-07-24 21:44 |只看该作者 |倒序浏览
dme-miR-1-3p        1        TGGAATGTAAAGAAGTATGGAG        t0000002_64648        TGGAATGTAAAGAAGTATGGAG        0        +
dme-miR-1-3p        1        TGGAATGTAAAGAAGTATGGA        t0000036_7701        TGGAATGTAAAGAAGTATGGA        0        +
dme-miR-1-3p        1        TGGAATGTAAAGAAGTATGG        t0000154_3349        TGGAATGTAAAGAAGTATGG        0        +
dme-miR-1-3p        1        TGGAATGTAAAGAAGTATG                     t0009606_145        TGGAATGTAAAGAAGTATG        0        +
dme-miR-2a-3p        1        TATCACAGCCAGCTTTGATGA        t0040809_32        TATCACAGCCAGCTTTGATGA        0        +
dme-miR-2a-3p        1        TATCACAGCCAGCTTTGATGAG        t0077517_15        TATCACAGCCAGCTTTGATGAG        0        +
dme-miR-2a-3p        1        TATCACAGCCAGCTTTGATGAGC        t0115229_9        TATCACAGCCAGCTTTGATGAGC        0        +
dme-miR-2a-3p        3        TCACAGCCAGCTTTGATGAGC        t0040804_32        TCACAGCCAGCTTTGATGAGC        0        +
这是文件内容,想要得到的东西:如果第一列内容相同的话,将第三列中如t0000002_64648下划线后的数字取下进行排序,取数字做大的那一行,比如对dme-miR-1-3p来说保留的那一行是dme-miR-1-3p        1        TGGAATGTAAAGAAGTATGGAG        t0000002_64648        TGGAATGTAAAGAAGTATGGAG        0        +

注意:t0040809_32 t0040804_32,这两个下划线后面的数字是最大的,而且相等,如果这种情况的话两行都保留

论坛徽章:
2
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:58:11
2 [报告]
发表于 2012-07-24 22:57 |只看该作者
求大神帮助啊 ~~~~~小弟万分感谢  

论坛徽章:
0
3 [报告]
发表于 2012-07-24 23:13 |只看该作者
albertkingking 发表于 2012-07-24 21:44
dme-miR-1-3p        1        TGGAATGTAAAGAAGTATGGAG        t0000002_64648        TGGAATGTAAAGAAGTATGGAG        0        +
dme-miR-1-3p        1        TGGA ...


试试这个。
  1. #!/usr/bin/perl
  2. use warnings;
  3. use strict;

  4. my %hash;
  5. while ( <DATA> ) {
  6.     chomp;
  7.     my $head = (split /\s+/, $_)[0];
  8.     push @{$hash{$head}}, $_;
  9. }

  10. foreach my $key ( keys %hash ) {
  11.     my @array = sort { $b<=>$a } map { m/_(\d+)/; $1 } @{$hash{$key}};
  12.     my $a = $array[0];
  13.     foreach ( @{$hash{$key}} ) {
  14.         print $_.$/ if /_$a/;
  15.     }
  16. }

  17. __DATA__
  18. dme-miR-1-3p        1        TGGAATGTAAAGAAGTATGGAG        t0000002_64648        TGGAATGTAAAGAAGTATGGAG        0        +
  19. dme-miR-1-3p        1        TGGAATGTAAAGAAGTATGGA        t0000036_7701        TGGAATGTAAAGAAGTATGGA        0        +
  20. dme-miR-1-3p        1        TGGAATGTAAAGAAGTATGG        t0000154_3349        TGGAATGTAAAGAAGTATGG        0        +
  21. dme-miR-1-3p        1        TGGAATGTAAAGAAGTATG                     t0009606_145        TGGAATGTAAAGAAGTATG        0        +
  22. dme-miR-2a-3p        1        TATCACAGCCAGCTTTGATGA        t0040809_32        TATCACAGCCAGCTTTGATGA        0        +
  23. dme-miR-2a-3p        1        TATCACAGCCAGCTTTGATGAG        t0077517_15        TATCACAGCCAGCTTTGATGAG        0        +
  24. dme-miR-2a-3p        1        TATCACAGCCAGCTTTGATGAGC        t0115229_9        TATCACAGCCAGCTTTGATGAGC        0        +
  25. dme-miR-2a-3p        3        TCACAGCCAGCTTTGATGAGC        t0040804_32
复制代码

论坛徽章:
2
CU大牛徽章
日期:2013-04-17 11:46:28CU大牛徽章
日期:2013-04-17 11:46:39
4 [报告]
发表于 2012-07-25 00:10 |只看该作者
  1. do { @x = split; @y = split /_/, $x[3]; push @{$hash{$x[0]}}, [$y[1], @x]; } for <DATA>;
  2. while (($k, $v) = each %hash) {
  3.     @tmp = reverse sort { $a->[0] <=> $b->[0] } @{$v};
  4.     $max = $tmp[0][0];
  5.     do { print join("\t", @{$_}[1..$#$_]), "\n" if ($max == $_->[0]) } for (@tmp);
  6. }
复制代码

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
5 [报告]
发表于 2012-07-25 00:41 |只看该作者
  1. my %data;
  2. my %hash;

  3. map{split;push @{$data{$_[0]." ".substr($_[3],index($_[3],"_")+1)}},$_}<DATA>;
  4. map{if(!$hash{$_->[0]}++){print @{$data{$_->[0]." ".$_->[1]}}}}sort{$a->[0] cmp $b->[0] || $b->[1] <=> $a->[1]}map{[split]}keys %data;


  5. __DATA__
  6. dme-miR-1-3p        1        TGGAATGTAAAGAAGTATGGAG        t0000002_64648        TGGAATGTAAAGAAGTATGGAG        0        +
  7. dme-miR-1-3p        1        TGGAATGTAAAGAAGTATGGA        t0000036_7701        TGGAATGTAAAGAAGTATGGA        0        +
  8. dme-miR-1-3p        1        TGGAATGTAAAGAAGTATGG        t0000154_3349        TGGAATGTAAAGAAGTATGG        0        +
  9. dme-miR-1-3p        1        TGGAATGTAAAGAAGTATG                     t0009606_145        TGGAATGTAAAGAAGTATG        0        +
  10. dme-miR-2a-3p        1        TATCACAGCCAGCTTTGATGA        t0040809_32        TATCACAGCCAGCTTTGATGA        0        +
  11. dme-miR-2a-3p        1        TATCACAGCCAGCTTTGATGAG        t0077517_15        TATCACAGCCAGCTTTGATGAG        0      +
  12. dme-miR-2a-3p        1        TATCACAGCCAGCTTTGATGAGC        t0115229_9        TATCACAGCCAGCTTTGATGAGC        0     +
  13. dme-miR-2a-3p        3        TCACAGCCAGCTTTGATGAGC        t0040804_32        TCACAGCCAGCTTTGATGAGC        0        +
复制代码

论坛徽章:
2
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:58:11
6 [报告]
发表于 2012-07-25 08:42 |只看该作者
回复 3# 午夜凋零
跪谢 大神~~~~~~


   

论坛徽章:
2
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:58:11
7 [报告]
发表于 2012-07-25 08:43 |只看该作者
回复 4# cdtits
跪谢啦~~~  太牛了{:3_200:}


   

论坛徽章:
2
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:58:11
8
发表于 2012-07-25 08:46
回复 5# yinyuemi
都太牛了 ~~~跪谢{:3_201:}


   

论坛徽章:
2
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:58:11
9 [报告]
发表于 2012-07-25 08:55 |只看该作者
回复 5# yinyuemi
太厉害了 {:3_201:} 跪谢~~~~


   

论坛徽章:
0
10 [报告]
发表于 2012-07-25 09:01 |只看该作者
  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;
  4. use Data::Dumper;

  5. my %tmax_of;
  6. my %data_of;
  7. while (<DATA>) {
  8.    my @fields = (split);
  9.    my $tmax_n = (split /_/,$fields[3])[1];
  10.    if (exists $tmax_of{ $fields[0] }) {
  11.            if ( $tmax_n > $tmax_of{ $fields[0] }) {
  12.                    $data_of{ $fields[0] } = [$_];
  13.                    $tmax_of{ $fields[0] } = $tmax_n;
  14.            }
  15.            elsif ($tmax_n == $tmax_of{ $fields[0] }) {
  16.                    push @{ $data_of{ $fields[0] } },$_;
  17.            }
  18.    } else {
  19.        $data_of{ $fields[0] } = [$_];
  20.            $tmax_of{ $fields[0] } = $tmax_n;
  21.    }
  22. }

  23. print Dumper \%tmax_of;
  24. print Dumper \%data_of;


  25. __DATA__
  26. dme-miR-1-3p        1        TGGAATGTAAAGAAGTATGGAG        t0000002_64648        TGGAATGTAAAGAAGTATGGAG        0        +
  27. dme-miR-1-3p        1        TGGAATGTAAAGAAGTATGGA        t0000036_7701        TGGAATGTAAAGAAGTATGGA        0        +
  28. dme-miR-1-3p        1        TGGAATGTAAAGAAGTATGG        t0000154_3349        TGGAATGTAAAGAAGTATGG        0        +
  29. dme-miR-1-3p        1        TGGAATGTAAAGAAGTATG                     t0009606_145        TGGAATGTAAAGAAGTATG        0        +
  30. dme-miR-2a-3p        1        TATCACAGCCAGCTTTGATGA        t0040809_32        TATCACAGCCAGCTTTGATGA        0        +
  31. dme-miR-2a-3p        1        TATCACAGCCAGCTTTGATGAG        t0077517_15        TATCACAGCCAGCTTTGATGAG        0        +
  32. dme-miR-2a-3p        1        TATCACAGCCAGCTTTGATGAGC        t0115229_9        TATCACAGCCAGCTTTGATGAGC        0        +
  33. dme-miR-2a-3p        3        TCACAGCCAGCTTTGATGAGC        t0040804_32        TCACAGCCAGCTTTGATGAGC        0        +
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP