免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2608 | 回复: 6
打印 上一主题 下一主题

请大神帮忙排序 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-03-26 16:52 |只看该作者 |倒序浏览
本帖最后由 WK_520 于 2015-03-26 17:01 编辑

BINCODE        NAME        IDENTIFIER
'-1'        'root'        ''
'0'        'control genes'        ''
'1'        'PS'        'ppa009265m|pacid:17641533'
'1.1'        'PS.lightreaction'        ''
'1.1.1'        'PS.lightreaction.photosystem II'        ''
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa009686m|pacid:17641930'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa010511m|pacid:17644122'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa010195m|pacid:17665741'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa010078m|pacid:17641248'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa014980m|pacid:17656163'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa010039m|pacid:17646256'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa008546m|pacid:17642695'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa010015m|pacid:17648027'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa010081m|pacid:17661637'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa010291m|pacid:17642644'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa009987m|pacid:17655949'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa009903m|pacid:17655203'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa009496m|pacid:17650143'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa010066m|pacid:17641455'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa010034m|pacid:17653895'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa010099m|pacid:17652474'
1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa009110m|pacid:17643985'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa010035m|pacid:17665308'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa022268m|pacid:17644652'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa013107m|pacid:17656005'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa010370m|pacid:17647855'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa010884m|pacid:17644160'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa010093m|pacid:17649202'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa017854m|pacid:17658704'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa011900m|pacid:17655232'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa010690m|pacid:17655666'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa009670m|pacid:17644863'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa011543m|pacid:17645369'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa011707m|pacid:17666788'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa012425m|pacid:17642756'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa009763m|pacid:17644064'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa011914m|pacid:17657816'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa012039m|pacid:17665577'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa011725m|pacid:17663445'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa012196m|pacid:17642400'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa013648m|pacid:17668379'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa011482m|pacid:17645368'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa012535m|pacid:17653141'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa009525m|pacid:17656305'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa008420m|pacid:17652278'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa010606m|pacid:17640734'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa012823m|pacid:17640344'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa009933m|pacid:17645272'
'1.1.1.3'        'PS.lightreaction.photosystem II.biogenesis'        ''
'1.1.1.4'        'PS.lightreaction.photosystem II.LHC biogenesis'        ''
'1.1.2'        'PS.lightreaction.photosystem I'        ''
'1.1.2.1'        'PS.lightreaction.photosystem I.LHC-I'        'ppa011981m|pacid:17647861'
'1.1.2.1'        'PS.lightreaction.photosystem I.LHC-I'        'ppb013740m|pacid:17649934'
'1.1.2.2'        'PS.lightreaction.photosystem I.PSI polypeptide subunits'        'ppa012567m|pacid:17664043'
'1.1.2.2'        'PS.lightreaction.photosystem I.PSI polypeptide subunits'        'ppa011229m|pacid:17662551'
'1.1.2.2'        'PS.lightreaction.photosystem I.PSI polypeptide subunits'        'ppa010953m|pacid:17662037'
'1.1.2.2'        'PS.lightreaction.photosystem I.PSI polypeptide subunits'        'ppa012923m|pacid:17649658'
'1.1.2.2'        'PS.lightreaction.photosystem I.PSI polypeptide subunits'        'ppa013021m|pacid:17648127'
'1.1.2.2'        'PS.lightreaction.photosystem I.PSI polypeptide subunits'        'ppa012362m|pacid:17643910'
有这么一个文件,手头还有一组ID,格式如下:
ppa009110m
ppa010015m
ppa010511m
ppa011914m
ppa009670m
ppa012039m
......

前3个ID属于'1.1.1.1',后3个属于'1.1.1.2'。能否根据ID的顺序调整它们所在行在文件中的位置。即达到这样的效果:
BINCODE        NAME        IDENTIFIER
'-1'        'root'        ''
'0'        'control genes'        ''
'1'        'PS'        'ppa009265m|pacid:17641533'
'1.1'        'PS.lightreaction'        ''
'1.1.1'        'PS.lightreaction.photosystem II'        ''
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa009686m|pacid:17641930'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa010511m|pacid:17644122'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa010195m|pacid:17665741'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa010078m|pacid:17641248'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa014980m|pacid:17656163'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa010039m|pacid:17646256'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa008546m|pacid:17642695'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa010081m|pacid:17661637'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa010291m|pacid:17642644'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa009987m|pacid:17655949'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa009903m|pacid:17655203'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa009496m|pacid:17650143'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa010066m|pacid:17641455'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa010034m|pacid:17653895'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa010099m|pacid:17652474'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa009110m|pacid:17643985'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa010015m|pacid:17648027'
'1.1.1.1'        'PS.lightreaction.photosystem II.LHC-II'        'ppa010511m|pacid:17644122'

'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa022268m|pacid:17644652'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa013107m|pacid:17656005'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa010370m|pacid:17647855'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa010884m|pacid:17644160'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa010093m|pacid:17649202'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa017854m|pacid:17658704'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa011900m|pacid:17655232'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa010690m|pacid:17655666'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa011543m|pacid:17645369'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa011707m|pacid:17666788'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa012425m|pacid:17642756'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa009763m|pacid:17644064'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa011725m|pacid:17663445'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa012196m|pacid:17642400'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa013648m|pacid:17668379'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa011482m|pacid:17645368'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa012535m|pacid:17653141'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa009525m|pacid:17656305'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa008420m|pacid:17652278'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa010606m|pacid:17640734'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa012823m|pacid:17640344'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa009933m|pacid:17645272'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa011914m|pacid:17657816'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa009670m|pacid:17644863'
'1.1.1.2'        'PS.lightreaction.photosystem II.PSII polypeptide subunits'        'ppa012039m|pacid:17665577'

'1.1.1.3'        'PS.lightreaction.photosystem II.biogenesis'        ''
'1.1.1.4'        'PS.lightreaction.photosystem II.LHC biogenesis'        ''
'1.1.2'        'PS.lightreaction.photosystem I'        ''
'1.1.2.1'        'PS.lightreaction.photosystem I.LHC-I'        'ppa011981m|pacid:17647861'
'1.1.2.1'        'PS.lightreaction.photosystem I.LHC-I'        'ppb013740m|pacid:17649934'
'1.1.2.2'        'PS.lightreaction.photosystem I.PSI polypeptide subunits'        'ppa012567m|pacid:17664043'
'1.1.2.2'        'PS.lightreaction.photosystem I.PSI polypeptide subunits'        'ppa011229m|pacid:17662551'
'1.1.2.2'        'PS.lightreaction.photosystem I.PSI polypeptide subunits'        'ppa010953m|pacid:17662037'
'1.1.2.2'        'PS.lightreaction.photosystem I.PSI polypeptide subunits'        'ppa012923m|pacid:17649658'
'1.1.2.2'        'PS.lightreaction.photosystem I.PSI polypeptide subunits'        'ppa013021m|pacid:17648127'
'1.1.2.2'        'PS.lightreaction.photosystem I.PSI polypeptide subunits'        'ppa012362m|pacid:17643910'
我的思路是ID匹配所在行添加在相应的BINCODE后面,自己尝试了一下,总是报错。还是请大神出手相助。

论坛徽章:
7
戌狗
日期:2013-12-15 20:43:38技术图书徽章
日期:2014-03-05 01:33:12技术图书徽章
日期:2014-03-15 20:31:17未羊
日期:2014-03-25 23:48:20丑牛
日期:2014-04-07 22:37:44巳蛇
日期:2014-04-11 21:58:0915-16赛季CBA联赛之青岛
日期:2016-03-17 20:36:13
2 [报告]
发表于 2015-03-27 02:24 |只看该作者
shishi:
  1. #!/usr/bin/perl

  2. open my $id,      '/tmp/id';
  3. open my $bincode, '/tmp/bincode';
  4. print scalar <$bincode>;

  5. my %id = map { chomp; $_, $a++ } <$id>;
  6. my $BIN = '\(^oo^)/';
  7. my @it;

  8. sub Print {
  9.     print $_->[1] for sort { $id{ $a->[0] } <=> $id{ $b->[0] } } @_;
  10. }

  11. while (<$bincode>) {
  12.     my ( $bin, undef, $id ) = split /'\s+/;

  13.     # for line: 23 < 1.1.1.1' <==> '1.1.1.1' >
  14.     $bin = "'" . $bin if "'" ne substr $bin, 0, 1;
  15.     ($id) = $id =~ /(\w+)/;

  16.     Print splice @it if $BIN ne $bin and @it;
  17.     $BIN = $bin;
  18.     exists $id{ $id || $" } ? push @it, [ $id, $_ ] : print;
  19. }

  20. Print @it;
复制代码

论坛徽章:
0
3 [报告]
发表于 2015-03-27 09:13 |只看该作者
回复 2# rubyish


    代码风格一点没变啊

论坛徽章:
0
4 [报告]
发表于 2015-03-27 15:09 |只看该作者
rubyish 发表于 2015-03-27 02:24
shishi:


非常感谢,您完美地解决了我的问题!你上代码的速度和质量让我非常钦佩!!!我在这里求助,一是自己目前学习perl的阶段还不能够解决这个问题;另外也是知道这里高手如云,学习一下。能否对以上的代码进行简单的注释,实在是看不懂;推荐一本书能够看懂你写的这些代码。再次感谢。

论坛徽章:
30
申猴
日期:2014-04-10 09:43:532015年亚洲杯纪念徽章
日期:2015-03-20 14:40:232015亚冠之阿尔纳斯尔
日期:2015-06-02 18:59:042015亚冠之阿尔希拉尔
日期:2015-06-30 15:22:572015亚冠之大阪钢巴
日期:2015-07-20 10:44:332015亚冠之阿尔纳斯尔
日期:2015-10-28 14:57:5215-16赛季CBA联赛之新疆
日期:2015-12-25 10:18:45黑曼巴
日期:2016-06-26 21:39:5315-16赛季CBA联赛之山西
日期:2016-07-25 21:54:2715-16赛季CBA联赛之北京
日期:2016-10-27 12:07:2315-16赛季CBA联赛之八一
日期:2017-07-07 16:39:0915-16赛季CBA联赛之吉林
日期:2017-09-04 12:14:43
5 [报告]
发表于 2015-03-27 15:10 |只看该作者
  1. awk -F "[|' ]+" 'FNR==NR{a[$0]++;b[++c]=$0;next}{if($2~/.\..\..\../&&NR==7) {p=$2;next} if ($2==p) {print $0}if(a[$(NF-2)]) {d[$(NF-2)]=$0}   if($2!=p&&$2~/.\..\..\../) {for (i=1;i<=c;i++) {print d[b[i]]} print $0; p=$2;delete d;}  if($2!~/.\..\..\../) {print $0}}' id.txt file | sed '/^$/d'
复制代码
回复 1# WK_520 上个awk的


   

论坛徽章:
7
戌狗
日期:2013-12-15 20:43:38技术图书徽章
日期:2014-03-05 01:33:12技术图书徽章
日期:2014-03-15 20:31:17未羊
日期:2014-03-25 23:48:20丑牛
日期:2014-04-07 22:37:44巳蛇
日期:2014-04-11 21:58:0915-16赛季CBA联赛之青岛
日期:2016-03-17 20:36:13
6 [报告]
发表于 2015-03-30 05:14 |只看该作者
回复 3# kk861123



   

论坛徽章:
7
戌狗
日期:2013-12-15 20:43:38技术图书徽章
日期:2014-03-05 01:33:12技术图书徽章
日期:2014-03-15 20:31:17未羊
日期:2014-03-25 23:48:20丑牛
日期:2014-04-07 22:37:44巳蛇
日期:2014-04-11 21:58:0915-16赛季CBA联赛之青岛
日期:2016-03-17 20:36:13
7 [报告]
发表于 2015-03-30 05:17 |只看该作者
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP