免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 5183 | 回复: 21
打印 上一主题 下一主题

根据数据列数分组,脚本求助 [复制链接]

论坛徽章:
2
15-16赛季CBA联赛之浙江
日期:2016-04-26 14:03:26程序设计版块每日发帖之星
日期:2016-04-29 06:20:00
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2016-05-03 09:39 |只看该作者 |倒序浏览
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
2 [报告]
发表于 2016-05-03 09:53 |只看该作者
回复 1# YQ_Liu
请问你的这个文本的排序有什么规则吗, 没看懂. (理解能力比较弱)

   

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
3 [报告]
发表于 2016-05-03 09:58 |只看该作者
回复 1# YQ_Liu
好了好了, 似乎看懂了.

   

论坛徽章:
2
15-16赛季CBA联赛之浙江
日期:2016-04-26 14:03:26程序设计版块每日发帖之星
日期:2016-04-29 06:20:00
4 [报告]
发表于 2016-05-03 11:23 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
5 [报告]
发表于 2016-05-03 11:54 |只看该作者
回复 1# YQ_Liu
  1. my $hash = {};
  2. my $hash_key;
  3. my $hash_value = [];
  4. my $group;

  5. while(<DATA>){
  6.         chomp;
  7.         s/^\s+//g;
  8.         next unless length;
  9.        
  10.         my @cols = split;
  11.         if(/NP/){
  12.                 $group = 0;
  13.                 $hash_key = shift @cols;
  14.                 my $c = @cols;
  15.                 $hash->{$c}{$hash_key}[$group] = [@cols];
  16.         }
  17.         if(/^\d+/){
  18.                 my $c = @cols;
  19.                 $hash->{$c}{$hash_key}[++$group] = [@cols];
  20.         }
  21.        
  22. }
  23. use Data::Dumper;
  24. #print Dumper $hash;
  25. foreach my $k(sort keys %$hash){
  26.         foreach my $kk(keys %{$hash->{$k}}){
  27.                 print "$kk";
  28.                 foreach $v (@{$hash->{$k}->{$kk}}){
  29.                         foreach (@$v){
  30.                                 print "\t";
  31.                                 print;
  32.                                
  33.                         } print "\n";
  34.                 }
  35.                
  36.         }
  37. }

  38. __DATA__            
  39. >NP_5431234.3     2           8              11
  40.                              6           5              12

  41. >NP_0039563.1     1
  42.                              2
  43.                              3
  44.                              4

  45. >NP_0043242.2     1           2
  46.                              2           4
  47.                              3           6

  48. >NP_0012341        1
  49.                              2
  50.                              6

  51. >NP_21345123      3
  52.                              4
  53.                              7

  54. >NP_2535232        3           7              9
  55.                              6           5              11

  56. >NP_0035255        1           7
  57.                              5           4
  58.                              3           9
复制代码

求职 : 软件工程师
论坛徽章:
3
程序设计版块每日发帖之星
日期:2015-10-07 06:20:00程序设计版块每日发帖之星
日期:2015-12-13 06:20:00程序设计版块每日发帖之星
日期:2016-05-05 06:20:00
6 [报告]
发表于 2016-05-03 12:24 |只看该作者
这样排序的数据容量如果太大,会很慢。先按照区块分隔,然后按照列数分隔区块,计算出列数后,作为区块的排序因子,重新生成新的文本。

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
7 [报告]
发表于 2016-05-03 12:28 |只看该作者
回复 5# L_WC
perl abc file #结果有时出现这样的情况,
>NP_0012341     1
        2
        6
>NP_21345123    3
        4
        7
>NP_0039563.1   1
        2
        3
        4
>NP_0043242.2   1       2
        2       4
        3       6
>NP_0035255     1       7
        5       4
        3       9
>NP_5431234.3   2       8       11
        6       5       12
>NP_2535232     3       7       9
        6       5       11


   

论坛徽章:
2
15-16赛季CBA联赛之浙江
日期:2016-04-26 14:03:26程序设计版块每日发帖之星
日期:2016-04-29 06:20:00
8 [报告]
发表于 2016-05-03 13:30 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
9 [报告]
发表于 2016-05-03 13:51 |只看该作者
本帖最后由 sunzhiguolu 于 2016-05-03 13:52 编辑

回复 8# YQ_Liu
你说的啥意思, 我没有理解.
   

论坛徽章:
2
15-16赛季CBA联赛之浙江
日期:2016-04-26 14:03:26程序设计版块每日发帖之星
日期:2016-04-29 06:20:00
10 [报告]
发表于 2016-05-03 14:54 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP