免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 5464 | 回复: 9
打印 上一主题 下一主题

对文件最后一列排序 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-09-24 15:02 |只看该作者 |倒序浏览
有一个文件以tab分隔,每一行的长度不等,现在我想对文件按最后一列(也就是每一行的最后一个字符串)排序,怎么操作啊?
开始想用sort来着,但是没找到合适的参数。。。
请大侠们指教

举个简单的例子:
file1:
am    am    am    am    about
am    am    am    up
am    am    about
am    am    am    am    am    up   
is    is    is    is    is    is    up
is    is    is    is    is    is    about

对最后一列排序后,就把最后是about的聚在一起,up的在一起:
file2:
am    am    am    am    about
am    am    about
is    is    is    is    is    is    about
am    am    am    up
am    am    am    am    am    up   
is    is    is    is    is    is    up

论坛徽章:
0
2 [报告]
发表于 2011-09-24 16:38 |只看该作者
回复 1# junlingpang
  1. #!/usr/bin/perl -w
  2. open F1, "file1";
  3. open F2, ">file2";
  4. while(<F1>){
  5.   chomp;
  6.   s/(.*) (\S+)$/$2 $1/;
  7.   push @a, $_;
  8. }
  9. @b = sort @a;
  10. foreach(@b){
  11.   s/^(\S+) (.*)/$2 $1/;
  12.   print F2 "$_\n";
  13. }
复制代码
有点要求,就是file1中出现的空白地方是空格,不是tab。

论坛徽章:
0
3 [报告]
发表于 2011-09-24 18:10 |只看该作者
  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;

  4. my @arr = <DATA>;

  5. @result = map  {$_->[0]}
  6.           sort {$a->[-1] cmp $b->[-1]}
  7.           map {[$_, split /\s+/]} @arr;
  8.          
  9. print "@result\n";

  10. __DATA__
  11. am    am    am    am    about
  12. am    am    am    up
  13. am    am    about
  14. am    am    am    am    am    up   
  15. is    is    is    is    is    is    up
  16. is    is    is    is    is    is    about
复制代码

论坛徽章:
0
4 [报告]
发表于 2011-09-24 23:16 |只看该作者
open FILE,"<data.txt" or die "Cann't open data.txt.";
chomp(my @arrays = <FILE>);
my @sorts = sort { (split "\t",$a)[-1] cmp (split "\t",$b)[-1] } @arrays;
foreach (@sorts) {
   print "$_\n";
}
需注意你的数据有的不是直接以回车换行结尾。

论坛徽章:
0
5 [报告]
发表于 2011-09-25 11:09 |只看该作者
回复 2# 午夜凋零
这样排出来的结果和楼主需要的有出入,结果中第一二行的位置不对,@b = sort @a会把行与行的相对位置改变。。

论坛徽章:
0
6 [报告]
发表于 2011-09-25 16:19 |只看该作者
回复 4# freflying


    谢谢你

论坛徽章:
0
7 [报告]
发表于 2011-09-25 16:20 |只看该作者
回复 3# Cu_fans


    谢谢

论坛徽章:
0
8 [报告]
发表于 2011-09-25 16:20 |只看该作者
回复 2# 午夜凋零


    谢谢

论坛徽章:
0
9 [报告]
发表于 2011-09-25 16:27 |只看该作者
回复 1# junlingpang
  1. #!/usr/bin/perl -w
  2. use strict;
  3. use Data::Dumper;

  4. my %hash;
  5. while(<DATA>){
  6.     my @ary = m/(.* )(.*)/;
  7.     push @{$hash{$2}}, $1;
  8. }

  9. my @ary = sort( keys %hash );

  10. foreach my $it ( @ary ){
  11.   
  12.     foreach my $row ( @{$hash{$it}} ) {
  13.         
  14.         print $row, $it,"\n";
  15.     }
  16.    
  17. }


  18. __DATA__
  19. am    am    am    am    about
  20. am    am    am    up
  21. am    am    about
  22. am    am    am    am    am    up
  23. is    is    is    is    is    is    up
  24. is    is    is    is    is    is    about
复制代码
am    am    am    am    about
am    am    about
is    is    is    is    is    is    about
am    am    am    up
am    am    am    am    am    up
is    is    is    is    is    is    up

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
10 [报告]
发表于 2011-09-26 17:09 |只看该作者
  1. perl -e 'open $fh,"urfile";@lines=<$fh>;print for sort {(split " ",$a)[-1] cmp (split " ",$b)[-1]} @lines;'
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP