免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 6208 | 回复: 10
打印 上一主题 下一主题

[求助]一句perl实现sort | uniq -c的功能 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-03-12 12:37 |只看该作者 |倒序浏览
想不出比较简短的。

论坛徽章:
0
2 [报告]
发表于 2012-03-12 12:38 |只看该作者
  1. perl -e 'my %hash; @hash{<>} = 1; print sort keys %hash;' < words
复制代码
上面这句里的@hash{<>}的用法对吗?

论坛徽章:
0
3 [报告]
发表于 2012-03-12 13:12 |只看该作者
利用hash来统计次数,然后按照value的数值大小对key进行排序并输出

理解精髓就可以了,不必要纠结语法。

论坛徽章:
0
4 [报告]
发表于 2012-03-12 13:22 |只看该作者
  1. perl -e 'my %hash; while(chomp($_=<>)){$hash{$_}++;}print scalar keys %hash' < words
复制代码
这么写不对... 哪里错了呢...

论坛徽章:
0
5 [报告]
发表于 2012-03-12 13:32 |只看该作者
回复 4# polyahu
  1. print scalar keys %hash
复制代码
这一行是打印出你自己hash里有多少个键,这当然不是你想要的结果

论坛徽章:
0
6 [报告]
发表于 2012-03-12 13:36 |只看该作者
  1. perl -e 'my %hash; while(chomp($_=<>)){$hash{$_}++;} while(($key, $value) = each(%hash)) {print $key, " ", $value, "\n";}' < words
复制代码
这样就可以了... 谢谢...

论坛徽章:
0
7 [报告]
发表于 2012-03-12 13:42 |只看该作者
回复 6# polyahu


    这样子没有符合你的题目要求,你用uniq -c意味着“次数”是排在第一列的

论坛徽章:
0
8 [报告]
发表于 2012-03-12 13:47 |只看该作者
回复 7# sjdy521


    呵呵,这倒是...

论坛徽章:
0
9 [报告]
发表于 2012-03-12 13:49 |只看该作者
回复 6# polyahu


    通常情况下都是sort|uniq -c|sort -nr|head -n10 之类的组合使用,你说的这个使用方式不太常见
另外,sort|uniq -c速度太慢,远没有awk的数组(计算原理和perl的hash相同)速度好,处理几个G的文件你就会发现速度差异多么重要了
给你个perl例子,你可以稍微参考下
  1. %hash;
  2. while(<>){
  3.     chomp;
  4.     $hash{$_}++;
  5. }
  6. print "$hash{$_}\t$_\n" foreach(sort {$hash{$b}<=>$hash{$a}} keys %hash);
复制代码
我是没办法再写的更短了,这个东西awk写起来倒是比perl简短很多

论坛徽章:
0
10 [报告]
发表于 2012-03-12 14:01 |只看该作者
回复 9# sjdy521
  1. awk '{a[$0]++}END{for(i in a)print a[i],i}' words
复制代码
awk确实短
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP