免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1857 | 回复: 3
打印 上一主题 下一主题

如何统计某个文件里每个字符串出现的次数 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2007-03-21 12:04 |只看该作者 |倒序浏览
比如文件
a
b
b
b
a
a
c
c
c

输出
a 3
b 3
c 3

如果文件非常大, 内存装不下的话, 应该采取哪种策略比较好?

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
2 [报告]
发表于 2007-03-21 12:48 |只看该作者

  1. awk '{c[$0]++}END{for(i in c)print i,c[i]}'
复制代码

论坛徽章:
0
3 [报告]
发表于 2007-03-21 12:49 |只看该作者
awk '{a[$0]++;b[$0]=$0}END{for (i in a) {print b" "a}}' yourfile
也许可以

[ 本帖最后由 jarhead1 于 2007-3-21 12:53 编辑 ]

论坛徽章:
4
技术图书徽章
日期:2013-09-23 10:22:37狮子座
日期:2013-10-15 23:31:54卯兔
日期:2013-11-11 17:33:15金牛座
日期:2013-11-15 17:25:28
4 [报告]
发表于 2007-03-21 21:35 |只看该作者
sort yourfile | uniq -c | awk '{print $2,$1}'
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP