免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4263 | 回复: 0
打印 上一主题 下一主题

统计一个文件中特定字符的个数 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-04-29 23:20 |只看该作者 |倒序浏览

                统计一个文件中某个字符串的个数,其实就是在在一块沙地里面找石头,有的人看到石头以后,在上面做个标记(grep),然后记住自己做了多少个标记;有的
人看到石头以后,把它挖了(tr),最后统计自己挖了多少石头;有的人看到石头以后,把它跳过去(awk),然后统计自己跳了多少次。
这是我用的的文件
  1. [root@bzhou test]# cat file
  2. hafsdha
  3. hahafsdfsdhaha
  4. haha
复制代码
我想匹配的是‘haha’这个字符串
1.grep的-o选项
  1. [root@bzhou test]# grep -c 'haha' file
  2. 2
复制代码
最开始的时候是用-c这个选项,不过-c只能统计一行的,如果一行里面有多个匹配的字符串,那-c就无能为力了。
这个是正确的
  1. [root@bzhou test]# grep -o 'haha' file | wc -l
  2. 3
复制代码
2. awk
这个东西要感谢CU上的blackold。
  1. [root@bzhou test]# awk -v RS='haha' 'END {print --NR}' file
复制代码
-v 去设定一个变量的值,RS是记录的分隔符,默认的是新行(\n),就是说awk按照一行一行读数据,但是现在RS为'haha'后,就按'haha'读数据了,NR为已读的记录数,n个记录是被n-1个分隔符分开的,所以就是--NR了。
3.tr
严格意义上说,tr匹配不了字符串,只能去匹配单个字符。这里就匹配这个文件中‘h’的个数。
  1. [root@bzhou test]# tr -cd 'h' <file | wc -c
  2. 8
  3. [root@bzhou test]# grep -o 'h' file | wc -l
  4. 8
复制代码
-d可以删除某个字符,如果只有-d就会输出删除特定字符后的字符串,但是-c可以反显,这就是显示了被删除的字符。然后可以用wc -c去统计下字符的个数。
这是在CU上面的文章,我其实就是个搬运工罢了。
http://bbs2.chinaunix.net/viewthread.php?tid=1441850&extra=&page=1
               
               

本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u2/82912/showart_1914688.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP