免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 12368 | 回复: 10
打印 上一主题 下一主题

[文本处理] (已解决)grep、wc -l统计出现问题 [复制链接]

论坛徽章:
1
金牛座
日期:2013-09-14 18:12:00
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-09-12 21:40 |只看该作者 |倒序浏览
本帖最后由 二马金弓 于 2013-09-30 17:14 编辑

里面有两个tar.gz的压缩包但是,我想统计里面tar.gz时,数目和实际是不一样的:这是什么问题呢?

论坛徽章:
6
摩羯座
日期:2013-08-24 10:43:10狮子座
日期:2013-08-25 10:27:06天秤座
日期:2013-09-11 20:28:44午马
日期:2014-09-28 16:06:0015-16赛季CBA联赛之八一
日期:2016-12-19 13:55:0515-16赛季CBA联赛之天津
日期:2016-12-20 14:01:23
2 [报告]
发表于 2013-09-12 21:58 |只看该作者
  1. $ echo 'xxxx.tar_gz' |grep '.*tar.gz'
  2. xxxx.tar_gz
  3. $ echo 'xxxx.tar_gz' |grep '.*tar\.gz'
复制代码

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
3 [报告]
发表于 2013-09-12 22:18 |只看该作者
回复 1# 二马金弓


grep *.tar.gz  这里的*号会被扩展成当前目录下所有以.tra.gz结尾的文件,实际上执行的命令为类似于:
  1. grep 10.207.146.162.logman.tar.gz 10.207.147.180.logman.tar.gz 各种.tar.gz
复制代码
肯定就不会有结果出来.

把*号去掉或把*号当成正则来用都行:
  1. grep .tar.gz
  2. grep -E '*.tar.gz'
复制代码

论坛徽章:
0
4 [报告]
发表于 2013-09-12 23:20 |只看该作者
如果只是 统计 *.tar.gz 文件的话,不一定非要用grep 吧
ls -lrt *.tar.gz | wc -l

论坛徽章:
4
CU大牛徽章
日期:2013-03-13 15:29:07CU大牛徽章
日期:2013-03-13 15:29:49CU大牛徽章
日期:2013-03-13 15:30:19CU十二周年纪念徽章
日期:2013-10-24 15:41:34
5 [报告]
发表于 2013-09-12 23:24 |只看该作者
本帖最后由 shencz2000 于 2013-09-13 12:06 编辑

在bash下,简单的方法就是这样使用命令:ls ../20130822 | grep tar.gz | wc -l
解释如下:
* , . 等字符在正则表达式里有特殊含义,*表示对前面一个字符重复0次或多次, . 表示任意一个字符

或者请使用双引号或单引号:ls ../20130822 | grep "*.tar.gz" | wc -l
ls ../20130822 | grep '*.tar.gz ' | wc -l

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
6 [报告]
发表于 2013-09-12 23:41 |只看该作者
回复 5# shencz2000


    目测直接加引号是不对的: 变成了 查找 \*.tar.gz  即一个" * " 字符 后面跟着字符串 " .tar.gz "

论坛徽章:
4
CU大牛徽章
日期:2013-03-13 15:29:07CU大牛徽章
日期:2013-03-13 15:29:49CU大牛徽章
日期:2013-03-13 15:30:19CU十二周年纪念徽章
日期:2013-10-24 15:41:34
7 [报告]
发表于 2013-09-12 23:47 |只看该作者
本帖最后由 shencz2000 于 2013-09-12 23:54 编辑

回复 6# 关阴月飞
我试了一下,是对的。你试一下好了。
这样做的原因可以在正则表达式里找到。
我的测试如下:

$ touch aaa.tar.gz aab.tar.gz aac.tar_gz
$ ls  | grep  "*.tar.gz"
aaa.tar.gz
aab.tar.gz
aac.tar_gz

论坛徽章:
1
金牛座
日期:2013-09-14 18:12:00
8 [报告]
发表于 2013-09-13 09:44 |只看该作者
回复 4# qq3632


    这个测试时成功的,谢谢哈

论坛徽章:
1
金牛座
日期:2013-09-14 18:12:00
9 [报告]
发表于 2013-09-13 09:45 |只看该作者
回复 3# 关阴月飞


    谢谢哈,学习啦

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
10 [报告]
发表于 2013-09-13 09:59 |只看该作者
回复 7# shencz2000


这个可能是环境问题了,我在linux下都是不能直接加引号的:
  1. [root@ ~]# grep --version
  2. GNU grep 2.6.3

  3. Copyright (C) 2009 Free Software Foundation, Inc.
  4. License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html>
  5. This is free software: you are free to change and redistribute it.
  6. There is NO WARRANTY, to the extent permitted by law.

  7. [root@ ~]#  echo {1..5}.tar.gz |xargs -n1 |grep  ".tar.gz"  
  8. 1.tar.gz
  9. 2.tar.gz
  10. 3.tar.gz
  11. 4.tar.gz
  12. 5.tar.gz
  13. [root@ ~]#  echo {1..5}.tar.gz |xargs -n1 |grep  "*.tar.gz"
  14. [root@ ~]#
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP