免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 3690 | 回复: 20
打印 上一主题 下一主题

如何从一个大文件中取出2008年7月份(含7月份)的记录 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-05-27 09:02 |只看该作者 |倒序浏览
有一个很大的日志文件(根据现场反馈,至少有1GB),我想找出时间大于等于2008年7月份的记录,如何找出这部分数据呢?
文件内容如下(a.dat):
3880043 2007-7-1 0:21:59        XL1     13299793053     1               WEB     1
4169322 2007-9-30 23:49:48      7369    13007762130     24      221895  WEB     1
4169325 2007-10-1 0:36:02       YZ      13086293234     22              YZ      0
4513956 2007-12-31 0:09:13      XL19    13007749968     2               WEB     1
3880043 2008-7-1 0:21:59        XL1     13299793053     1               WEB     1
4169322 2008-9-30 23:49:48      7369    13007762130     24      221895  WEB     1
4169325 2008-10-1 0:36:02       YZ      13086293234     22              YZ      0
4513956 2008-12-31 0:09:13      XL19    13007749968     2               WEB     1
3880043 2009-7-1 0:21:59        XL1     13299793053     1               WEB     1
4169322 2009-9-30 23:49:48      7369    13007762130     24      221895  WEB     1
4169325 2009-10-1 0:36:02       YZ      13086293234     22              YZ      0
4513956 2009-12-31 0:09:13      XL19    13007749968     2               WEB     1

我写了一个,不知道是否还有更好的方法:
awk -F' ' '{if (substr($2,1,4)==2008 && (substr($2,7,1)=="-" && substr($2,6,1)>=7 || substr($2,8,1)=="-") || substr($2,1,4)==2009) print $0}' a.dat

论坛徽章:
0
2 [报告]
发表于 2009-05-27 09:10 |只看该作者

回复 #1 jyl980431 的帖子

sed -n '/2008-7-1/,$p'  urfile
如果不考虑复杂情况,就LZ的文件而说。

[ 本帖最后由 greendays 于 2009-5-27 09:26 编辑 ]

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
3 [报告]
发表于 2009-05-27 09:15 |只看该作者
try:
  1. awk -F "[ -]" '$2>2008 || $2==2008 && $3>=7' urfile
复制代码

论坛徽章:
0
4 [报告]
发表于 2009-05-27 09:20 |只看该作者
原帖由 blackold 于 2009-5-27 09:15 发表
try:awk -F "[ -]" '$2>2008 || $2==2008 && $3>=7' urfile

好像不行

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
5 [报告]
发表于 2009-05-27 09:22 |只看该作者

回复 #4 jyl980431 的帖子

哪里不行,你要说出来啊。

论坛徽章:
0
6 [报告]
发表于 2009-05-27 09:24 |只看该作者
原帖由 blackold 于 2009-5-27 09:22 发表
哪里不行,你要说出来啊。

执行代码后,没有一条记录被选出来

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
7 [报告]
发表于 2009-05-27 09:25 |只看该作者

回复 #6 jyl980431 的帖子

刚才测试了,在几种环境下都正常。

你的是什么环境?
$ awk -F "[ -]" '$2>2008 || $2==2008 && $3>=7' urfile
3880043 2008-7-1 0:21:59        XL1     13299793053     1               WEB     1
4169322 2008-9-30 23:49:48      7369    13007762130     24      221895  WEB     1
4169325 2008-10-1 0:36:02       YZ      13086293234     22              YZ      0
4513956 2008-12-31 0:09:13      XL19    13007749968     2               WEB     1
3880043 2009-7-1 0:21:59        XL1     13299793053     1               WEB     1
3880043 2009-1-1 0:21:59        XL1     13299793053     1               WEB     1
4169322 2009-9-30 23:49:48      7369    13007762130     24      221895  WEB     1
4169325 2009-10-1 0:36:02       YZ      13086293234     22              YZ      0
4513956 2009-12-31 0:09:13      XL19    13007749968     2               WEB     1


可能你的数据与你贴出来的不同。

[ 本帖最后由 blackold 于 2009-5-27 09:27 编辑 ]

论坛徽章:
0
8 [报告]
发表于 2009-05-27 09:28 |只看该作者

回复 #3 blackold 的帖子

黑哥的代码,很好!

[ 本帖最后由 greendays 于 2009-5-27 09:30 编辑 ]

论坛徽章:
0
9 [报告]
发表于 2009-05-27 09:29 |只看该作者
第二列貌似不是年,应该是截取第一列后四位

论坛徽章:
0
10 [报告]
发表于 2009-05-27 09:31 |只看该作者
原帖由 blackold 于 2009-5-27 09:25 发表
刚才测试了,在几种环境下都正常。

你的是什么环境?


可能你的数据与你贴出来的不同。

Linux
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP