免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 2918 | 回复: 10
打印 上一主题 下一主题

日志分析对于时间段选择的一个问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-03-04 13:08 |只看该作者 |倒序浏览
一个已经排序的日志,日志时段如果从 3月2号 13点 到3月3号18点之间

如何筛选出 3.2-16:00 到3.3-16:00呢?求助大虾

219.135.52.147 - - [02/Mar/2010:15:52:20 +0800]
116.4.26.66 - - [02/Mar/2010:15:51:05
116.4.26.66 - - [02/Mar/2010:16:00:05
116.4.26.66 - - [02/Mar/2010:17:51:05
116.4.26.66 - - [02/Mar/2010:21:51:05
116.4.26.66 - - [03/Mar/2010:16:51:05

219.135.52.147 - - [03/Mar/2010:17:52:20 +0800]

目前的想法只是可以先排序后,手动截取日志,但是日志如果比较大时候,米有法子了,太没效率。。

论坛徽章:
0
2 [报告]
发表于 2010-03-04 13:14 |只看该作者
回复 1# leestars881001


    刚问到一个方法,把时间参数变成数字,这样之后判断大小,这种方法能实现(*^__^*) ~

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
3 [报告]
发表于 2010-03-04 13:16 |只看该作者

  1. sed -n '/02\/Mar\/2010:16/,/03\/Mar\/2010:16/p' urfile
复制代码

论坛徽章:
0
4 [报告]
发表于 2010-03-04 13:25 |只看该作者
  1. sed -n '/02.*Mar.*2010:16/,/03.*Mar.*2010:17/p' file |sed '$d'
复制代码

论坛徽章:
0
5 [报告]
发表于 2010-03-04 13:44 |只看该作者
回复 3# Shell_HAT

文件如果是以下格式的话,运行脚本好像会有误
    115.173.110.25 - - [03/Mar/2010:15:36:54 +0800] "GET /common/sniff.png?url=j.png"
60.11.232.242 - - [03/Mar/2010:15:36:55 +0800] "GET /common/sniff.png?url=j.png;"
115.173.110.25 - - [02/Mar/2010:15:36:54 +0800] "GET /common/sniff.png?url=j.png"
是否需要是考虑到前面和后面的【 】?

论坛徽章:
0
6 [报告]
发表于 2010-03-04 13:51 |只看该作者
回复 4# sunbw001




文件如果是以下格式的话,运行脚本好像会有误
    115.173.110.25 - - [03/Mar/2010:15:36:54 +0800] "GET /common/sniff.png?url=j.png"
60.11.232.242 - - [03/Mar/2010:15:36:55 +0800] "GET /common/sniff.png?url=j.png;"
115.173.110.25 - - [02/Mar/2010:15:36:54 +0800] "GET /common/sniff.png?url=j.png"

么有得出想要的结果

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
7 [报告]
发表于 2010-03-04 13:52 |只看该作者
回复 5# leestars881001


一个已经排序的日志,日志时段如果从 3月2号 13点 到3月3号18点之间


到底是啥样的日志?

论坛徽章:
0
8 [报告]
发表于 2010-03-04 13:59 |只看该作者
回复 7# Shell_HAT

嗯,这样的,我把日志中事件转换成数字,之后按照大小来判断,这已经实现了,只是多出了很多列(中间数据)目前在想怎么把这些列去掉(⊙o⊙)…
61.149.246.80 - - [02/Mar/2010:19:03:09 +0800] "GET bb" 200 137 "126.net" "X" "163.com" "61.149.246.80.1267527782570770" 615 "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Maxthon 2.0)"
114.221.13.127 - - [02/Mar/2010:19:03:10 +0800] "GET aa" "X" "126.net" "180.109.124.175.1263272784750376" 1804 "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.0; Trident/4.0; QQPinyin 689; QQDownload 609; SLCC1; .NET CLR 2.0.50727; .NET CLR 3.5.21022; .NET CLR 3.0.30618; .NET CLR 3.5.30729)"

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
9 [报告]
发表于 2010-03-04 14:07 |只看该作者
把你的脚本贴出来,把你想删掉的中间数据标记出来。

论坛徽章:
0
10 [报告]
发表于 2010-03-04 14:36 |只看该作者
sed 's/Mar/3/' logfile|awk -F[[,/,:] '{a[NR]=$3$2$5$6;if (a[NR]>3021559&&a[NR]<3031701) print}'
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP