论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2012-11-19 20:23 |只看该作者 |倒序浏览

请问使用shell可否取出web日志中的一段时间的日志，如日志内容为：
115.67.100.159 - - [19/Nov/2012:05:00:01 +0100] "GET /favicon.ico HTTP/1.1" 404 564 "-" "Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11"
154.5.137.229 - - [19/Nov/2012:05:00:01 +0100] "GET /favicon.ico HTTP/1.1" 404 162 "-" "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:16.0) Gecko/20100101 Firefox/16.0"
115.67.100.159 - - [19/Nov/2012:10:00:01 +0100] "GET /favicon.ico HTTP/1.1" 404 564 "-" "Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11"
154.5.137.229 - - [19/Nov/2012:11:00:01 +0100] "GET /favicon.ico HTTP/1.1" 404 162 "-" "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:16.0) Gecko/20100101 Firefox/16.0"
115.67.100.159 - - [19/Nov/2012:12:00:01 +0100] "GET /favicon.ico HTTP/1.1" 404 564 "-" "Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11"
154.5.137.229 - - [19/Nov/2012:12:00:01 +0100] "GET /favicon.ico HTTP/1.1" 404 162 "-" "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:16.0) Gecko/20100101 Firefox/16.0"

如何取出19/Nov/2012:11:00:01到19/Nov/2012:12:00:01的所有日志内容。先谢过！

文库|博客

liu-shaobo

稍有积蓄

论坛徽章:: 0

2楼 [报告]

发表于 2012-11-19 23:19 |只看该作者

本帖最后由 liu-shaobo 于 2012-11-19 23:31 编辑

暂时想到这个，如果提取12点的，你在把$2 $3 的数字改一下，看其他兄弟还有没有更简单的办法

如果你的日志是每天切割的，就这样

awk -F: '$2=="11" && $3<=59 {print $0}' logfile

复制代码

如果没有切割,就这样执行

awk '(/\[19\/Nov\/2012:11/) {print $0}' logfile | awk -F: '$3<=59 {print $0}'

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

dwj19830118

白手起家

论坛徽章:: 0

3楼 [报告]

发表于 2012-11-19 23:43 |只看该作者

cat web | awk '/19\/Nov\/2012:11:00:01/,/19\/Nov\/2012:12:00:01/{print}'

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

liu-shaobo

稍有积蓄

论坛徽章:: 0

4楼 [报告]

发表于 2012-11-20 10:36 |只看该作者

本帖最后由 liu-shaobo 于 2012-11-20 10:40 编辑

回复 3# dwj19830118

学习了

借花献佛

awk '/19\/Nov\/2012:11:00:01/,/19\/Nov\/2012:12:00:01/ {print}' logfile

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

代号：军刀

家境小康

论坛徽章:: 13

5楼 [报告]

发表于 2012-11-20 11:36 |只看该作者

grep "19/Nov/2012:11" file

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

yestreenstars

富甲一方

论坛徽章:: 32

6楼 [报告]

发表于 2012-11-20 14:10 |只看该作者

@dwj19830118 @liu-shaobo不知道你们有没有看清他的文本内容，他的文本中有两行数据是包含19/Nov/2012:12:00:01的，你们这样做只能截取第一次匹配到19/Nov/2012:11:00:01的行到第一次匹配到19/Nov/2012:12:00:01的行，根本不符合楼主要求。@代号：军刀你这个就更加是没看清题目。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

liu-shaobo

稍有积蓄

论坛徽章:: 0

7楼 [报告]

发表于 2012-11-20 14:30 |只看该作者

回复 6# yestreenstars

不会吧，我刚才测试是可以匹配之间的数据呀

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

yestreenstars

富甲一方

论坛徽章:: 32

8楼 [报告]

发表于 2012-11-20 14:52 |只看该作者

回复 7# liu-shaobo

你匹配出来的结果是2行的，对吧，正确的应该有3行，也就是下面的3行：
154.5.137.229 - - [19/Nov/2012:11:00:01 +0100] "GET /favicon.ico HTTP/1.1" 404 162 "-" "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:16.0) Gecko/20100101 Firefox/16.0"
115.67.100.159 - - [19/Nov/2012:12:00:01 +0100] "GET /favicon.ico HTTP/1.1" 404 564 "-" "Mozilla/5.0 (Windows NT 5.1) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11"
154.5.137.229 - - [19/Nov/2012:12:00:01 +0100] "GET /favicon.ico HTTP/1.1" 404 162 "-" "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:16.0) Gecko/20100101 Firefox/16.0"

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

liu-shaobo

稍有积蓄

论坛徽章:: 0

9楼 [报告]

发表于 2012-11-20 15:51 |只看该作者

回复 8# yestreenstars

是哦，这样可以吧

awk '/19\/Nov\/2012:11:00:01/,/19\/Nov\/2012:12:00:02/ {print}' logfile

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

yestreenstars

富甲一方

论坛徽章:: 32

10楼 [报告]

发表于 2012-11-20 16:16 |只看该作者

本帖最后由 yestreenstars 于 2012-11-20 16:17 编辑

回复 9# liu-shaobo

不行，这样做会把匹配到19/Nov/2012:12:00:02的行也显示出来，如果匹配不到会把19/Nov/2012:11:00:01后面的所有行都显示出来，你可以在最后面添加下面一行测试。
154.5.137.229 - - [19/Nov/2012:12:00:03 +0100] "GET /favicon.ico HTTP/1.1" 404 162 "-" "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:16.0) Gecko/20100101 Firefox/16.0"

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

12 / 2 页下一页

返回列表

Chinaunix › 论坛 › 程序设计 › Shell › 使用shell如何取出web日志中的一段时间的日志

[文本处理] 使用shell如何取出web日志中的一段时间的日志 [复制链接]