12 / 2 页

论坛徽章:: 0

11楼 [报告]

发表于 2009-07-10 17:19 |只看该作者

回复 #10 Minsic 的帖子

tomcat的日志整个往内存里丢，内存一般受不了……

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

Minsic

大富大贵

论坛徽章:: 1

12楼 [报告]

发表于 2009-07-10 17:25 |只看该作者

回复 #11 kwokcn 的帖子

俺没其他办法了

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

kwokcn

大富大贵

论坛徽章:: 0

13楼 [报告]

发表于 2009-07-10 17:37 |只看该作者

回复 #12 Minsic 的帖子

觉得麻烦不想写……

照顾到效率，需要在awk遍历完文件时完成输出；同时又要照顾到内存，需要在存放前面的数据时对无用数据进行及时的删除，但由于还有前面8楼9楼说到的情况，还不能固定保存20行，需要根据"Exception"的情况设置flag指挥删除操作或者另行存放。当然也可能是我想麻烦了～

楼主用的方法，出现N次Exception，就遍历N+1遍日志文件，想想那动辄若干个G的日志，肯定慢的难受了。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

hidinga

白手起家

论坛徽章:: 0

14楼 [报告]

发表于 2009-07-10 17:42 |只看该作者

原帖由 kwokcn 于 2009-7-10 17:37 发表
觉得麻烦不想写……

照顾到效率，需要在awk遍历完文件时完成输出；同时又要照顾到内存，需要在存放前面的数据时对无用数据进行及时的删除，但由于还有前面8楼9楼说到的情况，还不能固定保存20行，需要根据"E ...

是啊,神啊,救救我吧,写这个东西我都折腾半天,结果分析50M的日志花了一个多小时.......

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

hidinga

白手起家

论坛徽章:: 0

15楼 [报告]

发表于 2009-08-08 22:47 |只看该作者

顶一下,求结果!

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

woodie

小富即安

论坛徽章:: 1

16楼 [报告]

发表于 2009-08-09 00:26 |只看该作者

回复 #1 hidinga 的帖子

有比较新版的GNU grep么？可以一行代码搞定：
grep -C 20 -P '^\w.*Exception.*(\n\s+.*)*'

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

kvkingdom

稍有积蓄

论坛徽章:: 0

17楼 [报告]

发表于 2009-08-10 01:52 |只看该作者

要求：匹配行的前面20行+匹配行本身+首字缩进的段(红色部份)+匹配行后的首字不缩进行开始后面20行
要是能多给几段详细的日志就好了，下面是从你给出的日志，模拟的一段文件。在这里我只取前后各3行，20行太多了。

-bash-3.2$ cat log.txt
11111111111111111111
11111111111111111111
22222222222222222222
33333333333333333333
44444444444444444444
55555555555555555555
66666666666666666666
xxxxxExceptionxxxxxx
##################
##################
##################
##################
44444444444444444444
33333333333333333
22222222222222222
11111111111111111111
11111111111111111111
22222222222222222222
33333333333333333333
44444444444444444444
55555555555555555555
66666666666666666666
xxxxxExceptionxxxxxx
##################
##################
##################
##################
44444444444444444444
33333333333333333
22222222222222222
11111111111111111111
11111111111111111111
22222222222222222222
33333333333333333333
44444444444444444444
55555555555555555555
66666666666666666666
xxxxxExceptionxxxxxx
##################
##################
##################
##################
44444444444444444444
33333333333333333
22222222222222222
11111111111111111111

复制代码

代码部分，如果你要取20行，请将lines=3,改为lines=20

-bash-3.2$ cat log.awk
#!/bin/awk -f
BEGIN{
lines=3
mflag=0
eflag=0
ecount=0
num=0
}
{
if ($0~/Exception/){
for (n=1;n<=lines;n++){
if (array[n] != "") print array[n] 加 >> "log.tmp" 重定向到文件中
}
delete array
print $0 加 >> "log.tmp" 重定向到文件中
mflag=1
next
}
if (mflag == 0){
num++
array[num]=$0
if (num > lines){
num=lines
for (i=1;i<=lines;i++){
array[i]=array[i+1]
}
}
}
if (mflag == 1){
if ($0~/^[ ]+/ && eflag == 0) print $0 加 >> "log.tmp" 重定向到文件中
if ($0!~/^[ ]+/) eflag=1
if (eflag == 1 && count < lines){
print $0 加 >> "log.tmp" 重定向到文件中
count++
}else if (count == lines){
eflag=0
mflag=0
count=0
}
}
}

复制代码

测试模拟文本结果：匹配行的前面3行+匹配行本身+首字缩进的段+匹配行后的首字不缩进行开始后面3行

-bash-3.2$ ./log.awk log.txt
44444444444444444444
55555555555555555555
66666666666666666666
xxxxxExceptionxxxxxx
##################
##################
##################
##################
44444444444444444444
33333333333333333
22222222222222222
44444444444444444444
55555555555555555555
66666666666666666666
xxxxxExceptionxxxxxx
##################
##################
##################
##################
44444444444444444444
33333333333333333
22222222222222222
44444444444444444444
55555555555555555555
66666666666666666666
xxxxxExceptionxxxxxx
##################
##################
##################
##################
44444444444444444444
33333333333333333
22222222222222222

复制代码

这个执行起来效率会高一点，在内存消耗方面就只用了一个用来存取前20行的数组，并且数组内并不是总是存在数据，只有在符合条件是才存入数据，用完后消毁。
深更半夜，头脑有些发昏，逻辑有些混乱，但看看结果应该是你说的那种要求，不考虑特例，特别是后20不足的情况，前20行不足时，脚本可以正常工作。

[ 本帖最后由 kvkingdom 于 2009-8-10 02:10 编辑 ]

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

12 / 2 页

返回列表

Chinaunix › 论坛 › 程序设计 › Shell › [待解决]日志截取代码优化

[待解决]日志截取代码优化 [复制链接]

回复 #10 Minsic 的帖子

回复 #11 kwokcn 的帖子

回复 #12 Minsic 的帖子

回复 #1 hidinga 的帖子

浏览过的版块