免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 2691 | 回复: 10
打印 上一主题 下一主题

脚本达人过来帮忙实现一个难度问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-03-22 02:34 |只看该作者 |倒序浏览
目标是截图日志中特定的字段,来做统计,日志格式如下
20100107155228 |cache01_pop01|__NONE_VCDN__|download|1|-|72057594037927942 |cache01_pop01|VOD|1||-192.168.52.238|3970|-|QuickTime/7.6.
2 (qtver=7.6.2;os=Windows NT 5.1Service Pack 2)|-|192.168.2.206|554|ISMAIP|114124111188183221186151122147102160230790143163|/downloa
d/service.sdp?userid=63681661940&userip=192.168.53.108&spid=O1p1&pid=O2p2&cid=O3p3&subcontentid=9718123578332137000001&contenttype=2
&preview=1&oma=0&chargeuserid=13681661940&SubContentSize=404989&MimeType=38&filename=killman.3gp&mimetype=&proxy=0&subcontentsize=&t
imestamp=1262846219&life=3600&enkey=84175eae953be4db86e653b45c48ada4|2|key me|0|20100107155059 |0 |20100107155059 |20100107155228|89|89
|0|0|97574|97574|0|0|2|-|-|-|-|-|-|-|1|0|0|0|-|0 |0|_NONE_|cache01_pop01

提取红色部分,要求显示的格式如下
20100107 |  1  | 1415    |  1413    |   12
1415为第一个粗体部分的个数,1413为第二个粗体部分的个数。

论坛徽章:
0
2 [报告]
发表于 2010-03-22 06:09 |只看该作者
没看到1415和1413啊?

论坛徽章:
0
3 [报告]
发表于 2010-03-22 09:07 |只看该作者
看不懂楼主要统计什么,先帮你处理成一行吧
  1. awk -F "|"  'NF+NF1!=53{printf $0;NF1=NF1+NF-1;next}{print;NF1=0}' file
复制代码

论坛徽章:
0
4 [报告]
发表于 2010-03-22 10:51 |只看该作者
回复 3# ywlscpl


    这个不错,学习了,不知用sed 能实现否?

论坛徽章:
0
5 [报告]
发表于 2010-03-22 10:59 |只看该作者
回复 3# ywlscpl


    这个写法是个杀手锏~很多情况都可以呵呵、厉害

论坛徽章:
0
6 [报告]
发表于 2010-03-22 11:38 |只看该作者
是不是有很多这样的格式相同的记录
那1415应该和1413相等才对呀

论坛徽章:
0
7 [报告]
发表于 2010-03-22 20:56 |只看该作者
me|0|20100107155059 |0 |20100107155059 |20100107155228|89|89
|0|0|97574|97574|0|0|2|-|-|-|-|-|-|-|1|0|0|0|-|0 |0|_NONE_|cache01_pop01
20100107 |  1  | 1415    |  1413    |   12


不好意思,我没表述清楚,1415和1413只是我随便写的,代表这个0的个数(因为一个日志中有很多条这样的记录,统计这两个数为0的个数)。

论坛徽章:
0
8 [报告]
发表于 2010-03-22 20:59 |只看该作者
是不是有很多这样的格式相同的记录
那1415应该和1413相等才对呀
ghp268 发表于 2010-03-22 11:38



    是的,有很多这样的格式,但是1415和1413代表的是拿两个红色标记的0的个数(红色标记的数值不全是0,也有可能是1,1415是统计为0的个数)

论坛徽章:
0
9 [报告]
发表于 2010-03-22 21:46 |只看该作者
回复 8# lskjlove25


    把所有的原始数据帖出来吧~

论坛徽章:
0
10 [报告]
发表于 2010-03-23 08:52 |只看该作者
问题描述不够清楚

输出格式中的第一个大概是表示 年月,可是第二个数值和最后一个数值表示什么呢?

第二个应该是第7个字段的唯一值的个数,第三个字段的值大概是第50个字段的唯一值的个数

那么,红色部分的 Windows 和  2 又是什么呢?是做为过滤依据?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP