免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: yu34po
打印 上一主题 下一主题

[文本处理] 每天5G的nginx日志,需要怎么分析? [复制链接]

论坛徽章:
0
21 [报告]
发表于 2013-12-06 16:47 |只看该作者
回复 20# expert1


   汗。比较高深,不会,这玩意现在咋办啊/现在统计的结果不对,还要输出到文件。。

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
22 [报告]
发表于 2013-12-06 16:49 |只看该作者
回复 19# yu34po
我用你的测试数据能得到结果啊~
  1. [root@localhost ~]# ./a i
  2. appid:  7cfdf9
  3. times:  1
  4. areaid: 101243506
  5. type:   observe

  6. appid:  7fde98
  7. times:  1
  8. areaid: 329103324
  9. type:   observe

  10. 61.4.184.91 1
  11. 61.4.184.92 1
  12. [root@localhost ~]#
复制代码

论坛徽章:
0
23 [报告]
发表于 2013-12-06 16:52 |只看该作者
回复 22# yestreenstars
为啥我这是图里边贴的结果?


   

论坛徽章:
0
24 [报告]
发表于 2013-12-06 16:55 |只看该作者
回复 22# yestreenstars


    要不我给你个10M的数据?我这测试出来结果好像不行。。

论坛徽章:
0
25 [报告]
发表于 2013-12-06 17:05 |只看该作者
本帖最后由 yu34po 于 2013-12-06 17:06 编辑

回复 22# yestreenstars


    我明白了,那个数据里面还有类似这样的数据。
61.4.184.83 - - [05/Dec/2013:00:10:13 +0800] "GET / 403 169" "_" "_" _
那些字段是缺失的。

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
26 [报告]
发表于 2013-12-06 17:09 |只看该作者
回复 25# yu34po
特例要如何处理?

   

论坛徽章:
0
27 [报告]
发表于 2013-12-06 17:12 |只看该作者
本帖最后由 yu34po 于 2013-12-06 17:13 编辑

回复 26# yestreenstars

先直接丢了吧。那些没抓取到的也没什么意义,哎高手我能加你个Q嘛
    对了,输出重定向放到文件中么?新手毫无头绪啊。。。

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
28 [报告]
发表于 2013-12-06 17:19 |只看该作者
回复 27# yu34po
加个限定条件吧,输出重定向到新文件~
  1. #!/bin/awk -f

  2. /appid/&&/areaid/&&/type/{
  3.         appid=gensub(/.*appid=([^&]*).*/,"\\1",1);
  4.         areaid=gensub(/.*areaid=([^&]*).*/,"\\1",1);
  5.         type=gensub(/.*type=([^&]*).*/,"\\1",1);
  6.         IP=$1;

  7.         a[appid]++;
  8.         if(!x[appid,areaid]++)b[appid]=b[appid]?b[appid]" "areaid:areaid;
  9.         if(!y[appid,type]++)c[appid]=c[appid]?c[appid]" "type:type;
  10.         d[IP]++;
  11. }

  12. END{
  13.         for(i in a)printf "appid:\t%s\ntimes:\t%d\nareaid:\t%s\ntype:\t%s\n\n",i,a[i],b[i],c[i];
  14.         for(i in d)print i,d[i];
  15. }
复制代码

论坛徽章:
0
29 [报告]
发表于 2013-12-06 18:07 |只看该作者
回复 28# yestreenstars


    这个比较厉害,

论坛徽章:
0
30 [报告]
发表于 2013-12-09 12:52 |只看该作者
回复 28# yestreenstars


    能用perl写一个吗?这个MS有点慢。。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP