免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: yu34po
打印 上一主题 下一主题

每天5G的nginx日志,需要怎么分析? [复制链接]

论坛徽章:
0
21 [报告]
发表于 2013-12-11 11:33 |只看该作者
回复 18# weizhulinux


    我感觉我一天搞不定。。。

论坛徽章:
0
22 [报告]
发表于 2013-12-11 12:06 |只看该作者
本帖最后由 yu34po 于 2013-12-11 12:54 编辑

回复 20# rubyish


    这个比较强悍

论坛徽章:
0
23 [报告]
发表于 2013-12-11 13:23 |只看该作者
回复 20# rubyish
能加个IP结果限制输出吗?因为有些只有1次或者几次访问的可以直接过滤掉这些结果,
还有就是图中有些ID可能是获取到的问题,比如会有这样的数据appid=eif324klfdsfdsf&或者appid=12&,这样的结果能直接提前或者最后过滤掉吗?


   

论坛徽章:
7
戌狗
日期:2013-12-15 20:43:38技术图书徽章
日期:2014-03-05 01:33:12技术图书徽章
日期:2014-03-15 20:31:17未羊
日期:2014-03-25 23:48:20丑牛
日期:2014-04-07 22:37:44巳蛇
日期:2014-04-11 21:58:0915-16赛季CBA联赛之青岛
日期:2016-03-17 20:36:13
24 [报告]
发表于 2013-12-12 05:28 |只看该作者
回复 23# yu34po

biru:
  1. while ( my ( $k, $v ) = each %id ) {
  2.     next if length $k != 6;
复制代码

  1. while ( my ( $k, $v ) = each %ip ) {
  2.     next if $v < 10;
复制代码

论坛徽章:
0
25 [报告]
发表于 2013-12-12 08:29 |只看该作者
本帖最后由 yu34po 于 2013-12-12 08:31 编辑

回复 24# rubyish


   

论坛徽章:
0
26 [报告]
发表于 2013-12-12 09:11 |只看该作者
回复 24# rubyish


    这多个这样的文件如何合并成一个文件?按id为主键相加,IP的按IP相加?

论坛徽章:
7
戌狗
日期:2013-12-15 20:43:38技术图书徽章
日期:2014-03-05 01:33:12技术图书徽章
日期:2014-03-15 20:31:17未羊
日期:2014-03-25 23:48:20丑牛
日期:2014-04-07 22:37:44巳蛇
日期:2014-04-11 21:58:0915-16赛季CBA联赛之青岛
日期:2016-03-17 20:36:13
27 [报告]
发表于 2013-12-13 00:16 |只看该作者
比如文件:
appid:        d30b9f
times:        3
type:        index, air
areaid:        101240412, 101240508

appid:        71f520
times:        7
type:        index, forecast3d, air
areaid:        101110601, 101280601, 101190801, 101200101

appid:        aa2f1a
times:        4
type:        forecast5d, air
areaid:        101120101, 101290402, 101090101, 101180101

61.4.184.81        2256
61.4.184.93        8147
61.4.184.90        7226
61.4.184.92        7048

perl abc.pl *.txt
  1. #!/usr/bin/perl

  2. my ( %data, %ip );
  3. while (<>) {
  4.     if (/^[ait]/) {
  5.         my ( undef, $appid )  = split;
  6.         my ( undef, $times )  = split /\s+/, <>;
  7.         my ( undef, @type )   = <> =~ /(\w+)/g;
  8.         my ( undef, @areaid ) = <> =~ /(\w+)/g;
  9.         $data{$appid}{times} += $times;
  10.         $data{$appid}{type}{$_}++   for @type;
  11.         $data{$appid}{areaid}{$_}++ for @areaid;
  12.     }
  13.     elsif (/^\s*$/) { next }
  14.     elsif (/^\d/) {
  15.         my ( $ip, $count ) = split;
  16.         $ip{$ip} += $count;
  17.     }
  18. }

  19. while ( my ( $k, $v ) = each %data ) {
  20.     print "appid:\t$k$/";
  21.     print "times:\t$v->{times}$/";
  22.     print "type:\t", join( ', ', keys %{ $v->{type} } ), $/;
  23.     print "areaid:\t", join( ', ', keys %{ $v->{areaid} } ), $/, $/;
  24. }

  25. while ( my ( $k, $v ) = each %ip ) {
  26.     print "$k\t$v$/";
  27. }
复制代码

论坛徽章:
0
28 [报告]
发表于 2013-12-17 10:08 |只看该作者
本帖最后由 yu34po 于 2013-12-17 10:17 编辑

回复 27# rubyish


    大神,现在需求又变了,需要加一个url的统计,求指导。。
跟IP一样,统计访问的url次数,

论坛徽章:
5
丑牛
日期:2014-01-21 08:26:26卯兔
日期:2014-03-11 06:37:43天秤座
日期:2014-03-25 08:52:52寅虎
日期:2014-04-19 11:39:48午马
日期:2014-08-06 03:56:58
29 [报告]
发表于 2013-12-17 15:19 |只看该作者
大牛,where is 这个url的访问的url次数?{:2_172:}

论坛徽章:
0
30 [报告]
发表于 2013-12-17 15:21 |只看该作者
回复 29# pitonas


擦,url就是url,这个需求我还纳闷呢,是要把每个url都给统计出来
   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP