免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 4382 | 回复: 11

[文本处理] 请教分类统计的问题 [复制链接]

论坛徽章:
41
操作系统版块每日发帖之星
日期:2016-08-21 06:20:00每日论坛发贴之星
日期:2016-05-05 06:20:00操作系统版块每日发帖之星
日期:2016-05-05 06:20:00IT运维版块每日发帖之星
日期:2016-05-05 06:20:0015-16赛季CBA联赛之山西
日期:2016-04-27 08:49:00操作系统版块每日发帖之星
日期:2016-04-25 06:20:00操作系统版块每日发帖之星
日期:2016-04-17 06:23:2815-16赛季CBA联赛之吉林
日期:2016-03-25 15:46:3415-16赛季CBA联赛之四川
日期:2016-03-25 14:26:19操作系统版块每日发帖之星
日期:2016-05-27 06:20:00操作系统版块每日发帖之星
日期:2016-05-28 06:20:00IT运维版块每日发帖之星
日期:2016-08-18 06:20:00
发表于 2014-01-21 13:39 |显示全部楼层
文本例子如下,每分钟统计一次存在一个文本中
  1. AP-01# show clock
  2. Tue Jan 21 10:38:29 PRC 2014
  3. AP-01# show aid-list
  4. STA#   rid bid aid   mac address         rssi data rate   flag      wmm ps mode channel   authvlan id ssid                           
  5.     1   0   0   1     0c:82:68:3d:ff:d1   50   0           [WMM][HT][AUTHORIZED]1   0  11   6         1   1       ap-2.4G                          
  6.     2   0   0   2     00:90:a2:d0:50:45   36   0           [WMM][HT][AUTHORIZED]1   0  11   6         1   1       ap-2.4G                          
  7.     3   0   0   3     e8:99:c4:0b:b8:e5   35   0           [WMM][HT][AUTHORIZED]1   0  11   6         1   1       ap-2.4G                          
  8.     4   0   0   4     ac:f7:f3:40:f6:a2   30   0           [WMM][HT][POWER SAVE][AUTHORIZED]1   1  11   6         1   1       ap-2.4G                          
  9.     5   0   0   5     20:68:9d:92:f5:17   38   0           [WMM][HT][AUTHORIZED]1   0  11   6         1   1       ap-2.4G                          
  10.     6   0   0   6     0c:82:68:3e:01:da   42   0           [WMM][HT][AUTHORIZED]1   0  11   6         1   1       ap-2.4G                          
  11.     7   0   0   8     80:22:75:4a:a5:76   34   0           [WMM][HT][POWER SAVE][AUTHORIZED]1   1  11   6         1   1       ap-2.4G                          
  12.     8   0   0   9     94:39:e5:66:fb:7d   33   0           [WMM][HT][AUTHORIZED]1   0  11   6         1   1       ap-2.4G                          
  13.     9   0   0   10    94:db:c9:c9:24:4f   52   0           [WMM][HT][POWER SAVE][AUTHORIZED]1   1  11   6         1   1       ap-2.4G                          
  14.    10   0   0   11    0c:37:dc:af:bb:ae   33   0           [WMM][HT][AUTHORIZED]1   0  11   6         1   1       ap-2.4G                          
  15.    11   0   0   13    f8:2f:a8:f7:b7:e9   29   0           [WMM][HT][AUTHORIZED]1   0  11   6         1   1       ap-2.4G                          
  16.    12   0   0   14    f4:b7:e2:cf:a2:4b   46   0           [WMM][HT][AUTHORIZED]1   0  11   6         1   1       ap-2.4G                          
  17.    13   0   0   15    e0:06:e6:c8:7a:d6   38   0           [WMM][HT][AUTHORIZED]1   0  11   6         1   1       ap-2.4G                          
  18.    14   0   0   16    60:fa:cd:da:34:41   26   0           [WMM][HT][POWER SAVE][AUTHORIZED]1   1  11   6         1   1       ap-2.4G                          
  19.    15   0   0   12    0c:82:68:3d:fe:d6   30   0           [WMM][HT][AUTHORIZED]1   0  11   6         1   1       ap-2.4G                          
  20.    16   0   0   17    34:23:ba:99:c2:4e   35   0           [WMM][HT][POWER SAVE][AUTHORIZED]1   1  11   6         1   1       ap-2.4G                          
  21.    17   0   0   18    0c:82:68:3e:01:f9   29   0           [WMM][HT][AUTHORIZED]1   0  11   6         1   1       ap-2.4G                          
  22.    18   0   0   19    0c:82:68:3e:01:f3   26   0           [WMM][HT][AUTHORIZED]1   0  11   6         1   1       ap-2.4G                          
  23.    19   0   0   20    38:bc:1a:93:34:c0   18   0           [WMM][HT][POWER SAVE][AUTHORIZED]1   1  11   6         1   1       ap-2.4G                          
  24.    20   0   0   21    dc:9b:9c:d3:98:4c   36   0           [WMM][HT][POWER SAVE][AUTHORIZED]1   1  11   6         1   1       ap-2.4G                          
  25.    21   0   0   7     b4:07:f9:da:07:a6   26   0           [WMM][HT][POWER SAVE][AUTHORIZED]1   1  11   6         1   1       ap-2.4G                          
  26.    22   0   0   22    6c:c2:6b:bb:85:71   42   0           [WMM][HT][POWER SAVE][AUTHORIZED]1   1  11   6         1   1       ap-2.4G                          
  27.    23   0   0   23    38:48:4c:2e:95:86   26   0           [WMM][HT][AUTHORIZED]1   0  11   6         1   1       ap-2.4G                          
  28.    24   0   0   24    20:68:9d:93:08:7b   44   0           [WMM][HT][AUTHORIZED]1   0  11   6         1   1       ap-2.4G                          
  29.    25   0   0   25    ac:f7:f3:a1:31:e0   38   0           [WMM][HT][POWER SAVE][AUTHORIZED]1   1  11   6         1   1       ap-2.4G                          
  30.    26   0   0   26    00:08:ca:60:2c:21   31   0           [WMM][HT][POWER SAVE][AUTHORIZED]1   1  11   6         1   1       ap-2.4G                          
  31.    27   1   0   1     0c:82:68:3d:fe:d3   46   0           [WMM][POWER SAVE][AUTHORIZED]1   1  7    153       1   1       ap-5G                       
  32.    28   1   0   2     0c:82:68:3d:ff:cf   37   0           [WMM][AUTHORIZED]1   0  7    153       1   1       ap-5G                       
  33.    29   1   0   3     0c:82:68:3e:01:cf   46   0           [WMM][POWER SAVE][AUTHORIZED]1   1  7    153       1   1       ap-5G                       
  34.    30   1   0   4     0c:82:68:10:f1:8b   52   0           [WMM][AUTHORIZED]1   0  7    153       1   1       ap-5G                       
  35.    31   1   0   6     0c:82:68:3e:01:e6   29   0           [WMM][AUTHORIZED]1   0  7    153       1   1       ap-5G                       
  36.    32   1   0   5     0c:82:68:3d:ff:dd   27   0           [WMM][AUTHORIZED]1   0  7    153       1   1       ap-5G                       
  37.    33   1   0   8     0c:82:68:3e:01:ea   36   0           [WMM][AUTHORIZED]1   0  7    153       1   1       ap-5G                       
  38.    34   1   0   9     0c:82:68:3e:01:e0   42   0           [WMM][AUTHORIZED]1   0  7    153       1   1       ap-5G                       
  39.    35   1   0   10    0c:82:68:3d:fe:d4   42   0           [WMM][AUTHORIZED]1   0  7    153       1   1       ap-5G                       
  40.    36   1   0   11    0c:82:68:3e:01:dd   36   0           [WMM][AUTHORIZED]1   0  7    153       1   1       ap-5G                       
  41.    37   1   0   12    0c:82:68:3e:01:f0   41   0           [WMM][AUTHORIZED]1   0  7    153       1   1       ap-5G                       
  42.    38   1   0   13    0c:82:68:3d:ff:e3   26   0           [WMM][AUTHORIZED]1   0  7    153       1   1       ap-5G                       
  43.    39   1   0   14    0c:82:68:3e:01:e4   39   0           [WMM][AUTHORIZED]1   0  7    153       1   1       ap-5G                       
  44.    40   1   0   16    0c:82:68:3e:01:d0   33   0           [WMM][POWER SAVE][AUTHORIZED]1   1  7    153       1   1       ap-5G                       
  45.    41   1   0   17    0c:82:68:3d:ff:ce   38   0           [WMM][AUTHORIZED]1   0  7    153       1   1       ap-5G                       
  46.    42   1   0   18    0c:82:68:3e:01:e3   44   0           [WMM][POWER SAVE][AUTHORIZED]1   1  7    153       1   1       ap-5G                       
复制代码
现在想统计出来当前这个时间内两个信道上各有多少个用户,需求的结果如下(统计数字只是例子):
  1. Tue Jan 21 10:38:29 | ap-2.4G 20 | ap-5G 23
复制代码
请教有什么好办法?

论坛徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之北京
日期:2016-07-06 15:42:0715-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:0915-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56黄金圣斗士
日期:2015-12-02 11:44:35白银圣斗士
日期:2015-11-25 14:32:43白银圣斗士
日期:2015-11-23 12:53:352015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:482015亚冠之首尔
日期:2015-09-01 16:46:052015亚冠之德黑兰石油
日期:2015-08-31 11:39:192015亚冠之萨济拖拉机
日期:2015-08-28 21:06:5315-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53
发表于 2014-01-21 14:06 |显示全部楼层
  1. [root@centos6-1 ~]#
  2. [root@centos6-1 ~]# awk '$NF~/G$/{if(!a[$NF]++)b[++n]=$NF}END{for(i=1;i<=n;i++)s=s?s"|"b[i]" "a[b[i]]:b[i]" "a[b[i]];print s;s=""}' file
  3. ap-2.4G 26|ap-5G 16
  4. [root@centos6-1 ~]#
复制代码

论坛徽章:
33
荣誉会员
日期:2011-11-23 16:44:17天秤座
日期:2014-08-26 16:18:20天秤座
日期:2014-08-29 10:12:18丑牛
日期:2014-08-29 16:06:45丑牛
日期:2014-09-03 10:28:58射手座
日期:2014-09-03 16:01:17寅虎
日期:2014-09-11 14:24:21天蝎座
日期:2014-09-17 08:33:55IT运维版块每日发帖之星
日期:2016-04-17 06:23:27操作系统版块每日发帖之星
日期:2016-04-18 06:20:00IT运维版块每日发帖之星
日期:2016-04-24 06:20:0015-16赛季CBA联赛之天津
日期:2016-05-06 12:46:59
发表于 2014-01-21 14:09 |显示全部楼层
插入一个数据库, 然后, 你想统计哪个时段的就select出来就行了. 这是最简单的办法. 

论坛徽章:
33
荣誉会员
日期:2011-11-23 16:44:17天秤座
日期:2014-08-26 16:18:20天秤座
日期:2014-08-29 10:12:18丑牛
日期:2014-08-29 16:06:45丑牛
日期:2014-09-03 10:28:58射手座
日期:2014-09-03 16:01:17寅虎
日期:2014-09-11 14:24:21天蝎座
日期:2014-09-17 08:33:55IT运维版块每日发帖之星
日期:2016-04-17 06:23:27操作系统版块每日发帖之星
日期:2016-04-18 06:20:00IT运维版块每日发帖之星
日期:2016-04-24 06:20:0015-16赛季CBA联赛之天津
日期:2016-05-06 12:46:59
发表于 2014-01-21 14:09 |显示全部楼层
插入一个数据库, 然后, 你想统计哪个时段的就select出来就行了. 这是最简单的办法. 

论坛徽章:
41
操作系统版块每日发帖之星
日期:2016-08-21 06:20:00每日论坛发贴之星
日期:2016-05-05 06:20:00操作系统版块每日发帖之星
日期:2016-05-05 06:20:00IT运维版块每日发帖之星
日期:2016-05-05 06:20:0015-16赛季CBA联赛之山西
日期:2016-04-27 08:49:00操作系统版块每日发帖之星
日期:2016-04-25 06:20:00操作系统版块每日发帖之星
日期:2016-04-17 06:23:2815-16赛季CBA联赛之吉林
日期:2016-03-25 15:46:3415-16赛季CBA联赛之四川
日期:2016-03-25 14:26:19操作系统版块每日发帖之星
日期:2016-05-27 06:20:00操作系统版块每日发帖之星
日期:2016-05-28 06:20:00IT运维版块每日发帖之星
日期:2016-08-18 06:20:00
发表于 2014-01-21 14:15 |显示全部楼层
回复 2# reyleon

这样没办法统计时间段,不过还是非常感谢!!


   

论坛徽章:
41
操作系统版块每日发帖之星
日期:2016-08-21 06:20:00每日论坛发贴之星
日期:2016-05-05 06:20:00操作系统版块每日发帖之星
日期:2016-05-05 06:20:00IT运维版块每日发帖之星
日期:2016-05-05 06:20:0015-16赛季CBA联赛之山西
日期:2016-04-27 08:49:00操作系统版块每日发帖之星
日期:2016-04-25 06:20:00操作系统版块每日发帖之星
日期:2016-04-17 06:23:2815-16赛季CBA联赛之吉林
日期:2016-03-25 15:46:3415-16赛季CBA联赛之四川
日期:2016-03-25 14:26:19操作系统版块每日发帖之星
日期:2016-05-27 06:20:00操作系统版块每日发帖之星
日期:2016-05-28 06:20:00IT运维版块每日发帖之星
日期:2016-08-18 06:20:00
发表于 2014-01-21 14:20 |显示全部楼层
reyleon 发表于 2014-01-21 14:06


这个文件里有大概1000个这样的字符块(例子重复复制1000次的效果),这样统计出来的结果不行啊

论坛徽章:
41
操作系统版块每日发帖之星
日期:2016-08-21 06:20:00每日论坛发贴之星
日期:2016-05-05 06:20:00操作系统版块每日发帖之星
日期:2016-05-05 06:20:00IT运维版块每日发帖之星
日期:2016-05-05 06:20:0015-16赛季CBA联赛之山西
日期:2016-04-27 08:49:00操作系统版块每日发帖之星
日期:2016-04-25 06:20:00操作系统版块每日发帖之星
日期:2016-04-17 06:23:2815-16赛季CBA联赛之吉林
日期:2016-03-25 15:46:3415-16赛季CBA联赛之四川
日期:2016-03-25 14:26:19操作系统版块每日发帖之星
日期:2016-05-27 06:20:00操作系统版块每日发帖之星
日期:2016-05-28 06:20:00IT运维版块每日发帖之星
日期:2016-08-18 06:20:00
发表于 2014-01-21 14:21 |显示全部楼层
回复 3# q1208c


  上面几行不是一致的格式,所以还是文本处理快点

论坛徽章:
7
亥猪
日期:2013-10-10 17:00:29辰龙
日期:2013-10-12 16:23:19卯兔
日期:2013-11-18 17:01:27金牛座
日期:2014-09-09 10:17:052015七夕节徽章
日期:2015-08-21 11:06:172015亚冠之柏太阳神
日期:2015-09-25 13:56:42数据库技术版块每日发帖之星
日期:2016-08-06 06:20:00
发表于 2014-01-21 15:52 |显示全部楼层
回复 6# jixuuse
你这句话是什么意思??
  1. awk '/show clock/{getline d;split(d,a,FS);for(i=1;i<=4;i++)printf a[i]FS}/STA#/{c=1;next}c{b[$NF]++}END{for(i in b)printf "|" i FS b[i];print ""}' file
  2. Tue Jan 21 10:38:29 |ap-2.4G 26|ap-5G 16
复制代码

论坛徽章:
33
荣誉会员
日期:2011-11-23 16:44:17天秤座
日期:2014-08-26 16:18:20天秤座
日期:2014-08-29 10:12:18丑牛
日期:2014-08-29 16:06:45丑牛
日期:2014-09-03 10:28:58射手座
日期:2014-09-03 16:01:17寅虎
日期:2014-09-11 14:24:21天蝎座
日期:2014-09-17 08:33:55IT运维版块每日发帖之星
日期:2016-04-17 06:23:27操作系统版块每日发帖之星
日期:2016-04-18 06:20:00IT运维版块每日发帖之星
日期:2016-04-24 06:20:0015-16赛季CBA联赛之天津
日期:2016-05-06 12:46:59
发表于 2014-01-21 16:01 |显示全部楼层
回复 7# jixuuse


我曾经做过同样的事情.

数据库做这件事, 是最快的, 没有之一. 

因为, 你的数据不断的增加, 而你不可能每次修改你的脚本来支持不同的文件, 可能还有不同的目录. 


当然, 如果你能写出 超过数据库引擎的代码, 我会来膜拜的. 

论坛徽章:
7
亥猪
日期:2013-10-10 17:00:29辰龙
日期:2013-10-12 16:23:19卯兔
日期:2013-11-18 17:01:27金牛座
日期:2014-09-09 10:17:052015七夕节徽章
日期:2015-08-21 11:06:172015亚冠之柏太阳神
日期:2015-09-25 13:56:42数据库技术版块每日发帖之星
日期:2016-08-06 06:20:00
发表于 2014-01-21 16:44 |显示全部楼层
回复 9# q1208c
支持!

   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP