免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 4415 | 回复: 12
打印 上一主题 下一主题

[文本处理] 求助awk问题。。。 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-10-12 13:38 |只看该作者 |倒序浏览
本帖最后由 我爱大桃 于 2013-10-12 14:53 编辑

有这样一段数据:
<2013/09/16 09:54:11:539000(347:47235084696480)INFO>: -----------------------------
<2013/09/16 13:07:40:177026(1650:47026108042144)INFO>: | 系统内核数据:
<2013/09/16 13:07:40:177039(1650:47026108042144)INFO>: | 内核消息数量:         [2194731]
<2013/09/16 13:30:11:539000(347:47235084696480)INFO>: -----------------------------
<2013/09/16 13:30:40:177026(1650:47026108042144)INFO>: | 系统内核数据:
<2013/09/16 13:30:40:177039(1650:47026108042144)INFO>: | 内核消息数量:         [2184731]
<2013/09/16 13:50:11:539000(347:47235084696480)INFO>: -----------------------------
<2013/09/16 13:50:40:177026(1650:47026108042144)INFO>: | 系统内核数据:
<2013/09/16 13:50:40:177039(1650:47026108042144)INFO>: | 内核消息数量:         [94730]

我想通过awk来实现打印出这样的情景:
time               内核消息数量
13:07:40        2194731
13:30:40        2184731
13:50:40        94730

不知道各位有什么好的方法来实现。。。。
刚才楼下的几位已经帮我实现了上面的功能了 十分感谢,出来的效果是我需要的样子,十分感谢。
awk -F '[][ :]+' '$0 ~ /\[/{print $2":"$3":"$4,$(NF-1)}'
awk -F '[][ :]+' 'BEGIN{print "time\t\t内核"}/]$/{print $2":"$3":"$4"\t"$(NF-1)
awk -F '[][ :]+' '{print $2":"$3":"$4"\t"$(NF-1)}'

现在如果我需要的数据比之前多了很多:
<2013/09/16 09:54:11:539000(347:47235084696480)INFO>: -----------------------------
<2013/09/16 13:07:40:177026(1650:47026108042144)INFO>: | 系统内核数据:
<2013/09/16 13:07:40:177039(1650:47026108042144)INFO>: | 内核消息数量:         [2194731]
<2013/09/16 13:07:40:188925(1650:47026108042144)INFO>: KKK[902601]: queue [404]
<2013/09/16 13:07:40:188927(1650:47026108042144)INFO>: KKK[902602]: queue [404]
<2013/09/16 13:07:40:188927(asdasdasd
<2013/09/16 13:07:40:188929(1650:47026108042144)INFO>: KKK[902603]: queue [404]
<2013/09/16 13:30:11:539000(347:47235084696480)INFO>: -----------------------------
<2013/09/16 13:30:40:177026(1650:47026108042144)INFO>: | 系统内核数据:
<2013/09/16 13:30:40:177039(1650:47026108042144)INFO>: | 内核消息数量:         [2184731]
<2013/09/16 13:30:40:188925(1650:47026108042144)INFO>: KKK[902601]: queue [405]
<2013/09/16 13:30:40:188927(1650:47026108042144)INFO>: KKK[902602]: queue [405]
<2013/09/16 13:30:40:188929(1650:47026108042144)INFO>: KKK[902603]: queue [405]
<2013/09/16 13:30:40:188927(asdasdasd
<2013/09/16 13:50:11:539000(347:47235084696480)INFO>: -----------------------------
<2013/09/16 13:50:40:177026(1650:47026108042144)INFO>: | 系统内核数据:
<2013/09/16 13:50:40:177039(1650:47026108042144)INFO>: | 内核消息数量:         [94730]
<2013/09/16 13:50:40:188925(1650:47026108042144)INFO>: KKK[902601]: queue [406]
<2013/09/16 13:50:40:188927(1650:47026108042144)INFO>: KKK[902602]: queue [404]
<2013/09/16 13:50:40:188929(1650:47026108042144)INFO>: KKK[902603]: queue [408]
<2013/09/16 13:50:40:188927(asdasdasd

然后将同一时刻的KKK[902601],KKK[902602],KKK[902603]后面的queue[]里面的值取出来进行累加,然后再打印成下面的形式:
time               内核消息数量    queue
13:07:40        2194731        1212
13:30:40        2184731        1215
13:50:40        94730            1218

不知道各位有什么好办法,还有一点,awk -F '[][ :]+',这里的'[][ :]+'是什么意思?这么复杂的FS我第一次看到。。。我是新手,麻烦也一起解答了吧。。。。






论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
2 [报告]
发表于 2013-10-12 13:45 |只看该作者
没测试:
  1. awk -F '[][ :]+' '{print $2":"$3":"$4"\t"$(NF-1)}' file
复制代码

论坛徽章:
0
3 [报告]
发表于 2013-10-12 13:58 |只看该作者
回复 2# ly5066113

不好用。。。我自己试着弄一下
   

论坛徽章:
50
15-16赛季CBA联赛之广夏
日期:2018-11-05 09:42:462015年亚冠纪念徽章
日期:2015-07-23 11:58:122015亚冠之广州富力
日期:2015-07-07 08:26:172015亚冠之塔什干棉农
日期:2015-06-29 09:08:072015年亚洲杯之伊朗
日期:2015-03-08 20:51:012015年迎新春徽章
日期:2015-03-04 09:58:11未羊
日期:2014-10-16 22:41:47处女座
日期:2014-10-16 15:33:33酉鸡
日期:2014-03-13 12:54:10巳蛇
日期:2014-03-10 14:39:052015亚冠之德黑兰石油
日期:2015-07-29 12:46:372015亚冠之德黑兰石油
日期:2015-08-07 12:54:11
4 [报告]
发表于 2013-10-12 14:03 |只看该作者
本帖最后由 WilliBhamlll 于 2013-10-12 14:10 编辑

回复 3# 我爱大桃


    稍微改一下就行了。
  1. awk -F '[][ :]+' 'BEGIN{print "time\t\t内核消息数量"}/]$/{print $2":"$3":"$4"\t"$(NF-1)}' file
复制代码

论坛徽章:
13
丑牛
日期:2013-08-16 15:08:22技术图书徽章
日期:2013-11-26 10:13:40双鱼座
日期:2013-11-08 15:03:26戌狗
日期:2013-11-08 13:52:30技术图书徽章
日期:2013-11-05 14:06:30戌狗
日期:2013-10-31 11:45:42CU十二周年纪念徽章
日期:2013-10-24 15:41:34天秤座
日期:2013-10-11 14:55:08子鼠
日期:2013-09-26 19:36:35水瓶座
日期:2013-09-26 17:44:56午马
日期:2013-08-26 10:24:23丑牛
日期:2013-08-19 14:43:22
5 [报告]
发表于 2013-10-12 14:03 |只看该作者
回复 3# 我爱大桃
  1. awk -F '[][ :]+' '$0 ~ /\[/{print $2":"$3":"$4,$(NF-1)}'
复制代码

论坛徽章:
0
6 [报告]
发表于 2013-10-12 14:24 |只看该作者
谢谢以上各位,基本功能已经实现,现在还需要加一点功能

论坛徽章:
0
7 [报告]
发表于 2013-10-12 15:05 |只看该作者
有好心人帮我的新需求吗?

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
8 [报告]
发表于 2013-10-12 15:15 |只看该作者
还有一点,awk -F '[][ :]+',这里的'[][ :]+'是什么意思?

右方括号、左方括号、空格、冒号作为列分隔符

论坛徽章:
50
15-16赛季CBA联赛之广夏
日期:2018-11-05 09:42:462015年亚冠纪念徽章
日期:2015-07-23 11:58:122015亚冠之广州富力
日期:2015-07-07 08:26:172015亚冠之塔什干棉农
日期:2015-06-29 09:08:072015年亚洲杯之伊朗
日期:2015-03-08 20:51:012015年迎新春徽章
日期:2015-03-04 09:58:11未羊
日期:2014-10-16 22:41:47处女座
日期:2014-10-16 15:33:33酉鸡
日期:2014-03-13 12:54:10巳蛇
日期:2014-03-10 14:39:052015亚冠之德黑兰石油
日期:2015-07-29 12:46:372015亚冠之德黑兰石油
日期:2015-08-07 12:54:11
9 [报告]
发表于 2013-10-12 15:25 |只看该作者
回复 7# 我爱大桃
  1. awk -F '[][ :]+' 'BEGIN{print "time\t\t内核消息数量\tqueue"}/\|/&&/]$/{S=$2":"$3":"$4"\t"$(NF-1);next}/KKK/{a[S]+=$(NF-1)}END{for(i in a)print i"\t\t"a[i]}' file
  2. time            内核消息数量    queue
  3. 13:30:40        2184731         1215
  4. 13:07:40        2194731         1212
  5. 13:50:40        94730           1218
复制代码

论坛徽章:
0
10 [报告]
发表于 2013-10-12 16:12 |只看该作者
回复 9# WilliBhamlll
写的超棒,功能可以实现了。。。
但以我目前功力看起来有点费劲,容我慢慢研究研究哈

   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP