Chinaunix

标题: 数据按机器名重新排列 [打印本页]

作者: arccos2002    时间: 2009-06-12 10:50
标题: 数据按机器名重新排列
如下文本格式:
102  CPU Utilization  CPU0 [cpu]       0
102  CPU Utilization  CPU1 [cpu]       0
102  CPU Utilization  CPU2 [cpu]       0
102  CPU Utilization  CPU3 [cpu]       0
102  CPU Utilization  CPU4 [cpu]       0
102  CPU Utilization  CPU5 [cpu]       0
102  CPU Utilization  CPU6 [cpu]       0
102  CPU Utilization  CPU7 [cpu]       0
102  Used Space  C: Label:  Seri [hdd_used]    11.898
102  Used Space  D: Label:       [hdd_used]    0.7676
102  Used Space  Physical Memory [hdd_used]    7.0095
201  CPU Utilization  CPU0 [cpu]       0
201  CPU Utilization  CPU1 [cpu]       0
201  CPU Utilization  CPU2 [cpu]       0
201  CPU Utilization  CPU3 [cpu]       0
201  CPU Utilization  CPU4 [cpu]       0
201  CPU Utilization  CPU5 [cpu]       0
201  CPU Utilization  CPU6 [cpu]       0
201  CPU Utilization  CPU7 [cpu]       0
201  Used Space  C: Label:  Seri [hdd_used]    11.8008
201  Used Space  D: Label:  Seri [hdd_used]    0.5128
201  Used Space  E: Labelata   [hdd_used]    43.5829
201  Used Space  F: Label:Log  S [hdd_used]    5.2436
201  Used Space  Physical Memory [hdd_used]    8.1337
202  CPU Utilization  CPU0 [cpu]       0
202  CPU Utilization  CPU1 [cpu]       0
202  CPU Utilization  CPU2 [cpu]       0
202  CPU Utilization  CPU3 [cpu]       0
202  CPU Utilization  CPU4 [cpu]       0
202  CPU Utilization  CPU5 [cpu]       0
……
现在要处理成这样的格式
机器名 CPU 0 CPU 1  …… CPU 8 Used Space  C: Label:  Seri [hdd_used] Used Space  D: Label:  Seri [hdd_used] ……
102     0          0    ……
201     0          0    ……
202
……
请问如何处理比较妥当

[ 本帖最后由 arccos2002 于 2009-6-12 10:58 编辑 ]
作者: codfei    时间: 2009-06-12 10:56
没看懂需求
作者: arccos2002    时间: 2009-06-12 10:58
重新编辑了下
再看下
作者: blackold    时间: 2009-06-12 11:04
每个记录的标题:
机器名 CPU 0 CPU 1  …… CPU 8 Used Space  C: Label:  Seri [hdd_used] Used Space  D: Label:  Seri [hdd_used] ……
不相同啊,要如何处理?
作者: arccos2002    时间: 2009-06-12 11:07
标题: 回复 #4 blackold 的帖子
暂时不考虑这个问题,
先实现
102     0          0    ……
201     0          0    ……
202
作者: greendays    时间: 2009-06-12 11:11
标题: 回复 #1 arccos2002 的帖子
awk '/CPU/{print $1,$4,$NF}' urf
要这??
作者: arccos2002    时间: 2009-06-12 11:14
标题: 回复 #6 greendays 的帖子
是每个机器的所有数据
比如102 那格式就为
102 后面跟所有的数据
作者: kwokcn    时间: 2009-06-12 11:21
写的有点啰嗦。

  1. awk '!s||$1!=s{print "";s=$1;printf s"\t"$NF;next}{printf "\t"$NF}' URFILE
复制代码

作者: blackold    时间: 2009-06-12 11:28
try:
  1. awk '$1!=prev{if(NR>1)print a[prev];a[$1]=$1;prev=$1;next}{a[$1]=a[$1] " "$NF}END{print a[prev]}' urfile
复制代码

作者: arccos2002    时间: 2009-06-12 11:30
都运行成功
谢谢黑哥和狼烟
最好能解释下为什么这么写
作者: blackold    时间: 2009-06-12 11:38
标题: 回复 #8 kwokcn 的帖子
狼烟的方法比我的好,修改一下:
  1. awk '$1!=prev{if(NR>1)print "";printf $1 " " $NF;prev=$1;next }{printf " " $NF}END{print ""}' urfile
复制代码

作者: kwokcn    时间: 2009-06-12 11:42
标题: 回复 #11 blackold 的帖子
思路都一样的,无所谓好坏了。

To 楼主:
你的文本第一个字段是机器名,最后一个字段是赋值,所以通过判断$1是否发生变化按相应格式输出$NF就行了。
作者: lucash    时间: 2009-06-12 11:53
是要这样之么?
  1. awk '{if(!a[$1]) a[$1]=$4;else if ($2~/CPU/) {a[$1]=a[$1]","$4} else {a[$1]=a[$1]" "$2" "$3" "$4" "$5" "$6}}END{for(i in a) printf"\t%-5s%-s\n",i,a[i]}' file
复制代码

结果是这样的:

  1. 102  CPU0 CPU1 CPU2 CPU3 CPU4 CPU5 CPU6 CPU7 Used Space C: Label: Seri Used Space D: Label: [hdd_used] Used Space Physical Memory [hdd_used]
  2. 201  CPU0 CPU1 CPU2 CPU3 CPU4 CPU5 CPU6 CPU7 Used Space C: Label: Seri Used Space D: Label: Seri Used Space E: Label:Data [hdd_used] Used Space F: Label:Log S Used Space Physical Memory [hdd_used]
  3. 202  CPU0 CPU1 CPU2 CPU3 CPU4 CPU5
复制代码

作者: lucash    时间: 2009-06-12 12:29
看明白了:这样好像可以:
  1. bash-3.2# awk '{if(!a[$1]) a[$1]=$1; else {a[$1]=a[$1]" "$NF}}END{for(i in a) print a[i]}' file
复制代码

结果是这样的

  1. 102 0 0 0 0 0 0 0 11.898 0.7676 7.0095
  2. 201 0 0 0 0 0 0 0 11.8008 0.5128 43.5829 5.2436 8.1337
  3. 202 0 0 0 0 0
复制代码

[ 本帖最后由 lucash 于 2009-6-12 12:35 编辑 ]




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2