Chinaunix

标题: 数据按机器名重新排列 [打印本页]

作者: arccos2002 时间: 2009-06-12 10:50
标题: 数据按机器名重新排列
如下文本格式：
102  CPU Utilization  CPU0 [cpu]    0
102  CPU Utilization  CPU1 [cpu]    0
102  CPU Utilization  CPU2 [cpu]    0
102  CPU Utilization  CPU3 [cpu]    0
102  CPU Utilization  CPU4 [cpu]    0
102  CPU Utilization  CPU5 [cpu]    0
102  CPU Utilization  CPU6 [cpu]    0
102  CPU Utilization  CPU7 [cpu]    0
102  Used Space  C: Label:  Seri [hdd_used] 11.898
102  Used Space  D: Label:    [hdd_used] 0.7676
102  Used Space  Physical Memory [hdd_used] 7.0095
201  CPU Utilization  CPU0 [cpu]    0
201  CPU Utilization  CPU1 [cpu]    0
201  CPU Utilization  CPU2 [cpu]    0
201  CPU Utilization  CPU3 [cpu]    0
201  CPU Utilization  CPU4 [cpu]    0
201  CPU Utilization  CPU5 [cpu]    0
201  CPU Utilization  CPU6 [cpu]    0
201  CPU Utilization  CPU7 [cpu]    0
201  Used Space  C: Label:  Seri [hdd_used] 11.8008
201  Used Space  D: Label:  Seri [hdd_used] 0.5128
201  Used Space  E: Label

ata [hdd_used] 43.5829
201  Used Space  F: Label:Log  S [hdd_used] 5.2436
201  Used Space  Physical Memory [hdd_used] 8.1337
202  CPU Utilization  CPU0 [cpu]    0
202  CPU Utilization  CPU1 [cpu]    0
202  CPU Utilization  CPU2 [cpu]    0
202  CPU Utilization  CPU3 [cpu]    0
202  CPU Utilization  CPU4 [cpu]    0
202  CPU Utilization  CPU5 [cpu]    0
……
现在要处理成这样的格式
机器名 CPU 0 CPU 1  …… CPU 8 Used Space  C: Label:  Seri [hdd_used] Used Space  D: Label:  Seri [hdd_used] ……
102    0       0 ……
201    0       0 ……
202
……
请问如何处理比较妥当

[ 本帖最后由 arccos2002 于 2009-6-12 10:58 编辑 ]

作者: codfei 时间: 2009-06-12 10:56
没看懂需求

作者: arccos2002 时间: 2009-06-12 10:58
重新编辑了下
再看下

作者: blackold 时间: 2009-06-12 11:04
每个记录的标题:
机器名 CPU 0 CPU 1 …… CPU 8 Used Space C: Label: Seri [hdd_used] Used Space D: Label: Seri [hdd_used] ……
不相同啊，要如何处理？

作者: arccos2002 时间: 2009-06-12 11:07
标题: 回复 #4 blackold 的帖子
暂时不考虑这个问题，
先实现
102 0 0 ……
201 0 0 ……
202

作者: greendays 时间: 2009-06-12 11:11
标题: 回复 #1 arccos2002 的帖子
awk '/CPU/{print $1,$4,$NF}' urf
要这？？

作者: arccos2002 时间: 2009-06-12 11:14
标题: 回复 #6 greendays 的帖子
是每个机器的所有数据
比如102 那格式就为
102 后面跟所有的数据

作者: kwokcn 时间: 2009-06-12 11:21
写的有点啰嗦。

awk '!s||$1!=s{print "";s=$1;printf s"\t"$NF;next}{printf "\t"$NF}' URFILE

复制代码

作者: blackold 时间: 2009-06-12 11:28
try:

awk '$1!=prev{if(NR>1)print a[prev];a[$1]=$1;prev=$1;next}{a[$1]=a[$1] " "$NF}END{print a[prev]}' urfile

复制代码

作者: arccos2002 时间: 2009-06-12 11:30
都运行成功
谢谢黑哥和狼烟
最好能解释下为什么这么写

作者: blackold 时间: 2009-06-12 11:38
标题: 回复 #8 kwokcn 的帖子
狼烟的方法比我的好，修改一下：

awk '$1!=prev{if(NR>1)print "";printf $1 " " $NF;prev=$1;next }{printf " " $NF}END{print ""}' urfile

复制代码

作者: kwokcn 时间: 2009-06-12 11:42
标题: 回复 #11 blackold 的帖子
思路都一样的，无所谓好坏了。

To 楼主：
你的文本第一个字段是机器名，最后一个字段是赋值，所以通过判断$1是否发生变化按相应格式输出$NF就行了。

作者: lucash 时间: 2009-06-12 11:53
是要这样之么？

awk '{if(!a[$1]) a[$1]=$4;else if ($2~/CPU/) {a[$1]=a[$1]","$4} else {a[$1]=a[$1]" "$2" "$3" "$4" "$5" "$6}}END{for(i in a) printf"\t%-5s%-s\n",i,a[i]}' file

复制代码

结果是这样的：

102 CPU0 CPU1 CPU2 CPU3 CPU4 CPU5 CPU6 CPU7 Used Space C: Label: Seri Used Space D: Label: [hdd_used] Used Space Physical Memory [hdd_used]
201 CPU0 CPU1 CPU2 CPU3 CPU4 CPU5 CPU6 CPU7 Used Space C: Label: Seri Used Space D: Label: Seri Used Space E: Label:Data [hdd_used] Used Space F: Label:Log S Used Space Physical Memory [hdd_used]
202 CPU0 CPU1 CPU2 CPU3 CPU4 CPU5

复制代码

作者: lucash 时间: 2009-06-12 12:29
看明白了：这样好像可以：

bash-3.2# awk '{if(!a[$1]) a[$1]=$1; else {a[$1]=a[$1]" "$NF}}END{for(i in a) print a[i]}' file

复制代码

结果是这样的

102 0 0 0 0 0 0 0 11.898 0.7676 7.0095
201 0 0 0 0 0 0 0 11.8008 0.5128 43.5829 5.2436 8.1337
202 0 0 0 0 0

复制代码

[ 本帖最后由 lucash 于 2009-6-12 12:35 编辑 ]

欢迎光临 Chinaunix (http://bbs.chinaunix.net/)