论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2008-01-28 17:48 |只看该作者 |倒序浏览

我有一个要分析的文件，如下：

各模块CPU占用率

---------------

模块号    CPU占用状况

   0    30%,正常

   1    28%,正常

   2    26%,正常

   3    25%,正常

   4    21%,正常

   5    33%,正常

   6    22%,正常

   7    27%,正常

   8    27%,正常

   9    26%,正常

   10    05%,正常

(结果个数 = 11)

--- END
检查时间是: 2008-01-28 13:17:00

我想用AWK分析这个文件，把里面的时间（最后一行）提取出来，放到这个文件的第一列，模块号和cpu占用状况下的具体数值都提取出来形成一个新的文件，格式如下:
2008-01-28 13:17:00|0|30|正常
2008-01-28 13:17:00|1|28|正常
2008-01-28 13:17:00|2|26|正常
2008-01-28 13:17:00|3|25|正常
2008-01-28 13:17:00|4|21|正常
2008-01-28 13:17:00|5|33|正常
2008-01-28 13:17:00|6|22|正常
2008-01-28 13:17:00|7|27|正常
2008-01-28 13:17:00|8|27|正常
2008-01-28 13:17:00|9|26|正常
2008-01-28 13:17:00|10|05|正常

写了一个脚本:

BEGIN {
}

index($0,"各模块CPU占用率")

{
dn =0          #模块号
baifenbi =0 #百分比

while(readline())
{
if(index($0,"--- END"))
{
        break;
}
  else if($NF=="CPU占用状况" && NF==2)
while(readline())
{
  if(index($0,"(结果个数"))
{
        break;
}
  dn =$1
baifenbi=$2
split(baifenbi,u,",");
x1=u[1]
  x2=u[2]
  split(x1,z,"%");
  y=z[1]

print dn"|"y"|"x2
}
}
}

END{
}
可以分析出这样的结果，可是时间不知道如何取出，请问高手如何处理，谢谢!
1|28|正常
2|26|正常
3|25|正常
4|21|正常
5|33|正常
6|22|正常
7|27|正常
8|27|正常
9|26|正常
10|05|正常

文库|博客

ly5066113

巨富豪门

论坛徽章:: 23

2楼 [报告]

发表于 2008-01-28 17:58 |只看该作者

awk '$1~/^[0-9]+$/{sub(/,/,"|",$2);a[$1"|"$2]++}/^检查时间/{b=$2" "$3}END{for(i in a) print b"|"i}' urfile

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

gcllk

白手起家

论坛徽章:: 0

3楼 [报告]

发表于 2008-01-28 18:15 |只看该作者

回复 #2 ly5066113 的帖子

老大，看看能在我写的脚本上想想办法吗？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

springwind426

小富即安

论坛徽章:: 0

4楼 [报告]

发表于 2008-01-28 18:16 |只看该作者

awk 'BEGIN{FS="[| ]+"}
/各模块CPU占用/{
while( getline > 0 ){
if($0~/检查时间是/){
dstr=$2" "$3
for(i=0;i<=10;i++) print dstr a[i]
break
}
if($0~/^[[:blank:]]*[0-9]/){
gsub(/[[:blank:]]+/,"|")
sub(/%,/,"|")
a[$2]=$0
}
}
}' 数据文件

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

gcllk

白手起家

论坛徽章:: 0

5楼 [报告]

发表于 2008-01-29 09:04 |只看该作者

回复 #1 gcllk 的帖子

高人的回答真是让我眼界大开呀

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

gcllk

白手起家

论坛徽章:: 0

6楼 [报告]

发表于 2008-01-29 09:38 |只看该作者

awk 'BEGIN{FS="[| ]+"}
/各模块CPU占用/{
while( getline > 0 ){
      if($0~/检查时间是/){
            dstr=$2" "$3
            for(i=0;i<=10;i++) print dstr a
            break
      }
      if($0~/^[[:blank:]]*[0-9]/){
            gsub(/[[:blank:]]+/,"|")
            sub(/%,/,"|")
            a[$2]=$0
      }
}
}'  数据文件

还有一个问题，就是我要分析的文件中模块号是不固定的，可能有10个模块，也可能有20个，这就导致
for(i=0;i<=10;i++) print dstr a
这个语句有问题，请问怎么在这个基础上改呢，谢了!