免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 10863 | 回复: 67
打印 上一主题 下一主题

[文本处理] 大量数据的解析与比较处理 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-02-13 11:23 |只看该作者 |倒序浏览
本帖最后由 说不过去 于 2014-02-13 13:45 编辑

我解析了一个服务器日志文件 然后得出一些数据要与我的标准进行比较 数据量大
  1.      -------------------------------------------------------
  2.     |  /vobs/rru/rsl/acl/tacl:TEST RESULT        
  3.     |-------------------------------------------------------
  4.     |   3 cases passed
  5.     |-------------------------------------------------------
  6.     |   555:  =========== gcov_run : Coverage of acl = 57.45%  ===========
  7.     -------------------------------------------------------
  8.     -------------------------------------------------------
  9.     |  /vobs/rru/rsl/ampcontrol/tampcontrol:TEST RESULT        
  10.     |-------------------------------------------------------
  11.     |   Run: 3   Failure total: 2   Failures: 2   Errors: 0
  12.     |-------------------------------------------------------
  13.     |   592:  =========== gcov_run : Coverage of ampcontrol = 2.73106% ===========
  14.     -------------------------------------------------------
复制代码
类似上面的数据 假设第一种情况我要解析出 3 和 57.45%  第二种情况我要解析出 3  2  和  2.73106%
现在刚刚已经  大神们叫我解析
  1. echo $a | awk -F '[ :]+' '/passed/{print $2}/Run/{print $3,$6}'
复制代码
但是下面怎么处理

我的标准存放在一个文本文件中
  1. module          Total        Passed             Cov.
  2.         acl                    3                              96.00%
  3.         ampcontrol         3           <=1              83.00%
复制代码
然后我要导入我的标准 第一个是acl模块  解析出来的是 3和 57.45% 小于标准不符合要求  然后会得出判定 不合格
第二个模块是ampcontrol  解析出来的是 3 2 2.73106% 小于标准不符合要求  然后会得出判定 不合格
然后我将结果 存放到新的文件中 用下面的格式
module          Total        Passed                 Cov.       Total        Passed                 Cov
acl                  3                                   96.00%      3                                     57.45%        failed
ampcontrol       3                <=1              83.00%      3                2                    2.73106%     failed我不知道如何实现 请教  我第一次写脚本
如果愿意教我的话 请稍微写的详细些 谢谢啦

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
2 [报告]
发表于 2014-02-13 11:32 |只看该作者
判断是否合格就是比较那个百分比吗?

论坛徽章:
0
3 [报告]
发表于 2014-02-13 12:28 |只看该作者
回复 2# Shell_HAT
判断是考虑2个原因 第一就是那个覆盖率的高低  第二个是数据中解析出如果有fail的话 fail的值是不能大于标准中的passed

   

论坛徽章:
15
2015年辞旧岁徽章
日期:2015-03-03 16:54:15双鱼座
日期:2015-01-15 17:29:44午马
日期:2015-01-06 17:06:51子鼠
日期:2014-11-24 10:11:13寅虎
日期:2014-08-18 07:10:55酉鸡
日期:2014-04-02 12:24:51双子座
日期:2014-04-02 12:19:44天秤座
日期:2014-03-17 11:43:36亥猪
日期:2014-03-13 08:13:51未羊
日期:2014-03-11 12:42:03白羊座
日期:2013-11-20 10:15:18CU大牛徽章
日期:2013-04-17 11:48:45
4 [报告]
发表于 2014-02-13 12:52 |只看该作者
本帖最后由 rdcwayx 于 2014-02-13 12:54 编辑
说不过去 发表于 2014-02-13 12:28
回复 2# Shell_HAT
判断是考虑2个原因 第一就是那个覆盖率的高低  第二个是数据中解析出如果有fail的话 f ...


你的理解有误吧, pass = total - fail, 那么第二个记录的第一个原因是符合的, 因为 pass = 3 - 2 =1 (<=1), 而不只是那pass 和fail直接比较吧。

论坛徽章:
0
5 [报告]
发表于 2014-02-13 13:10 |只看该作者
回复 4# rdcwayx


    这个我知道啊 关键是你把整个脚本的写的过程告诉我啊 那个我会处理的啊 谢谢啊

论坛徽章:
15
2015年辞旧岁徽章
日期:2015-03-03 16:54:15双鱼座
日期:2015-01-15 17:29:44午马
日期:2015-01-06 17:06:51子鼠
日期:2014-11-24 10:11:13寅虎
日期:2014-08-18 07:10:55酉鸡
日期:2014-04-02 12:24:51双子座
日期:2014-04-02 12:19:44天秤座
日期:2014-03-17 11:43:36亥猪
日期:2014-03-13 08:13:51未羊
日期:2014-03-11 12:42:03白羊座
日期:2013-11-20 10:15:18CU大牛徽章
日期:2013-04-17 11:48:45
6 [报告]
发表于 2014-02-13 13:14 |只看该作者
本帖最后由 rdcwayx 于 2014-02-13 18:17 编辑

看到源文件了,先产生个数据文件。
  1. awk '/cases passed/{l=split($1,a,"[/:]");print a[l-2],$5,$18}
  2. /Run: /{l=split($1,a,"[/:]");print a[l-2],$6,$9,$24}
  3. ' RS="vobs" session.log

  4. acl 3 57.45%
  5. ampcontrol 3 2 2.73106%
  6. cfr 6 58.7955%
  7. cpmgr 16 87.0307%
  8. digitalsensors 9 21.8677%
  9. eeprom 5 69.987%
  10. fcpc 13 73.7325%
  11. gfh 14 96.0091%
  12. hfm 9 54.8601%
  13. pathdelay 6 73.37%
  14. psuisr 16 92.57%
  15. rpgc 14 82.645%
  16. txattn 16 75.441%
  17. tempsense 15 86.8121%
  18. tcs 11 60.3436%
  19. cpri 26 2 77.2301%
  20. delaymgr 9 90.8476%
  21. antcal 6 63.22%
  22. dpdcpu 9 65.6931%
  23. eh 24 77.6101%
  24. fcpcs 9 1 81.1428%
  25. fpgc 26 74.8622%
  26. led 15 86.7728%
  27. ralaisg 17 1 66.7043%
  28. reportmgr 22 79.635%
  29. ttlna 5 2 39.8396%
  30. txcntl 32 76.824%
  31. vswr 4 87.4331%
  32. iqec 7 39.5902%
  33. cam 53 2 72.7036%
复制代码

论坛徽章:
780
金牛座
日期:2014-02-26 17:49:58水瓶座
日期:2014-02-26 18:10:15白羊座
日期:2014-04-15 19:29:52寅虎
日期:2014-04-17 19:43:21酉鸡
日期:2014-04-19 21:24:10子鼠
日期:2014-04-22 13:55:24卯兔
日期:2014-04-22 14:20:58亥猪
日期:2014-04-22 16:13:09狮子座
日期:2014-05-05 22:31:17摩羯座
日期:2014-05-06 10:32:53处女座
日期:2014-05-12 09:23:11子鼠
日期:2014-05-21 18:21:27
7 [报告]
发表于 2014-02-13 13:18 |只看该作者
Passed<=1这个标准难以理解,难道标准是
Pass的case越少越好?

论坛徽章:
0
8 [报告]
发表于 2014-02-13 13:22 |只看该作者
回复 7# Herowinter


    其实你可以把这个标准中的pass理解成failed 但是他们约定的就是写pass 我也没办法

论坛徽章:
0
9 [报告]
发表于 2014-02-13 13:26 |只看该作者
回复 6# rdcwayx


    这个 RS="vobs" file  什么意思,怎么会报错

论坛徽章:
780
金牛座
日期:2014-02-26 17:49:58水瓶座
日期:2014-02-26 18:10:15白羊座
日期:2014-04-15 19:29:52寅虎
日期:2014-04-17 19:43:21酉鸡
日期:2014-04-19 21:24:10子鼠
日期:2014-04-22 13:55:24卯兔
日期:2014-04-22 14:20:58亥猪
日期:2014-04-22 16:13:09狮子座
日期:2014-05-05 22:31:17摩羯座
日期:2014-05-06 10:32:53处女座
日期:2014-05-12 09:23:11子鼠
日期:2014-05-21 18:21:27
10 [报告]
发表于 2014-02-13 13:26 |只看该作者
本帖最后由 Herowinter 于 2014-02-13 13:26 编辑

回复 8# 说不过去
不是,我理解你的需求了,应该这样的,
你的目标结果应该是记录一些case是否达到标准,
当Passed case数目比你标准里的小(<=1)或对需求(代码)
覆盖率比标准小,都判定为failed。


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP