免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 5219 | 回复: 5
打印 上一主题 下一主题

提取数据 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-08-22 11:11 |只看该作者 |倒序浏览
本帖最后由 kggg 于 2013-08-22 11:12 编辑

有这么一个文件, 有很多如下格式的数据:

content=<<EOT
a = g 100
h  ok
next h unstable
t = time  2013/08/22 10:52:00
host    192.168.1.1
EOT

content=<<EOT
a = g 200
h  ok
next h unstable
t = time  2013/08/22 10:52:10
host    192.168.1.2
EOT

content=<<EOT
a = g 100
next h unstable
t = time  2013/08/22 10:53:00
host    192.168.1.1
EOT

content=<<EOT
a = g 200
next h unstable
t = time  2013/08/22 10:55:10
host    192.168.1.2
EOT

....

想从中提取content EOT之间内容中host与time的值 , 内容段中需要包含"h ok".

论坛徽章:
1
双子座
日期:2013-11-06 17:18:01
2 [报告]
发表于 2013-08-22 12:37 |只看该作者
比较笨的方法
  1. #!/usr/bin/perl
  2. use strict;
  3. my $flip;
  4. while (<DATA>){
  5.         if(/content=<<EOT/.../EOT/){
  6.                 if(/h\s+ok/){$flip=1;};

  7.                 if($flip ==1){
  8.                         if(/time/){print;};
  9.                         if(/host/){print;};
  10.                 }
  11.                 $flip = 0 if (/^EOT/);
  12.         }
  13. }





  14. __DATA__
  15. content=<<EOT
  16. a = g 100
  17. h  ok
  18. next h unstable
  19. t = time  2013/08/22 10:52:00
  20. host    192.168.1.1
  21. EOT

  22. content=<<EOT
  23. a = g 200
  24. h  ok
  25. next h unstable
  26. t = time  2013/08/22 10:52:10
  27. host    192.168.1.2
  28. EOT

  29. content=<<EOT
  30. a = g 100
  31. next h unstable
  32. t = time  2013/08/22 10:53:00
  33. host    192.168.1.1
  34. EOT
复制代码

论坛徽章:
0
3 [报告]
发表于 2013-08-22 12:57 |只看该作者
  1. #!/usr/bin/perl
  2. use 5.010;
  3. my $data = do { local $/; <DATA> };
  4. for ( split /^\s*$/m, $data ) {
  5.     /^h\s+ok/m or next;
  6.     /time\s+(.*)^.*host\s+(\S+)/ms;
  7.     print join "\t", $2, $1;
  8. }

  9. __DATA__
  10. content=<<EOT
  11. a = g 100
  12. h  ok
  13. next h unstable
  14. t = time  2013/08/22 10:52:00
  15. host    192.168.1.1
  16. EOT

  17. content=<<EOT
  18. a = g 200
  19. h  ok
  20. next h unstable
  21. t = time  2013/08/22 10:52:10
  22. host    192.168.1.2
  23. EOT

  24. content=<<EOT
  25. a = g 100
  26. next h unstable
  27. t = time  2013/08/22 10:53:00
  28. host    192.168.1.1
  29. EOT

  30. content=<<EOT
  31. a = g 200
  32. next h unstable
  33. t = time  2013/08/22 10:55:10
  34. host    192.168.1.2
  35. EOT
复制代码

论坛徽章:
0
4 [报告]
发表于 2013-08-22 13:52 |只看该作者
  1. #!/usr/bin/perl
  2. use warnings;
  3. use strict;


  4. undef $/;
  5. while (my $line = <DATA>) {
  6.     while ($line =~ m/content=<<EOT(.*?)EOT/gsi) {
  7.        my $match = $1;
  8.        if ( $match =~ m/h\s+ok/ ) {
  9.            $match =~ m/time\s+(.*?)host\s+(.*)$/gs;
  10.            print "$1\n$2\n";
  11.        }
  12.     }
  13. }

  14. __DATA__
  15. content=<<EOT
  16. a = g 100
  17. h  ok
  18. next h unstable
  19. t = time  2013/08/22 10:52:00
  20. host    192.168.1.1
  21. EOT

  22. content=<<EOT
  23. a = g 200
  24. h  ok
  25. next h unstable
  26. t = time  2013/08/22 10:52:10
  27. host    192.168.1.2
  28. EOT

  29. content=<<EOT
  30. a = g 100
  31. next h unstable
  32. t = time  2013/08/22 10:53:00
  33. host    192.168.1.1
  34. EOT

  35. content=<<EOT
  36. a = g 200
  37. next h unstable
  38. t = time  2013/08/22 10:55:10
  39. host    192.168.1.2
  40. EOT
复制代码

论坛徽章:
0
5 [报告]
发表于 2013-08-23 12:07 |只看该作者
回复 3# cinanine

漏掉说明一个特殊情况,  在字段中有可能time值的行排在ok行的前面.


   

论坛徽章:
0
6 [报告]
发表于 2013-08-23 13:02 |只看该作者
回复 5# kggg
  1. undef $/;
  2. while (my $line = <DATA>) {
  3.     while ($line =~ m/content=<<EOT(.*?)EOT/gsi) {
  4.        my $match = $1;
  5.        if ( $match =~ m/h\s+ok/ ) {
  6.            $match =~ m/time\s+(.*?)\n/gs;
  7.            print "$1\t";
  8.        }
  9.        if ( $match =~ m/h\s+ok/ ) {
  10.            $match =~ m/host\s+(.*?)\s/gs;
  11.            print "$1\n";
  12.        }
  13.     }
  14. }
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP