免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 7109 | 回复: 16
打印 上一主题 下一主题

如何用perl 从文件里面抓一段内容出来? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-05-06 10:05 |只看该作者 |倒序浏览
本帖最后由 百分百好牛 于 2011-05-06 16:41 编辑

不好意思,我的平台是windows, 不是unix.
windows 2008, perl version 是 5.1

假设文件 output.txt的内容如下:
====================
the following are the list of products:
airplan
jet
bullet
gun
the following are the list of money:
RMB
Dollar
Riyuan
====================

现在我想把两个list的title和内容,分别放到两个不同的文件中去,比如:
the following are the list of products:
shoe
table
bug
放到文件 product.txt里面去。同样的,另外一个放到 money.txt里面去。但我只知道用//可以查找,但接下怎么把这块内容截出来,我就不会了。向大侠们请教。

open FILE, "< output.txt";

while(<FILE>)
{
     if (/the following are the list of products:/)
    {
    }

    if (/the following are the list of money:/)
    {

    }
}

论坛徽章:
0
2 [报告]
发表于 2011-05-06 10:25 |只看该作者
  1. open FILE, "< output.txt";
  2. open OUT, ">> out.txt" or die "fail:$!";
  3. while(<FILE>)
  4. {
  5.      if (/the following are the list of products:/)
  6.     {
  7.         print OUT "$_";
  8.     }

  9.     if (/the following are the list of money:/)
  10.     {

  11.     }
  12. }
复制代码

论坛徽章:
0
3 [报告]
发表于 2011-05-06 10:37 |只看该作者
谢谢楼上的兄弟先,你的这个方法,只能把 title 如"the following are the list of products:" 打印到文件吧,后面紧跟着的list呢?

谢谢。

论坛徽章:
0
4 [报告]
发表于 2011-05-06 10:44 |只看该作者
回复 3# 百分百好牛


    用个变量标示 控制下 就是了
    my $flag;
     if(/regex/)
     {
        $flag=1;
      }
      print OUT "$_" if $flaf == 1;
类似这样  不同的段 flag设成不同的值就是了

论坛徽章:
0
5 [报告]
发表于 2011-05-06 10:51 |只看该作者
let me try it, thx.

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
6 [报告]
发表于 2011-05-06 10:58 |只看该作者
假设文件 output.txt的内容如下:
====================
the following are the list of products:
air ...
百分百好牛 发表于 2011-05-06 10:05



$ cat output.pl

  1. use strict;
  2. use warnings;

  3. my $sOut_file="";
  4. open(FILE, "<", "output.txt") or die "can't open output.txt\n";

  5. while(<FILE>){
  6.     # the following are the list of products:
  7.     # the following are the list of money:
  8.     if (/the following are the list of (.+):/){
  9.         close(FHout) if($sOut_file ne "");
  10.         $sOut_file = "$1.txt";
  11.         open(FHout, ">", $sOut_file) or die "can' open $sOut_file\n";
  12.         print "open $sOut_file file to write data\n";
  13.      }
  14.      print FHout $_;
  15. }
  16. close FHout;
复制代码
$ perl output.pl
open products.txt file to write data
open money.txt file to write data
$

论坛徽章:
0
7 [报告]
发表于 2011-05-06 13:13 |只看该作者
谢谢楼上的兄弟们,我试过了,可以用的。
但是我现在碰到一个很 ”诡异“ 的问题。
我生成的文件是好的,可是我用 perl.再把最后的output.txt文件读出来的时候,单字节的变成了双字节。
如:
用notepad打开文件,显示的是
szBuffer.getBuffer

可是perl读进来后,再print $_; 出来,就是下面这个样子了。
s z B u f f e r . g e t B u f f e r

所以我的 if (/the following are the list of/) 总是失败。

是什么地方我的设置不对么?

谢谢!

论坛徽章:
0
8 [报告]
发表于 2011-05-06 13:47 |只看该作者
真是杯具哦。
在console上面输出的时候看起来很正常,可是redist到文件里面,貌似就变成了双字节
刚才用vi以16进制打开output.txt 文件,结果如下
00001f0: 5200 7500 6e00 6e00 6900 6e00 6700 2e00  R.u.n.n.i.n.g...

晕倒了,被弄糊涂了......

论坛徽章:
0
9 [报告]
发表于 2011-05-06 15:00 |只看该作者

  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;
  4. my $filehand;
  5. while(<>){
  6.         if(/the following are the list of (.+):/)
  7.         {
  8.                 my $filename="$1" . ".txt";
  9.                 open ($filehand,">$filename")
  10.                         or die "can't open the file";
  11.         }
  12.                 print $filehand $_;
  13. }
复制代码

论坛徽章:
0
10 [报告]
发表于 2011-05-06 15:02 |只看该作者
本帖最后由 百分百好牛 于 2011-05-06 15:05 编辑

TO: zzy7186 (遗忘哥!)
兄弟,你的code和前面的有什么不一样么?

我的源文件是个双字节的文件。如果用vi 等16进制的方式查看的话,是
t.h.e. .f.o.l.l.o.w.i.n.g. .a.r.e. .t.h.e. .l.i.s.t. .o.f.
这样的内容的。
你上面的code不行,我试过了。如下面,这样输出的话,也全是双字节的,根本没有办法 用//去查找

open STDIN, "< output.txt" or die $!;
while(<>)
{
    print $_;
}


p.s:
不好意思,我是在windows 上面写不是unix.
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP