免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3496 | 回复: 8
打印 上一主题 下一主题

[已经解决,谢谢!]请教Perl读取文件里的内容 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-12-08 22:07 |只看该作者 |倒序浏览
本帖最后由 Tina0910 于 2015-12-12 21:31 编辑

把一个文本里的内容整理到另外一个文本里面。

源文本文件里的内容:
AU deLeon, L
   Denhardt, RB
AF deLeon, L
   Denhardt, RB
TI The political theory of reinvention
AU Borins, S
AF Borins, S
TI Loose cannons and rule breakers, or enterprising leaders? Some evidence
   about innovative public managers
AU Bohte, J
   Meier, KJ
   Denhardt, RB
AF Bohte, J
   Meier, KJ
TI Loose cannons and rule breakers
...
...
...


希望得到的结果是:
AU deLeon, L
   Denhardt, RB
AU Borins, S
AU Bohte, J
   Meier, KJ
   Denhardt, RB
AF deLeon, L
   Denhardt, RB
AF Borins, S
AF Bohte, J
   Meier, KJ

尝试各种办法,由于第二行或者第三行的空的,比较特别。
求各位帮忙,非常感谢!!

论坛徽章:
95
程序设计版块每日发帖之星
日期:2015-09-05 06:20:00程序设计版块每日发帖之星
日期:2015-09-17 06:20:00程序设计版块每日发帖之星
日期:2015-09-18 06:20:002015亚冠之阿尔艾因
日期:2015-09-18 10:35:08月度论坛发贴之星
日期:2015-09-30 22:25:002015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39程序设计版块每日发帖之星
日期:2015-10-05 06:20:00每日论坛发贴之星
日期:2015-10-05 06:20:002015年亚冠纪念徽章
日期:2015-10-06 10:06:482015亚冠之塔什干棉农
日期:2015-10-19 19:43:35程序设计版块每日发帖之星
日期:2015-10-21 06:20:00每日论坛发贴之星
日期:2015-09-14 06:20:00
2 [报告]
发表于 2015-12-08 22:36 |只看该作者
回复 1# Tina0910


    Try this:

while (<>) {
  if (/^A/ .. /^[^A\s]/) {
    print unless /^[^A\s]/;
  }
}

评分

参与人数 1信誉积分 +10 收起 理由
sunzhiguolu + 10 很给力!

查看全部评分

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
3 [报告]
发表于 2015-12-08 22:36 |只看该作者
回复 1# Tina0910
具体说一下你的要求, 比如输出的条件, 希望得到什么样的结果.

   

论坛徽章:
0
4 [报告]
发表于 2015-12-08 22:44 |只看该作者
其实源文件里面是很多AU AF TI..组成的,希望把所有的AU(AF,TI)后面的信息提取出来.
非常感谢!

论坛徽章:
0
5 [报告]
发表于 2015-12-09 08:54 |只看该作者
本帖最后由 homedw 于 2015-12-09 08:55 编辑

读取源文件;

chomp;

while,foreach;

if (正则匹配)
{
   输出需要结果到新文件
}

打完收工!

论坛徽章:
0
6 [报告]
发表于 2015-12-09 10:22 |只看该作者
谢谢,还是没有成功。如果提取AU, 我只能提取AU后面紧接的内容,但是后一行的在AF之前的内容读不出来。想要把AU和AF之间的内容读出来。

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
7 [报告]
发表于 2015-12-09 10:50 |只看该作者
回复 6# Tina0910
试下:
  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;

  4. while (<DATA>){
  5.     if (my $sState = /\AAU/ .. /\AAF/){
  6.         print unless ($sState == 1 or $sState =~ m/E/);
  7.     }
  8. }

  9. __DATA__
  10. AU deLeon, L
  11.    Denhardt, RB
  12. AF deLeon, L
  13.    Denhardt, RB
  14. TI The political theory of reinvention
  15. AU Borins, S
  16. AF Borins, S
  17. TI Loose cannons and rule breakers, or enterprising leaders? Some evidence
  18.    about innovative public managers
  19. TI Loose cannons and rule breakers, or enterprising leaders? Some evidence
  20.    about innovative public managers
  21. TI Loose cannons and rule breakers, or enterprising leaders? Some evidence
  22.    about innovative public managers
  23. AU Bohte, J
  24.    Meier, KJ
  25.    Denhardt, RB
  26. AF Bohte, J
  27.    Meier, KJ
  28. TI Loose cannons and rule breakers
  29. TI Loose cannons and rule breakers
  30. TI Loose cannons and rule breakers
  31. TI Loose cannons and rule breakers
复制代码

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
8 [报告]
发表于 2015-12-09 12:06 |只看该作者
回复 1# Tina0910

$ perl get_Ax.pl
AU deLeon, L
   Denhardt, RB
AF deLeon, L
   Denhardt, RB
AU Borins, S
AF Borins, S
AU Bohte, J
   Meier, KJ
   Denhardt, RB
AF Bohte, J
   Meier, KJ

$ cat get_Ax.pl
#!/usr/bin/perl
use strict;
use warnings;

my $sOut = 0;
while (<DATA>){
    $sOut = 0 if(m/^\S/);
    $sOut = 1 if(m/^A[UF]/);

    print if $sOut;
}

__DATA__
AU deLeon, L
   Denhardt, RB
AF deLeon, L
   Denhardt, RB
TI The political theory of reinvention
AU Borins, S
AF Borins, S
TI Loose cannons and rule breakers, or enterprising leaders? Some evidence
   about innovative public managers
TI Loose cannons and rule breakers, or enterprising leaders? Some evidence
   about innovative public managers
TI Loose cannons and rule breakers, or enterprising leaders? Some evidence
   about innovative public managers
AU Bohte, J
   Meier, KJ
   Denhardt, RB
AF Bohte, J
   Meier, KJ
TI Loose cannons and rule breakers
TI Loose cannons and rule breakers
TI Loose cannons and rule breakers
TI Loose cannons and rule breakers

   

评分

参与人数 1信誉积分 +10 收起 理由
sunzhiguolu + 10 神马都是浮云

查看全部评分

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
9 [报告]
发表于 2015-12-09 12:28 |只看该作者
回复 8# jason680
大神您好, 您这个思路太给力了!

   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP