免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
1234
最近访问板块 发新帖
楼主: woodie
打印 上一主题 下一主题

[原创]perl在编辑巨大文件时的应用 [复制链接]

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
31 [报告]
发表于 2006-08-12 16:46 |只看该作者
改进一下,不用临时文件了:
  1. #!/usr/bin/perl
  2. die "Usage: $0 perl-condition file\n" if $#ARGV != 1;
  3. $cmd = "print W unless $ARGV[0]";
  4. $file = $ARGV[1];
  5. open(PIPE, "|perl -") or die "Error perl interpreter.\n";
  6. print PIPE qq[#perl scprit through pipe
  7. open(R, "<$file") or die "Cannot open file $file to read.\\n";
  8. open (W, "+<$file") or die "Cannot open file $file to write.\\n";
  9. while(<R>){
  10.     $cmd;
  11. }
  12. truncate(W, tell(W));];
  13. close(PIPE);
复制代码

论坛徽章:
0
32 [报告]
发表于 2006-08-26 21:43 |只看该作者
dd of=file conv=notrunc <&3
dd >&3


这个:|是什么意思啊,没看明白

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
33 [报告]
发表于 2006-08-30 15:46 |只看该作者
唉!脑袋短路了!我29的代码性能不好的原因是在循环中用了eval命令,其实直接的解决办法就是把eval拿到循环之外,当时竟然没想到这一点,所以才有了30楼、31楼的代码。画蛇添足了!惭愧呀。
  1. #!/usr/bin/perl
  2. die "Usage: $0 perl-condition file\n" if $#ARGV != 1;
  3. $cmd = "print W unless $ARGV[0]";
  4. $file = $ARGV[1];
  5. open R, "<$file" or die "Cannot open file $file to read\n";
  6. open W, "+<$file" or die "Cannot open file $file to write\n";
  7. eval "while(<R>){ $cmd;}";
  8. truncate( W, tell(W) );
复制代码


----------------------
赶紧再“装修”下子。^_^

[ 本帖最后由 woodie 于 2006-8-30 16:11 编辑 ]

论坛徽章:
7
荣誉版主
日期:2011-11-23 16:44:17子鼠
日期:2014-07-24 15:38:07狮子座
日期:2014-07-24 11:00:54巨蟹座
日期:2014-07-21 19:03:10双子座
日期:2014-05-22 12:00:09卯兔
日期:2014-05-08 19:43:17卯兔
日期:2014-08-22 13:39:09
34 [报告]
发表于 2006-08-30 15:58 |只看该作者
原帖由 woodie 于 2006-8-30 15:46 发表
唉!脑袋短路了!我29的代码性能不好的原因是在循环中用了eval命令,其实直接的解决办法就是把eval拿到循环之外,当时竟然没想到这一点,所以才有了30楼、31楼的代码。画蛇添足了!惭愧呀。[img]http://bbs.china ...

这次的代码漂亮^_^

论坛徽章:
0
35 [报告]
发表于 2006-08-30 17:19 |只看该作者
呵呵,好贴!

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
36 [报告]
发表于 2006-09-13 16:11 |只看该作者

删除一行中的一部分

改写一下,用来删行的一部分,有的朋友可能用的着。
  1. #!/usr/bin/perl
  2. die "Usage: $0 pattern-to-del file\n" if $#ARGV != 1;
  3. $cmd = "s/$ARGV[0]//g;print W";
  4. $file = $ARGV[1];
  5. open R, "<$file" or die "Cannot open file $file to read\n";
  6. open W, "+<$file" or die "Cannot open file $file to write\n";
  7. eval "while(<R>){ $cmd;}";
  8. truncate( W, tell(W) );
复制代码

将上面文件存为pdw,
chmod +x pdw

用法:./pdw 要删除部分的正则表达式 处理的文件名
注意因为用了g修饰符,所有匹配正则的东西都会删除。
举例:
删除所有的单词hello:
./pdw '\bhello\b' ur-file
删除所有的除号/:
./pdw '\/' ur-file

论坛徽章:
7
荣誉版主
日期:2011-11-23 16:44:17子鼠
日期:2014-07-24 15:38:07狮子座
日期:2014-07-24 11:00:54巨蟹座
日期:2014-07-21 19:03:10双子座
日期:2014-05-22 12:00:09卯兔
日期:2014-05-08 19:43:17卯兔
日期:2014-08-22 13:39:09
37 [报告]
发表于 2006-09-13 16:15 |只看该作者
忽然想起来,cu有专门的perl版。
woodie兄为何发到此处,怪不得老瓦连个标记都没给打
看来shell版人气旺阿。

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
38 [报告]
发表于 2006-09-13 16:15 |只看该作者
今天的网络真是气死人!又发重了。:—(
To 七兄:对shell版的兄弟们有用就行了。对perl版来说怕没多大价值。^_^

[ 本帖最后由 woodie 于 2006-9-13 16:20 编辑 ]

论坛徽章:
8
摩羯座
日期:2014-11-26 18:59:452015亚冠之浦和红钻
日期:2015-06-23 19:10:532015亚冠之西悉尼流浪者
日期:2015-08-21 08:40:5815-16赛季CBA联赛之山东
日期:2016-01-31 18:25:0515-16赛季CBA联赛之四川
日期:2016-02-16 16:08:30程序设计版块每日发帖之星
日期:2016-06-29 06:20:002017金鸡报晓
日期:2017-01-10 15:19:5615-16赛季CBA联赛之佛山
日期:2017-02-27 20:41:19
39 [报告]
发表于 2006-09-13 16:33 |只看该作者
不打标是免得没有耐心的人真的以为perl没有临时文件,你没看加了分么?

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
40 [报告]
发表于 2006-09-13 16:43 |只看该作者
呵呵,没关系没关系,打不打标的没什么紧要。^_^大家一起讨论就好。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP