免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 2385 | 回复: 15
打印 上一主题 下一主题

[文本处理] 文件删除批量处理? [复制链接]

论坛徽章:
3
2015亚冠之布里斯班狮吼
日期:2015-06-25 18:46:20程序设计版块每日发帖之星
日期:2015-09-17 06:20:0015-16赛季CBA联赛之江苏
日期:2017-01-09 21:37:58
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2017-01-15 15:19 |只看该作者 |倒序浏览
本帖最后由 tengfei0311 于 2017-01-15 15:24 编辑

文件名: ES01.dat .............................ES999.dat(1000多个要处理的文件)

文件内容:

YN   ES22 31.2  90.1  (第一行)
XW  ES49 30.1  180   (第二行)
10  3.1
11  2.9
12  3.9
13  3.5
...
...
...
120  4.9

每个文件内的内容格式都相同,我想删去这么多文件中前2行前2列(上面红色的字符),该怎么处理?因为没法匹配字符串,因为每个文件里面的前两行两列字母都不一样。谢谢!







论坛徽章:
28
15-16赛季CBA联赛之八一
日期:2016-02-22 19:10:4215-16赛季CBA联赛之深圳
日期:2016-12-01 10:34:0415-16赛季CBA联赛之新疆
日期:2016-12-07 10:24:2915-16赛季CBA联赛之同曦
日期:2016-12-15 12:06:43CU十四周年纪念徽章
日期:2016-12-18 13:03:4415-16赛季CBA联赛之吉林
日期:2017-01-03 15:52:2515-16赛季CBA联赛之辽宁
日期:2017-01-04 14:58:2415-16赛季CBA联赛之辽宁
日期:2017-01-15 09:42:512016科比退役纪念章
日期:2017-02-06 17:21:50黑曼巴
日期:2017-02-10 15:46:1215-16赛季CBA联赛之上海
日期:2017-03-18 10:14:5415-16赛季CBA联赛之青岛
日期:2017-03-18 22:00:44
2 [报告]
发表于 2017-01-15 15:30 |只看该作者

  1. sed -r '1,2{s/^(\S+\s+){2}//M}' file
复制代码

论坛徽章:
3
2015亚冠之布里斯班狮吼
日期:2015-06-25 18:46:20程序设计版块每日发帖之星
日期:2015-09-17 06:20:0015-16赛季CBA联赛之江苏
日期:2017-01-09 21:37:58
3 [报告]
发表于 2017-01-15 15:39 |只看该作者
回复 2# moperyblue

不对啊!
illegal option -- r

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
4 [报告]
发表于 2017-01-15 15:39 |只看该作者
回复 1# tengfei0311

$ head -4 ES*.dat
==> ES01.dat <==
YN  ES22 31.2  90.1
XW  ES49 30.1  180
10  3.1
11  2.9

==> ES99.dat <==
YN  ES22 31.2  90.1
XW  ES49 30.1  180
10  3.1
11  2.9

$ sed -i -r '1,2s/[^ ]+ +[^ ]+ +//' ES*.dat

$ head -4 ES*.dat
==> ES01.dat <==
31.2  90.1
30.1  180
10  3.1
11  2.9

==> ES99.dat <==
31.2  90.1
30.1  180
10  3.1
11  2.9

论坛徽章:
28
15-16赛季CBA联赛之八一
日期:2016-02-22 19:10:4215-16赛季CBA联赛之深圳
日期:2016-12-01 10:34:0415-16赛季CBA联赛之新疆
日期:2016-12-07 10:24:2915-16赛季CBA联赛之同曦
日期:2016-12-15 12:06:43CU十四周年纪念徽章
日期:2016-12-18 13:03:4415-16赛季CBA联赛之吉林
日期:2017-01-03 15:52:2515-16赛季CBA联赛之辽宁
日期:2017-01-04 14:58:2415-16赛季CBA联赛之辽宁
日期:2017-01-15 09:42:512016科比退役纪念章
日期:2017-02-06 17:21:50黑曼巴
日期:2017-02-10 15:46:1215-16赛季CBA联赛之上海
日期:2017-03-18 10:14:5415-16赛季CBA联赛之青岛
日期:2017-03-18 22:00:44
5 [报告]
发表于 2017-01-15 15:50 |只看该作者
回复 3# tengfei0311

什么系统?

sed --version
sed (GNU sed) 4.2.2

  1. echo 'YN   ES22 31.2  90.1
  2. XW  ES49 30.1  180
  3. 10  3.1
  4. 11  2.9
  5. 12  3.9
  6. 13  3.5'|sed -r '1,2{s/^(\S+\s+){2}//M}'
  7. 31.2  90.1
  8. 30.1  180
  9. 10  3.1
  10. 11  2.9
  11. 12  3.9
  12. 13  3.5
复制代码


试试
  1. sed '1,2{s/^\(\S\+\s\+\)\{2\}//M}'
复制代码

论坛徽章:
3
2015亚冠之布里斯班狮吼
日期:2015-06-25 18:46:20程序设计版块每日发帖之星
日期:2015-09-17 06:20:0015-16赛季CBA联赛之江苏
日期:2017-01-09 21:37:58
6 [报告]
发表于 2017-01-15 15:56 |只看该作者
回复 5# moperyblue

mac系统!

论坛徽章:
3
2015亚冠之布里斯班狮吼
日期:2015-06-25 18:46:20程序设计版块每日发帖之星
日期:2015-09-17 06:20:0015-16赛季CBA联赛之江苏
日期:2017-01-09 21:37:58
7 [报告]
发表于 2017-01-15 15:59 |只看该作者
本帖最后由 tengfei0311 于 2017-01-15 16:01 编辑

回复 5# moperyblue
sl-MacBookProesktop sl$ sed '1,2{s/^\(\S\+\s\+\)\{2\}//M}' test.dat
sed: 1: "1,2{s/^\(\S\+\s\+\)\{2\ ...": bad flag in substitute command: 'M'


论坛徽章:
3
2015亚冠之布里斯班狮吼
日期:2015-06-25 18:46:20程序设计版块每日发帖之星
日期:2015-09-17 06:20:0015-16赛季CBA联赛之江苏
日期:2017-01-09 21:37:58
8 [报告]
发表于 2017-01-15 15:59 |只看该作者
..

论坛徽章:
3
2015亚冠之布里斯班狮吼
日期:2015-06-25 18:46:20程序设计版块每日发帖之星
日期:2015-09-17 06:20:0015-16赛季CBA联赛之江苏
日期:2017-01-09 21:37:58
9 [报告]
发表于 2017-01-15 16:03 |只看该作者
回复 4# jason680

大神,你是什么系统?我在mac终端运行就生成了一个.dat-r的文件

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
10 [报告]
发表于 2017-01-15 16:15 |只看该作者
  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;

  4. chdir ('urPath');
  5. foreach (glob ('*')){
  6.     my $old = $_;
  7.     open (my $FHr, '<', $old);
  8.     my @aT = <$FHr>;
  9.     close ($FHr);

  10.     foreach (0 .. 1){
  11.         my (undef, undef, @T) = split (' ', $aT[$_]);
  12.         $aT[$_] = "@T\n";
  13.     }
  14.     #unlink ($old);
  15.     rename ($old, $old . '.bak');
  16.     open (my $FHw, '>', $old);
  17.     print $FHw @aT;
  18.     close ($FHw);
  19. }
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP