免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 2391 | 回复: 15

[文本处理] 判断式文件处理如何写? [复制链接]

论坛徽章:
6
程序设计版块每日发帖之星
日期:2015-12-05 06:20:00数据库技术版块每日发帖之星
日期:2016-02-06 06:20:00数据库技术版块每日发帖之星
日期:2016-03-07 06:20:00程序设计版块每日发帖之星
日期:2016-06-04 06:20:00黑曼巴
日期:2017-02-06 16:31:2615-16赛季CBA联赛之广夏
日期:2017-05-07 09:02:07
发表于 2016-12-17 10:18 |显示全部楼层
不知道周六各位大神还在不在,有一个问题不知道如何实现,麻烦各位前辈帮忙看看如何处理thanks~

问题描述:文件中有四列 用户名 标签 日期 用户信息,标签是由用户信息个数决定的,如果信息为空标签显示为0,如果有内容则标签显示为1,年份是3年
         
                查找文件中标签中含有0的用户并把这个用户的所有条数删除,同时删除记录条数不全的数据

文件内容

1 11111 2013 a b c d e
2 11011 2013 a b d c
3 11111 2013 a d c e b
1 11110 2014 a b c d
2 11111 2014 a a a a a
3 11111 2014 b b b b b
4 11111 2014 c c c c c
1 11111 2015 b b b b b
2 11111 2015 c c c c c
3 11111 2015 d d d d d
4 111111 2015

其中用户2 用户1是数据条数有缺失,用户4是总的记录条数有缺失
希望经过判断后只输出

3 11111 2013 a d c e b
3 11111 2014 b b b b b
3 11111 2015 d d d d d

论坛徽章:
6
摩羯座
日期:2013-08-24 10:43:10狮子座
日期:2013-08-25 10:27:06天秤座
日期:2013-09-11 20:28:44午马
日期:2014-09-28 16:06:0015-16赛季CBA联赛之八一
日期:2016-12-19 13:55:0515-16赛季CBA联赛之天津
日期:2016-12-20 14:01:23
发表于 2016-12-17 11:29 |显示全部楼层
  1. awk 'NR==FNR{if($2~0 || NF<=3){a[$1]=1};next}{if(!a[$1])print}' filex filex
复制代码

评分

参与人数 1信誉积分 +5 收起 理由
夏洛特猫 + 5

查看全部评分

论坛徽章:
28
15-16赛季CBA联赛之八一
日期:2016-02-22 19:10:4215-16赛季CBA联赛之深圳
日期:2016-12-01 10:34:0415-16赛季CBA联赛之新疆
日期:2016-12-07 10:24:2915-16赛季CBA联赛之同曦
日期:2016-12-15 12:06:43CU十四周年纪念徽章
日期:2016-12-18 13:03:4415-16赛季CBA联赛之吉林
日期:2017-01-03 15:52:2515-16赛季CBA联赛之辽宁
日期:2017-01-04 14:58:2415-16赛季CBA联赛之辽宁
日期:2017-01-15 09:42:512016科比退役纪念章
日期:2017-02-06 17:21:50黑曼巴
日期:2017-02-10 15:46:1215-16赛季CBA联赛之上海
日期:2017-03-18 10:14:5415-16赛季CBA联赛之青岛
日期:2017-03-18 22:00:44
发表于 2016-12-17 12:16 |显示全部楼层
本帖最后由 moperyblue 于 2016-12-17 22:57 编辑
  1. awk 'NR==FNR{if($2~0||NF<8)a[$1]=1;next}!a[$1]' file file
复制代码

论坛徽章:
28
15-16赛季CBA联赛之八一
日期:2016-02-22 19:10:4215-16赛季CBA联赛之深圳
日期:2016-12-01 10:34:0415-16赛季CBA联赛之新疆
日期:2016-12-07 10:24:2915-16赛季CBA联赛之同曦
日期:2016-12-15 12:06:43CU十四周年纪念徽章
日期:2016-12-18 13:03:4415-16赛季CBA联赛之吉林
日期:2017-01-03 15:52:2515-16赛季CBA联赛之辽宁
日期:2017-01-04 14:58:2415-16赛季CBA联赛之辽宁
日期:2017-01-15 09:42:512016科比退役纪念章
日期:2017-02-06 17:21:50黑曼巴
日期:2017-02-10 15:46:1215-16赛季CBA联赛之上海
日期:2017-03-18 10:14:5415-16赛季CBA联赛之青岛
日期:2017-03-18 22:00:44
发表于 2016-12-17 12:17 |显示全部楼层
本帖最后由 moperyblue 于 2016-12-17 22:58 编辑
  1. awk '{if($2~0||NF<8)a[$1]=1;else b[$1,++c[$1]]=$0}{d[$1]++}END{l=c[asort(c)];for(i in d)for(j=0;j++<l;)if(!a[i])print b[i,j]}' file
复制代码

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
发表于 2016-12-17 16:26 |显示全部楼层
  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;

  4. my %hData = ();
  5. while (<DATA>){
  6.     my ($id, $label, $date, @aList) = split;
  7.     my @aLabel = split (//, $label);
  8.     $hData{$id}{'N'}++ if (@aLabel != @aList or $label =~ /0/);
  9.     push (@{$hData{$id}{'V'}}, $_);
  10. }

  11. print @{$hData{$_}{'V'}} for grep {!defined ($hData{$_}{'N'})} keys %hData;

  12. __DATA__
  13. 1 11111 2013 a b c d e
  14. 2 11011 2013 a b d c
  15. 3 11111 2013 a d c e b
  16. 1 11110 2014 a b c d
  17. 2 11111 2014 a a a a a
  18. 3 11111 2014 b b b b b
  19. 4 11111 2014 c c c c c
  20. 1 11111 2015 b b b b b
  21. 2 11111 2015 c c c c c
  22. 3 11111 2015 d d d d d
  23. 4 111111 2015
复制代码

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
发表于 2016-12-17 16:40 |显示全部楼层
回复 1# 夏洛特猫

$ awk '{a[$1]=a[$1]$0"\n";if($2~/0/||NF<4)b[$1]=1}END{for(n in a)if(!b[n])printf a[n]}' FILE
3 11111 2013 a d c e b
3 11111 2014 b b b b b
3 11111 2015 d d d d d

评分

参与人数 1信誉积分 +5 收起 理由
夏洛特猫 + 5

查看全部评分

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
发表于 2016-12-17 17:28 |显示全部楼层
  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;

  4. my @aData = ();
  5. while (<DATA>){
  6.     my @aT = split;
  7.     push (@{$aData[$aT[0]]}, [$_, $#aT]);
  8. }

  9. for (@aData){
  10.     next unless defined;
  11.     my @aT = sort {$a->[-1] <=> $b->[-1]} @$_;
  12.     next if ($aT[0][-1] != $aT[-1][-1]);
  13.     print $_->[0] for @aT;
  14. }

  15. __DATA__
  16. 1 11111 2013 a b c d e
  17. 2 11011 2013 a b d c
  18. 3 11111 2013 a d c e b
  19. 1 11110 2014 a b c d
  20. 2 11111 2014 a a a a a
  21. 3 11111 2014 b b b b b
  22. 4 11111 2014 c c c c c
  23. 1 11111 2015 b b b b b
  24. 2 11111 2015 c c c c c
  25. 3 11111 2015 d d d d d
  26. 4 111111 2015
复制代码

论坛徽章:
6
程序设计版块每日发帖之星
日期:2015-12-05 06:20:00数据库技术版块每日发帖之星
日期:2016-02-06 06:20:00数据库技术版块每日发帖之星
日期:2016-03-07 06:20:00程序设计版块每日发帖之星
日期:2016-06-04 06:20:00黑曼巴
日期:2017-02-06 16:31:2615-16赛季CBA联赛之广夏
日期:2017-05-07 09:02:07
发表于 2016-12-17 22:00 |显示全部楼层
回复 6# jason680
谢jason哥 !!

论坛徽章:
6
程序设计版块每日发帖之星
日期:2015-12-05 06:20:00数据库技术版块每日发帖之星
日期:2016-02-06 06:20:00数据库技术版块每日发帖之星
日期:2016-03-07 06:20:00程序设计版块每日发帖之星
日期:2016-06-04 06:20:00黑曼巴
日期:2017-02-06 16:31:2615-16赛季CBA联赛之广夏
日期:2017-05-07 09:02:07
发表于 2016-12-17 22:01 |显示全部楼层
回复 4# moperyblue

thanks~ bule!! 多谢帮助~~学习啦

论坛徽章:
6
程序设计版块每日发帖之星
日期:2015-12-05 06:20:00数据库技术版块每日发帖之星
日期:2016-02-06 06:20:00数据库技术版块每日发帖之星
日期:2016-03-07 06:20:00程序设计版块每日发帖之星
日期:2016-06-04 06:20:00黑曼巴
日期:2017-02-06 16:31:2615-16赛季CBA联赛之广夏
日期:2017-05-07 09:02:07
发表于 2016-12-17 22:43 |显示全部楼层
回复 7# sunzhiguolu
perl的忠实用户 同样谢啦~thanks

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP