免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1609 | 回复: 8
打印 上一主题 下一主题

[文本处理] 求助大神文本处理 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2017-08-13 00:11 |只看该作者 |倒序浏览
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
28
15-16赛季CBA联赛之八一
日期:2016-02-22 19:10:4215-16赛季CBA联赛之深圳
日期:2016-12-01 10:34:0415-16赛季CBA联赛之新疆
日期:2016-12-07 10:24:2915-16赛季CBA联赛之同曦
日期:2016-12-15 12:06:43CU十四周年纪念徽章
日期:2016-12-18 13:03:4415-16赛季CBA联赛之吉林
日期:2017-01-03 15:52:2515-16赛季CBA联赛之辽宁
日期:2017-01-04 14:58:2415-16赛季CBA联赛之辽宁
日期:2017-01-15 09:42:512016科比退役纪念章
日期:2017-02-06 17:21:50黑曼巴
日期:2017-02-10 15:46:1215-16赛季CBA联赛之上海
日期:2017-03-18 10:14:5415-16赛季CBA联赛之青岛
日期:2017-03-18 22:00:44
2 [报告]
发表于 2017-08-13 07:49 |只看该作者
本帖最后由 moperyblue 于 2017-08-13 07:55 编辑
  1. awk 'NR==FNR{split($0,a,"x");b[NR,0]=a[1];b[NR,1]=a[2];c[NR]=$0;next}{i=0;s=c[FNR]" =";while(i++<NF){split($i,d,"x");if(d[1]>=b[FNR,0]&&d[2]<=b[FNR,1])s=s FS $i}print s}' b.txt a.txt
复制代码

评分

参与人数 1信誉积分 +5 收起 理由
ma3501406 + 5

查看全部评分

论坛徽章:
0
3 [报告]
发表于 2017-08-14 13:02 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
4 [报告]
发表于 2017-08-14 13:54 |只看该作者
  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;

  4. my $data = {};
  5. while(<DATA>){
  6.         chomp;
  7.         !length and last;
  8.         $data->{$_} = [split(/x/)];
  9. }

  10. while(<DATA>){
  11.         foreach my $k (keys %$data){
  12.                 my @aT = map {[split(/x/)]} split;
  13.                 next if($data->{$k}[0] < $aT[0][0]);
  14.                 my @aOut = map {join('x', @$_)} grep {$data->{$k}[0] <= $_->[0] and $data->{$k}[-1] >= $_->[-1]} @aT;
  15.                 if(@aOut){
  16.                         print(join("\t", $k, @aOut), "\n");
  17.                 }
  18.         }
  19.        
  20. }

  21. __DATA__
  22. 7x25
  23. 29x35
  24. 36x45

  25. 1x5 6 7 8 9x15 16 17x19 20 21x25
  26. 26 27 28 29 30x31 32x35
  27. 36x40 41 42 43 44 45
复制代码

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
5 [报告]
发表于 2017-08-14 13:58 |只看该作者
本友会机友会摄友会 发表于 2017-08-14 13:02
21*25在7*25之中吗? 我看不懂题

看哪个结果应该是满足的。

7 <= 21 and 25 >= 25

论坛徽章:
0
6 [报告]
发表于 2017-08-14 21:01 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
7 [报告]
发表于 2017-08-15 00:51 |只看该作者
回复 6# ma3501406

$ awk 'function ck(_,s,e){return(s<=a[_,1]&&a[_,1]<=e&&s<=a[_,d[_]]&&a[_,d[_]]<=e)}
FNR==NR{for(n=1;n<=NF;++n){++_;t=split($n,m,"x");a[_]=$n;d[_]=t;a[_,1]=m[1];a[_,t]=m[t]}next}{p=$1" =";split($1,m,"x");for(n=1;n<=_;++n)if(ck(n,m[1],m[2]))p=p" "a[n];print p}' a.txt b.txt
7x19 = 7 8 9x15 16 17x19
41x44 = 41 42 43 44

论坛徽章:
28
15-16赛季CBA联赛之八一
日期:2016-02-22 19:10:4215-16赛季CBA联赛之深圳
日期:2016-12-01 10:34:0415-16赛季CBA联赛之新疆
日期:2016-12-07 10:24:2915-16赛季CBA联赛之同曦
日期:2016-12-15 12:06:43CU十四周年纪念徽章
日期:2016-12-18 13:03:4415-16赛季CBA联赛之吉林
日期:2017-01-03 15:52:2515-16赛季CBA联赛之辽宁
日期:2017-01-04 14:58:2415-16赛季CBA联赛之辽宁
日期:2017-01-15 09:42:512016科比退役纪念章
日期:2017-02-06 17:21:50黑曼巴
日期:2017-02-10 15:46:1215-16赛季CBA联赛之上海
日期:2017-03-18 10:14:5415-16赛季CBA联赛之青岛
日期:2017-03-18 22:00:44
8 [报告]
发表于 2017-08-15 10:41 |只看该作者
回复 6# ma3501406


  1. awk 'NR==FNR{k=NR;split($0,a,"x");b[k,0]=a[1];b[k,1]=a[2];c[k]=$0;next}{s=p="";for(i=1;i<=NF;i++){l=split($i,d,"x");if(l<2){d[1]=d[1];d[2]=d[1]}for(j=1;j<=k;j++){if(d[1]>=b[j,0]&&d[2]<=b[j,1]){if(!p) {s = c[j]" =";p=1}s=s FS $i}}}if(s)print s}' b.txt a.txt
复制代码

论坛徽章:
8
CU十四周年纪念徽章
日期:2017-08-28 17:16:1915-16赛季CBA联赛之北控
日期:2018-03-29 11:39:0615-16赛季CBA联赛之上海
日期:2018-05-21 10:46:10技术图书徽章
日期:2018-09-03 13:54:18技术图书徽章
日期:2018-09-03 13:54:2815-16赛季CBA联赛之四川
日期:2020-10-15 09:21:4720周年集字徽章-20	
日期:2020-10-28 13:53:0220周年集字徽章-庆
日期:2020-10-28 14:09:12
9 [报告]
发表于 2017-08-15 14:14 |只看该作者
  1. awk 'NR==FNR{a[++n]=$0 ; next}{printf a[++m]" = " ; split(a[++j],k,"x") ; for(i=1;i<=NF;i++) {split($i,d,"x") ; if(d[1] >= k[1] && d[1] <= k[2])  printf $i" " ; delete d} printf "\n"}' b.txt a.txt
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP