免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1609 | 回复: 8

[文本处理] a.txt b.txt [复制链接]

论坛徽章:
0
发表于 2017-10-10 22:46 |显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
发表于 2017-10-11 09:03 |显示全部楼层
本帖最后由 sunzhiguolu 于 2017-10-11 09:09 编辑
  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;

  4. my @data = ();
  5. while(<DATA>){
  6.         last if(/\A\s*\z/);
  7.         my @ary = split;
  8.         next if($ary[0] >= 12);
  9.         push(@data, [@ary]);
  10. }

  11. while(<DATA>){
  12.         my $it;
  13.         do{
  14.                 $it = shift(@data);
  15.         }while(defined($it) and $it->[0]++ >= 12);
  16.         print("$it->[-1]\t$_");
  17.         push(@data, $it) if($it->[0] < 12);
  18. }

  19. __DATA__
  20. 11 duowan.sdf.df.a1
  21. 10 duowan.sdf.df.a2
  22. 9  duowan.sdf.df.a3
  23. 8 duowan.sdf.df.a4
  24. 8 duowan.sdf.df.a5

  25. sdf_sdf
  26. ssdffd
  27. sdfh
  28. hdfh
  29. fdhdfgh
  30. dfhfh
  31. ddfh
  32. dfhfh
  33. dfhfdh
  34. dfhfdhhs
  35. sdgdsg
  36. sdfsd
  37. fsdgfg
  38. sdgfs
复制代码

论坛徽章:
0
发表于 2017-10-11 10:27 |显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
25
程序设计版块每日发帖之星
日期:2016-05-03 06:20:0015-16赛季CBA联赛之八一
日期:2018-07-05 10:34:09黑曼巴
日期:2018-07-06 15:19:5015-16赛季CBA联赛之佛山
日期:2018-08-03 13:19:3315-16赛季CBA联赛之山西
日期:2018-08-07 19:46:2315-16赛季CBA联赛之广夏
日期:2018-08-08 19:31:5015-16赛季CBA联赛之青岛
日期:2018-11-26 15:21:5015-16赛季CBA联赛之上海
日期:2018-12-11 09:45:3219周年集字徽章-年
日期:2020-04-18 23:54:5215-16赛季CBA联赛之深圳
日期:2020-04-19 21:40:19黑曼巴
日期:2022-04-03 17:55:1315-16赛季CBA联赛之八一
日期:2018-07-03 16:56:46
发表于 2017-10-11 20:47 |显示全部楼层
回复 1# ma3501406


  1. awk 'function p(){if(j>s){j=1};a[j]++;if(a[j]<13){print b[j],"=",c[i];j++}else{j++;p()}};FILENAME==ARGV[1]{s=NR;a[NR]=$1;b[NR]=$2;next}{t=FNR;c[FNR]=$0}END{j=1;for(i=1;i<=t;i++){p()}}' a.txt b.txt
复制代码

论坛徽章:
0
发表于 2017-10-11 21:40 |显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
25
程序设计版块每日发帖之星
日期:2016-05-03 06:20:0015-16赛季CBA联赛之八一
日期:2018-07-05 10:34:09黑曼巴
日期:2018-07-06 15:19:5015-16赛季CBA联赛之佛山
日期:2018-08-03 13:19:3315-16赛季CBA联赛之山西
日期:2018-08-07 19:46:2315-16赛季CBA联赛之广夏
日期:2018-08-08 19:31:5015-16赛季CBA联赛之青岛
日期:2018-11-26 15:21:5015-16赛季CBA联赛之上海
日期:2018-12-11 09:45:3219周年集字徽章-年
日期:2020-04-18 23:54:5215-16赛季CBA联赛之深圳
日期:2020-04-19 21:40:19黑曼巴
日期:2022-04-03 17:55:1315-16赛季CBA联赛之八一
日期:2018-07-03 16:56:46
发表于 2017-10-12 10:36 |显示全部楼层
本帖最后由 wh7211 于 2017-10-12 10:44 编辑

回复 5# ma3501406


对4楼代码做一下优化。
  1. awk -vf=12 'function p(){n=0;for(m=1;m<=s;m++){a[m]=a[m]>f?f:a[m];n=n?n+a[m]:a[m]};if(n<s*f){j=j>s?1:j;a[j]++;if(a[j]<=f){print b[j],"=",c[i];j++}else{j++;p()}}};FILENAME==ARGV[1]{s=NR;a[NR]=$1;b[NR]=$2;next}{t=FNR;c[FNR]=$0}END{j=1;for(i=1;i<=t;i++){p()}}' a.txt b.txt
复制代码

论坛徽章:
24
申猴
日期:2014-10-10 15:56:39射手座
日期:2014-10-10 15:57:18黑曼巴
日期:2018-05-14 11:05:122016科比退役纪念章
日期:2018-05-14 11:05:0715-16赛季CBA联赛之北控
日期:2018-05-14 11:05:0015-16赛季CBA联赛之江苏
日期:2017-02-27 18:11:0715-16赛季CBA联赛之上海
日期:2018-08-15 09:48:5415-16赛季CBA联赛之佛山
日期:2018-07-20 17:14:2315-16赛季CBA联赛之佛山
日期:2019-09-10 18:08:4615-16赛季CBA联赛之山西
日期:2020-03-26 09:40:5115-16赛季CBA联赛之佛山
日期:2020-05-08 09:03:54
发表于 2017-10-12 10:46 |显示全部楼层
本帖最后由 chengchow 于 2017-10-12 10:47 编辑
  1. [root@iZuf62sazcxqandkv55wyjZ tmp]# cat aa.py
  2. #!/usr/bin/env python

  3. import os
  4. import sys

  5. ListA=os.popen("awk '{print $NF}' a.txt").read().strip('\r\n').split()
  6. ListB=os.popen("awk '{print $0}' b.txt").read().strip('\r\n').split()

  7. try :
  8.         for i in range(1,len(ListB)) :
  9.                 for a in ListA :
  10.                         print a + ' = ' + ListB[0]
  11.                         del ListB[0]
  12.                 del ListA[0]
  13. except :
  14.         sys.exit(0)
  15. [root@iZuf62sazcxqandkv55wyjZ tmp]# ./aa.py
  16. duowan.sdf.df.a1 = sdf_sdf
  17. duowan.sdf.df.a2 = ssdffd
  18. duowan.sdf.df.a3 = sdfh
  19. duowan.sdf.df.a4 = hdfh
  20. duowan.sdf.df.a5 = fdhdfgh
  21. duowan.sdf.df.a2 = dfhfh
  22. duowan.sdf.df.a3 = ddfh
  23. duowan.sdf.df.a4 = dfhfh
  24. duowan.sdf.df.a5 = dfhfdh
  25. duowan.sdf.df.a3 = dfhfdhhs
  26. duowan.sdf.df.a4 = sdgdsg
  27. duowan.sdf.df.a5 = sdfsd
  28. duowan.sdf.df.a4 = fsdgfg
  29. duowan.sdf.df.a5 = sdgfs
复制代码

论坛徽章:
0
发表于 2017-10-13 02:49 |显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
发表于 2017-11-09 15:26 |显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP