免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 7140 | 回复: 7

[文本处理] 两文件处理 [复制链接]

论坛徽章:
0
发表于 2013-01-15 10:58 |显示全部楼层
读取文件2第一个字段放到文件1的前面
想读取文件2的第一个字段,然后放到文件1的前面。
file1:
  1. 45 23
  2. 45 23
  3. 45 23
  4. 23 09
  5. 23 09
  6. 10 87
复制代码
file2:
  1. 44
  2. 52
  3. 37
复制代码
输出结果:
  1. 44 45 23
  2.    45 23
  3.    45 23
  4.    23 09
  5.    23 09
  6.    10 87
  7. 52 45 23
  8.    45 23
  9.    45 23
  10.    23 09
  11.    23 09
  12.    10 87
  13. 37 45 23
  14.    45 23
  15.    45 23
  16.    23 09
  17.    23 09
  18.    10 87
复制代码

论坛徽章:
93
2015年辞旧岁徽章
日期:2019-10-10 10:51:15CU大牛徽章
日期:2014-02-21 14:21:56CU十二周年纪念徽章
日期:2020-10-15 16:55:55CU大牛徽章
日期:2014-02-21 14:22:07羊年新春福章
日期:2019-10-10 10:51:39CU大牛徽章
日期:2019-10-10 10:55:38季节之章:春
日期:2020-10-15 16:57:40ChinaUnix元老
日期:2019-10-10 10:54:42季节之章:冬
日期:2019-10-10 10:57:17CU大牛徽章
日期:2014-02-21 14:22:52CU大牛徽章
日期:2014-03-13 10:40:30CU大牛徽章
日期:2014-02-21 14:23:15
发表于 2013-01-15 11:27 |显示全部楼层
  1. [seesea@UC ~]$ awk 'NR==FNR{a[index1++]=$0}; NR!=FNR{b[index2++]=$0}; END{for(i=0;i<index1;i++){for(j=0;j<index2;++j){print a[i] OFS b[j]; a[i]="  "}}}' 2.txt 1.txt
  2. 44 45 23
  3.    45 23
  4.    45 23
  5.    23 09
  6.    23 09
  7.    10 87
  8. 52 45 23
  9.    45 23
  10.    45 23
  11.    23 09
  12.    23 09
  13.    10 87
  14. 37 45 23
  15.    45 23
  16.    45 23
  17.    23 09
  18.    23 09
  19.    10 87
  20. [seesea@UC ~]$ awk '{while(getline line < "1.txt"){ print $0 OFS line; $0 = "  "}; close("1.txt")}' 2.txt  
  21. 44 45 23
  22.    45 23
  23.    45 23
  24.    23 09
  25.    23 09
  26.    10 87
  27. 52 45 23
  28.    45 23
  29.    45 23
  30.    23 09
  31.    23 09
  32.    10 87
  33. 37 45 23
  34.    45 23
  35.    45 23
  36.    23 09
  37.    23 09
  38.    10 87
复制代码

论坛徽章:
7
数据库技术版块每日发帖之星
日期:2015-08-08 06:20:00数据库技术版块每日发帖之星
日期:2015-08-29 06:20:00数据库技术版块每日发帖之星
日期:2015-08-29 06:20:00数据库技术版块每日发帖之星
日期:2015-09-18 06:20:00数据库技术版块每周发帖之星
日期:2015-11-06 19:56:51数据库技术版块每日发帖之星
日期:2016-01-22 06:20:00数据库技术版块每日发帖之星
日期:2016-02-05 06:20:00
发表于 2013-01-15 11:44 |显示全部楼层
  1. awk 'NR==FNR{a[m++]=$0;next}{b[n++]=$0}END{for(i=0;i<m;i++){f=1;for(j=0;j<n;j++) {if(f){print a[i],b[j];f=0;}else{print "   "b[j]}}}}' f2 f1
复制代码

论坛徽章:
0
发表于 2013-01-15 11:44 |显示全部楼层
  1. awk 'NR==FNR{i++;a[i]=$0;next;}{j++;b[j]=$0}END{for(c=1;c<=j;c++){for(k=1;k<=i;k++)if(k==1)print b[c],a[k];else print FS,"",a[k]}}' file1 file2
复制代码
水平有限,有点长了~

论坛徽章:
0
发表于 2013-01-15 12:42 |显示全部楼层
  1. cat b|while read i;do echo -ne $i" ";sed '2,$s/^/   /' a;done
复制代码
水平有限,呵呵

论坛徽章:
0
发表于 2013-01-15 12:43 |显示全部楼层
突然发现楼上几位大牛都用的awk

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
发表于 2013-01-15 14:07 |显示全部楼层
本帖最后由 yestreenstars 于 2013-01-15 14:08 编辑
  1. awk 'NR==FNR{a[NR]=$0;next}{print $0,a[1];gsub(/./," ");for(i=2;i<=length(a);i++)print $0,a[i]}'
复制代码
PS:楼上的,如果b文件中的数字不是十位数,而是百位数,那格式也要跟着变化啊,你们懂我的意思吗?

论坛徽章:
25
程序设计版块每日发帖之星
日期:2016-05-03 06:20:0015-16赛季CBA联赛之八一
日期:2018-07-05 10:34:09黑曼巴
日期:2018-07-06 15:19:5015-16赛季CBA联赛之佛山
日期:2018-08-03 13:19:3315-16赛季CBA联赛之山西
日期:2018-08-07 19:46:2315-16赛季CBA联赛之广夏
日期:2018-08-08 19:31:5015-16赛季CBA联赛之青岛
日期:2018-11-26 15:21:5015-16赛季CBA联赛之上海
日期:2018-12-11 09:45:3219周年集字徽章-年
日期:2020-04-18 23:54:5215-16赛季CBA联赛之深圳
日期:2020-04-19 21:40:19黑曼巴
日期:2022-04-03 17:55:1315-16赛季CBA联赛之八一
日期:2018-07-03 16:56:46
发表于 2022-06-09 18:21 |显示全部楼层

  1. cat 1
  2. 45 23
  3. 45 23
  4. 45 23
  5. 23 09
  6. 23 09
  7. 10 87

  8. cat 2
  9. 44
  10. 52
  11. 37
  12. 370

  13. awk 'FILENAME==ARGV[1]{a=a?a"\n-"$0:$0;next}{for(i=1;i<=length($0);i++){b=b?b" ":"  "};c=gensub("-",b,"g",a);print $0,c;b=""}' 1 2
  14. awk 'FILENAME==ARGV[1]{a[NR]=$0;next}{for(i=1;i<=length($0);i++){b=b?b" ":" "};for(i=1;i<=length(a);i++){print i==1?$0:b,a[i]};b=""}' 1 2

  15. 输出结果:
  16. 44 45 23
  17.    45 23
  18.    45 23
  19.    23 09
  20.    23 09
  21.    10 87
  22. 52 45 23
  23.    45 23
  24.    45 23
  25.    23 09
  26.    23 09
  27.    10 87
  28. 37 45 23
  29.    45 23
  30.    45 23
  31.    23 09
  32.    23 09
  33.    10 87
  34. 370 45 23
  35.     45 23
  36.     45 23
  37.     23 09
  38.     23 09
  39.     10 87
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP