免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1420 | 回复: 5
打印 上一主题 下一主题

[文本处理] sed 文本替换 求大神指点 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2017-01-20 00:04 |只看该作者 |倒序浏览
本帖最后由 潇潇幕友 于 2017-01-20 00:03 编辑

有文件
a.txt
111  222
222  333
333  444
b.txt
aaa AAA
bbb BBB
ccc  CCC
每次获取b.txt的一行,并将a.txt中的111替换成获取到内容的第1列,222替换成获取到内容的第2列;且将结果追加输出到c.txt。输出结果如下:
aaa  AAA
AAA 333
333 444
bbb  BBB
BBB 333
333  444
ccc   CCC
CCC  333
333  444
如何通过脚本实现?求大神指点!!!

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
2 [报告]
发表于 2017-01-20 03:38 |只看该作者
回复 1# 潇潇幕友

$ awk 'FNR==NR{for(n=1;n<=NF;++n)a[NR,n]=$n;R=NR;next}{delete c;for(r=1;r<=R;++r){s="";for(n=1;n<=NF;++n){if(r==1)c[a[1,n]]=$n;s=s (c[a[r,n]]?c[a[r,n]]:a[r,n])" "}print s}}' a.txt b.txt
aa AAA
AAA 333
333 444
bbb BBB
BBB 333
333 444
ccc CCC
CCC 333
333 444

论坛徽章:
6
羊年新春福章
日期:2015-03-03 17:16:28双子座
日期:2015-03-03 17:16:56巳蛇
日期:2015-03-03 17:17:2415-16赛季CBA联赛之福建
日期:2016-03-11 09:05:00黑曼巴
日期:2016-07-07 16:58:1215-16赛季CBA联赛之吉林
日期:2016-11-14 09:23:07
3 [报告]
发表于 2017-01-20 10:06 |只看该作者
  1. #!/bin/bash

  2. while read line
  3. do
  4.   a=`echo ${line}|awk '{print $1}'`
  5.   b=`echo ${line}|awk '{print $2}'`
  6.   cat a.txt|sed 's/111/'$a'/;s/222/'$b'/' >> c.txt
  7. done < b.txt
复制代码

  1. #!/usr/bin/env python
  2. #_*_ coding:utf-8 _*_
  3. # Author: jiachen

  4. FileName1 = "a"
  5. FileName2 = "b"
  6. FileList = []

  7. def read_file(file_name,file_list):
  8.     with open(file_name,"r") as read_f:
  9.         for line in read_f.readlines():
  10.             file_list.append(line.strip().split())
  11.     return file_list

  12. def write_file(file_name,new_file_name,file_list):
  13.     with open(file_name,"r") as read_f,open(new_file_name,"w") as write_f:
  14.         for i in file_list:
  15.             x,y = i[0],i[1]
  16.             while True:
  17.                 content = read_f.readline().strip()
  18.                 if content:
  19.                     content = content.replace("111",x)
  20.                     content = content.replace("222",y)
  21.                     write_f.write(content + "\n")
  22.                 else:
  23.                     read_f.seek(0)
  24.                     break
  25.     return 1

  26. if __name__ == "__main__":
  27.     FileList = read_file(FileName2,FileList)
  28.     write_file(FileName1,"c",FileList)
复制代码

论坛徽章:
54
2015亚冠之德黑兰石油
日期:2015-07-07 13:00:1615-16赛季CBA联赛之深圳
日期:2016-03-31 09:03:5415-16赛季CBA联赛之辽宁
日期:2016-05-09 20:38:15程序设计版块每日发帖之星
日期:2016-05-12 06:20:0015-16赛季CBA联赛之四川
日期:2016-05-13 15:19:4715-16赛季CBA联赛之福建
日期:2016-05-15 20:24:34每日论坛发贴之星
日期:2016-05-16 06:20:0015-16赛季CBA联赛之吉林
日期:2016-05-26 11:49:4715-16赛季CBA联赛之广东
日期:2016-05-26 13:49:18极客徽章
日期:2016-12-07 14:05:2315-16赛季CBA联赛之广夏
日期:2016-12-20 17:33:532017金鸡报晓
日期:2017-01-10 15:19:56
4 [报告]
发表于 2017-01-20 10:52 |只看该作者
  1. awk 'NR==FNR{$1=$1;s=s?s"\n"$0:$0;next}{m=s;gsub("111",$1,m);gsub("222",$2,m);print m}' a b            
  2. aaa AAA
  3. AAA 333
  4. 333 444
  5. bbb BBB
  6. BBB 333
  7. 333 444
  8. ccc CCC
  9. CCC 333
  10. 333 444
复制代码

论坛徽章:
54
2015亚冠之德黑兰石油
日期:2015-07-07 13:00:1615-16赛季CBA联赛之深圳
日期:2016-03-31 09:03:5415-16赛季CBA联赛之辽宁
日期:2016-05-09 20:38:15程序设计版块每日发帖之星
日期:2016-05-12 06:20:0015-16赛季CBA联赛之四川
日期:2016-05-13 15:19:4715-16赛季CBA联赛之福建
日期:2016-05-15 20:24:34每日论坛发贴之星
日期:2016-05-16 06:20:0015-16赛季CBA联赛之吉林
日期:2016-05-26 11:49:4715-16赛季CBA联赛之广东
日期:2016-05-26 13:49:18极客徽章
日期:2016-12-07 14:05:2315-16赛季CBA联赛之广夏
日期:2016-12-20 17:33:532017金鸡报晓
日期:2017-01-10 15:19:56
5 [报告]
发表于 2017-01-20 11:55 |只看该作者
本帖最后由 haooooaaa 于 2017-01-20 14:10 编辑
  1. sed -rn '/^[0-9]/H;/^[a-z]/{G;s/(^\S+)(.+)(111)/\1\2\1/g;:a;s/(^\S+) (\S+)(.+)(222)/\1 \2\3\2/;ta;s/^[^\n]+\n+//;p}' a b
  2. aaa  AAA
  3. AAA  333
  4. 333  444
  5. bbb  BBB
  6. BBB  333
  7. 333  444
  8. ccc  CCC
  9. CCC  333
  10. 333  444
复制代码

论坛徽章:
28
15-16赛季CBA联赛之八一
日期:2016-02-22 19:10:4215-16赛季CBA联赛之深圳
日期:2016-12-01 10:34:0415-16赛季CBA联赛之新疆
日期:2016-12-07 10:24:2915-16赛季CBA联赛之同曦
日期:2016-12-15 12:06:43CU十四周年纪念徽章
日期:2016-12-18 13:03:4415-16赛季CBA联赛之吉林
日期:2017-01-03 15:52:2515-16赛季CBA联赛之辽宁
日期:2017-01-04 14:58:2415-16赛季CBA联赛之辽宁
日期:2017-01-15 09:42:512016科比退役纪念章
日期:2017-02-06 17:21:50黑曼巴
日期:2017-02-10 15:46:1215-16赛季CBA联赛之上海
日期:2017-03-18 10:14:5415-16赛季CBA联赛之青岛
日期:2017-03-18 22:00:44
6 [报告]
发表于 2017-01-20 15:14 |只看该作者

  1. sed -r '1{x;s/.*/sed 1d a.txt/e;x};G;s/(\S+)\n\S+/\1\n\1/' b.txt
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP