免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 2470 | 回复: 12

[文本处理] 文本替换问题 在线求解答 [复制链接]

论坛徽章:
0
发表于 2013-04-12 20:26 |显示全部楼层
我有一个文本
a.txt 举例为:
1    THANK
2    YOU
3     I
4    NEED
5    HELP
6    CAN
文本b.txt举例为
THANK   YOU
NEED    HELP
I           CAN
YOU      CAN         



如何变为c.txt:
        1     2
        4     5
        1     6
        2     6

十分感谢

论坛徽章:
13
丑牛
日期:2013-08-16 15:08:22技术图书徽章
日期:2013-11-26 10:13:40双鱼座
日期:2013-11-08 15:03:26戌狗
日期:2013-11-08 13:52:30技术图书徽章
日期:2013-11-05 14:06:30戌狗
日期:2013-10-31 11:45:42CU十二周年纪念徽章
日期:2013-10-24 15:41:34天秤座
日期:2013-10-11 14:55:08子鼠
日期:2013-09-26 19:36:35水瓶座
日期:2013-09-26 17:44:56午马
日期:2013-08-26 10:24:23丑牛
日期:2013-08-19 14:43:22
发表于 2013-04-12 20:32 |显示全部楼层
回复 1# a475772910


    你是不是写错了,答案不应该是下面这个么?
        1     2
        4     5
        3     6
        2     6

论坛徽章:
0
发表于 2013-04-12 20:34
回复 2# 代号:军刀


    {:3_182:} 确实错了  太粗心了

论坛徽章:
6
摩羯座
日期:2013-08-24 10:43:10狮子座
日期:2013-08-25 10:27:06天秤座
日期:2013-09-11 20:28:44午马
日期:2014-09-28 16:06:0015-16赛季CBA联赛之八一
日期:2016-12-19 13:55:0515-16赛季CBA联赛之天津
日期:2016-12-20 14:01:23
发表于 2013-04-12 20:55 |显示全部楼层
本帖最后由 cao627 于 2013-04-12 20:55 编辑

如果是2楼说的,并且文件就两列的话
  1. awk 'NR==FNR{a[$2]=$1;next}{$1=a[$1];$2=a[$2]}1' a.txt b.txt
复制代码

论坛徽章:
0
发表于 2013-04-12 21:03 |显示全部楼层
回复 4# cao627


    谢谢啦   代码我试了 算小量的可以但是 为什么大量数据时  会出现  错误情况啊 不是正常匹配

论坛徽章:
0
发表于 2013-04-12 21:05 |显示全部楼层
回复 5# a475772910

1096574
2
1549874
4
5
1101986
1346804
1427988
1390774
1536319
1262318
1476139
13
1074259
1313979
1522374
1448006
1411724
1648010
1367258
1356741
1703612
23
出现这个了  正常应该
1
2
3
4
5
6
7
8
9
10
11
12
13
...
谢谢  帮忙

论坛徽章:
6
摩羯座
日期:2013-08-24 10:43:10狮子座
日期:2013-08-25 10:27:06天秤座
日期:2013-09-11 20:28:44午马
日期:2014-09-28 16:06:0015-16赛季CBA联赛之八一
日期:2016-12-19 13:55:0515-16赛季CBA联赛之天津
日期:2016-12-20 14:01:23
发表于 2013-04-12 21:13 |显示全部楼层
@a475772910
你的两个文怎么样的
我是按你贴出的文本格式写的
贴出的文本不一定要很长,但一定要能概括你的所以意思。

论坛徽章:
0
发表于 2013-04-12 21:20 |显示全部楼层
回复 7# cao627


    我试过了  不是代码的问题  代码对  是数据太大了  不知道哪里错了     十分感谢  我看看能不能分部弄  谢谢啦

论坛徽章:
6
摩羯座
日期:2013-08-24 10:43:10狮子座
日期:2013-08-25 10:27:06天秤座
日期:2013-09-11 20:28:44午马
日期:2014-09-28 16:06:0015-16赛季CBA联赛之八一
日期:2016-12-19 13:55:0515-16赛季CBA联赛之天津
日期:2016-12-20 14:01:23
发表于 2013-04-12 21:33 |显示全部楼层
本帖最后由 cao627 于 2013-04-12 21:38 编辑

@a475772910
不知道你的文本结构
看能不能用
grep -v '^[ ]*[^ ]*[ ]*[^ ]*[ ]*$' b.txt
找出不符合要求的行

论坛徽章:
0
发表于 2013-04-12 21:45 |显示全部楼层
回复 9# cao627


    谢谢啦   我看看用别的思路吧 不替换了 {:3_185:}
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

DTCC2020中国数据库技术大会

【架构革新 高效可控】2020年12月21日-23日第十一届中国数据库技术大会将在北京隆重召开。

大会设置2大主会场,20+技术专场,将邀请超百位行业专家,重点围绕数据架构、AI与大数据、传统企业数据库实践和国产开源数据库等内容展开分享和探讨,为广大数据领域从业人士提供一场年度盛会和交流平台。

http://dtcc.it168.com


大会官网>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP