忘记密码   免费注册 查看新帖 | 论坛精华区

ChinaUnix.net

  平台 论坛 博客 认证专区 大话IT HPC论坛 徽章 文库 沙龙 自测 下载 频道自动化运维 虚拟化 储存备份 C/C++ PHP MySQL 嵌入式 Linux系统
最近访问板块 发新帖
查看: 690 | 回复: 6

[文本处理] 文本拼接 [复制链接]

论坛徽章:
0
发表于 2017-08-21 14:24 |显示全部楼层
本帖最后由 ma3501406 于 2017-08-21 15:12 编辑

1.txt
a        45n60
a        61n76
a        77n84
a        85n92
a        93n100
a        101n108
a        109n120
a        121n124
a        125n128
a        129n131
b        45n60
b        61n76
b        77n84
b        85n92
b        93n100
b        101n108
b        109n120
b        121n124
b        125n128
b        129n131


2.txt
a        45n61
a        77n92
a        109n125
b        45n61
b        77n92
b        109n125
要求:第一列相同的情况下,判断第二列n的左边与右边能否拼接,##2.txt中的是否在1.txt中的之间,第二列n左边的只能与n右边的拼接
输出2.txt中的
a        45n61
a        109n125
b        45n61
b        109n125

论坛徽章:
6
摩羯座
日期:2013-08-24 10:43:10狮子座
日期:2013-08-25 10:27:06天秤座
日期:2013-09-11 20:28:44午马
日期:2014-09-28 16:06:0015-16赛季CBA联赛之八一
日期:2016-12-19 13:55:0515-16赛季CBA联赛之天津
日期:2016-12-20 14:01:23
发表于 2017-08-21 14:48 |显示全部楼层
大神,看不懂你要求

论坛徽章:
0
发表于 2017-08-21 15:42 |显示全部楼层
回复 2# cao627

判断2.txt中n左边的和n右边的拼接,是否在1.txt之中,n的左边只能与n的右边拼接

论坛徽章:
6
摩羯座
日期:2013-08-24 10:43:10狮子座
日期:2013-08-25 10:27:06天秤座
日期:2013-09-11 20:28:44午马
日期:2014-09-28 16:06:0015-16赛季CBA联赛之八一
日期:2016-12-19 13:55:0515-16赛季CBA联赛之天津
日期:2016-12-20 14:01:23
发表于 2017-08-29 12:50 |显示全部楼层
本帖最后由 cao627 于 2017-08-29 12:52 编辑

回复 3# ma3501406

1.txt
a        45n60
a        61n76
a        77n84
a        85n92
a        93n100
a        101n108
a        109n120
a        121n124
a        125n128
a        129n131
(略)

2.txt
a        45n61
a        77n92     
a        109n125
(略)

输出2.txt中的
a        45n61
a        109n125
(略)


请问是否这个意思:2.txt中的某行n两边的数(如2 txt中第三行的109125)如若能同时在1 .txt中n的左边找到(如1.txt中第7行n左边109和9行n左边125)则输出输出该行,否则不输出


论坛徽章:
0
发表于 2017-08-30 21:22 |显示全部楼层
回复 4# cao627

对的

论坛徽章:
28
酉鸡
日期:2014-05-04 10:03:482015年迎新春徽章
日期:2015-03-04 09:58:112015年亚洲杯纪念徽章
日期:2015-03-20 14:40:232015亚冠之阿尔纳斯尔
日期:2015-06-02 18:59:042015亚冠之阿尔希拉尔
日期:2015-06-30 15:22:572015亚冠之大阪钢巴
日期:2015-07-20 10:44:332015亚冠之阿尔纳斯尔
日期:2015-10-28 14:57:5215-16赛季CBA联赛之新疆
日期:2015-12-25 10:18:45黑曼巴
日期:2016-06-26 21:39:5315-16赛季CBA联赛之山西
日期:2016-07-25 21:54:2715-16赛季CBA联赛之北京
日期:2016-10-27 12:07:2315-16赛季CBA联赛之八一
日期:2017-07-07 16:39:09
发表于 2017-08-31 09:34 |显示全部楼层
回复 1# ma3501406


  1. awk -F " +|n" 'FNR==NR{a[$2]=1;next}a[$2]&&a[$3]' 1.txt  2.txt
复制代码

论坛徽章:
2
程序设计版块每日发帖之星
日期:2016-05-03 06:20:0015-16赛季CBA联赛之同曦
日期:2017-09-11 14:39:48
发表于 2017-09-08 10:28 |显示全部楼层
本帖最后由 wh7211 于 2017-09-08 10:37 编辑

回复 1# ma3501406

要求:第一列相同的情况下,判断第二列n的左边与右边能否拼接 ……

  1. awk -F" +|n" 'FILENAME==ARGV[1]{a[$1" "$2]++;next}a[$1" "$2]&&a[$1" "$3]' 1.txt 2.txt
复制代码


以下代码要求awk4.0:
  1. awk -F" +|n" 'FILENAME==ARGV[1]{a[$1][$2]++;next}a[$1][$2]&&a[$1][$3]' 1.txt 2.txt
复制代码


输出:
a        45n61
a        109n125
b        45n61
b        109n125
您需要登录后才可以回帖 登录 | 注册

本版积分规则

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号 北京市公安局海淀分局网监中心备案编号:11010802020122
广播电视节目制作经营许可证(京) 字第1234号 中国互联网协会会员  联系我们:
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP