免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 3821 | 回复: 20
打印 上一主题 下一主题

[文本处理] 如何将两个生成的文本按第一列合并呢? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-08-26 15:06 |只看该作者 |倒序浏览
第一个文本文件内容是
B   北京
A   安微
H   湖南
G   广东
第二个文本内容是
A   080111
H   070222
G   060999
E    040987
F    123876

请问如何将这两个文件内容合并成
A    安徽  080111
H   湖南    070222
…………

第二列和第三列,如果没有对应的行,则用NULL代码么?我要导入到mysql数据库的。
谢谢!

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
2 [报告]
发表于 2014-08-26 15:19 |只看该作者
回复 1# hao3721


try:
  1. join -a 1 -e NULL -o 1.1,1.2,2.2 <(sort file1) <(sort file2)
复制代码

论坛徽章:
1
2015年迎新春徽章
日期:2015-03-04 09:58:11
3 [报告]
发表于 2014-08-26 15:23 |只看该作者
  1. [root@localhost ~]# awk 'NR==FNR{a[$1]=$2;next}{if($1 in a)print $1,a[$1],$2}' file1 file2
  2. A 安微 080111
  3. H 湖南 070222
  4. G 广东 060999
  5. [root@localhost ~]# cat file1 file2
  6. B   北京
  7. A   安微
  8. H   湖南
  9. G   广东
  10. A   080111
  11. H   070222
  12. G   060999
  13. E    040987
  14. F    123876
复制代码

论坛徽章:
0
4 [报告]
发表于 2014-08-26 16:51 |只看该作者
大神呀!膜拜一下!! 回复 3# 这个冬天不冷


   

论坛徽章:
1
2015年迎新春徽章
日期:2015-03-04 09:58:11
5 [报告]
发表于 2014-08-26 16:56 |只看该作者
行走的小布鞋 发表于 2014-08-26 16:51
大神呀!膜拜一下!! 回复 3# 这个冬天不冷

对不起,我是个菜鸟

论坛徽章:
7
亥猪
日期:2013-10-10 17:00:29辰龙
日期:2013-10-12 16:23:19卯兔
日期:2013-11-18 17:01:27金牛座
日期:2014-09-09 10:17:052015七夕节徽章
日期:2015-08-21 11:06:172015亚冠之柏太阳神
日期:2015-09-25 13:56:42数据库技术版块每日发帖之星
日期:2016-08-06 06:20:00
6 [报告]
发表于 2014-08-26 17:07 |只看该作者
本帖最后由 li0924 于 2014-08-26 17:08 编辑
  1. awk -vOFS="|" 'NR==FNR{a[$1]=$2;next}{b[$1]=1;print a[$1]?$1,a[$1],$2:$1,"null",$2}END{for(i in a){if(! b[i])print i,a[i],"null"}}' file1 file2
复制代码

论坛徽章:
0
7 [报告]
发表于 2014-08-26 17:09 |只看该作者
awk 'NR==FNR{arry[$1]=$2}NR>FNR{print $0,arry[$1]}'  文本2  文本1

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
8 [报告]
发表于 2014-08-26 23:57 |只看该作者
  1. $ awk 'NR==FNR{a[$1]=$2;next}{t=a[$1]!=""?a[$1]:"NULL";print $1,t,$2}' a b
  2. A 安微 080111
  3. H 湖南 070222
  4. G 广东 060999
  5. E NULL 040987
  6. F NULL 123876
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
9 [报告]
发表于 2014-08-26 23:59 |只看该作者
回复 2# ly5066113

搞错了吧~
  1. $ join -a 1 -e NULL -o 1.1,1.2,2.2 <(sort a) <(sort b)
  2. A 安微 080111
  3. B 北京 NULL
  4. G 广东 060999
  5. H 湖南 070222
复制代码

论坛徽章:
0
10 [报告]
发表于 2014-08-27 09:38 |只看该作者
  1. awk 'NR==FNR{a[$1]=$2;next}{print a[$1]?$1" "a[$1]" "$2:$1" ""NULL"" "$2}' file1 file2
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP