免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3523 | 回复: 11
打印 上一主题 下一主题

[文本处理] 急,这个shell怎么写啊! [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-06-06 00:49 |只看该作者 |倒序浏览
对a.txt 和b.txt文本进行合并
1、当a.txt中的第二列不存在于b.txt中时就追加到b.txt中,同时把第一列的时间也追加到第四列上
2、当a.txt中的第二列存在于b.txt中时,不追加,如果a.txt中的第一列大于b.txt中的第四列(或者是b.txt为空时,
      把a.txt中第一列更新到b.txt中的第四列上),则把a.txt中第一列更新到b.txt中的第四列上,否则不更新
a.txt;
20140501103323|aaa|7
20140512331212|bbb|11
20140410103333|ccc|7
20140516331522|eee|11

b.txt
20140101101121|aaa|7
20140210103323|bbb|7|2014031010233119
20140312233121|123|8|2014050218311909
20140512331212|eee|11
20140513233321|fff|10

希望结果如下
c.txt
20140101101121|aaa|7|20140501103323
20140210103323|bbb|7|20140512331212
20140312233121|123|8
20140512331212|eee|11|20140516331522
20140513233321|fff|10
20140410103333|ccc|7|20140410103333

论坛徽章:
0
2 [报告]
发表于 2014-06-06 08:48 |只看该作者
awk弱渣,两条才搞定,还那么长,权当抛砖引玉了……
  1. awk 'BEGIN{FS=OFS="|"}{print $0,$1}' a.txt >>b.txt
  2. awk -F"|" '{if(a[$2]==""){a[$2]=$0;b[$2]=$4}else{if($4>b[$2])a[$2]=$0}}END{for(i in a)print a[i]}' b.txt >>c.txt
复制代码

论坛徽章:
8
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015小元宵徽章
日期:2015-03-06 15:58:18每日论坛发贴之星
日期:2015-06-08 22:20:00每日论坛发贴之星
日期:2015-06-08 22:20:00操作系统版块每日发帖之星
日期:2015-06-14 22:20:00数据库技术版块每日发帖之星
日期:2015-11-09 06:20:00数据库技术版块每日发帖之星
日期:2016-02-22 06:20:0015-16赛季CBA联赛之上海
日期:2017-01-01 23:58:53
3 [报告]
发表于 2014-06-06 10:39 |只看该作者
牛逼
回复 2# 用户名注册后不能更改


   

论坛徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之北京
日期:2016-07-06 15:42:0715-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:0915-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56黄金圣斗士
日期:2015-12-02 11:44:35白银圣斗士
日期:2015-11-25 14:32:43白银圣斗士
日期:2015-11-23 12:53:352015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:482015亚冠之首尔
日期:2015-09-01 16:46:052015亚冠之德黑兰石油
日期:2015-08-31 11:39:192015亚冠之萨济拖拉机
日期:2015-08-28 21:06:5315-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53
4 [报告]
发表于 2014-06-06 13:21 |只看该作者
  1. awk 'BEGIN{FS=OFS="|"}NR==FNR{b[$2]=$0;next}{if($2 in b){split(b[$2],x,"|");if($1>x[4]){x[4]=$1;for(i in x)s=length(s)>0?s"|"x[i]:x[i];b[$2]=s;s=""}}else{$4=$1;b[$2]=$0}}END{for(i in b)print b[i]}' b a
复制代码

论坛徽章:
0
5 [报告]
发表于 2014-06-09 09:43 |只看该作者
回复 4# reyleon

  谢谢了

   

论坛徽章:
0
6 [报告]
发表于 2014-06-09 09:43 |只看该作者
回复 2# 用户名注册后不能更改

  谢谢了,如何合在一起啊?
   

论坛徽章:
0
7 [报告]
发表于 2014-06-09 10:20 |只看该作者
回复 2# 用户名注册后不能更改
  这个运行后,结果不对啊

   

论坛徽章:
780
金牛座
日期:2014-02-26 17:49:58水瓶座
日期:2014-02-26 18:10:15白羊座
日期:2014-04-15 19:29:52寅虎
日期:2014-04-17 19:43:21酉鸡
日期:2014-04-19 21:24:10子鼠
日期:2014-04-22 13:55:24卯兔
日期:2014-04-22 14:20:58亥猪
日期:2014-04-22 16:13:09狮子座
日期:2014-05-05 22:31:17摩羯座
日期:2014-05-06 10:32:53处女座
日期:2014-05-12 09:23:11子鼠
日期:2014-05-21 18:21:27
8 [报告]
发表于 2014-06-09 10:32 |只看该作者
本帖最后由 Herowinter 于 2014-06-09 10:32 编辑

回复 1# wzltian
  1. awk 'BEGIN{FS=OFS="|"} NR==FNR{a[$2]=$0;next} {if($2 in a){split(a[$2],b,"|");if(!length($4)||b[1]>$4)$4=b[1];delete a[$2]};print} END{for(i in a){split(a[i],b,"|");print a[i]"|"b[1]}}' a.txt b.txt
  2. 20140101101121|aaa|7|20140501103323
  3. 20140210103323|bbb|7|2014031010233119
  4. 20140312233121|123|8|2014050218311909
  5. 20140512331212|eee|11|20140516331522
  6. 20140513233321|fff|10
  7. 20140410103333|ccc|7|20140410103333
复制代码
第二列为123的跟你的期望结果有点不一样。

   

论坛徽章:
7
亥猪
日期:2013-10-10 17:00:29辰龙
日期:2013-10-12 16:23:19卯兔
日期:2013-11-18 17:01:27金牛座
日期:2014-09-09 10:17:052015七夕节徽章
日期:2015-08-21 11:06:172015亚冠之柏太阳神
日期:2015-09-25 13:56:42数据库技术版块每日发帖之星
日期:2016-08-06 06:20:00
9 [报告]
发表于 2014-06-09 12:44 |只看该作者
本帖最后由 li0924 于 2014-06-09 13:00 编辑

试试这个;有没有高端大气上档次!
  1. awk -F"|" 'NR==FNR{a[$2]=$1;c[$2]=$0;next}{$4=(($2 in a)?(a[$2]>$4?a[$2]:$4):"";print $0;b[$2]}END{for(i in a){if(! (i in b))print c[i] FS a[i]}}' a b
复制代码
这用SQL很好实现;就用merge into搞定

论坛徽章:
0
10 [报告]
发表于 2014-06-09 13:49 |只看该作者
回复 8# Herowinter


   谢谢了,我举例的结果中 “123” 后面应该有值的,你写的这个结果是我想要的。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP