免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: iocg
打印 上一主题 下一主题

[文本处理] 如何将两个文本按要求整合在一起? [复制链接]

论坛徽章:
1
白羊座
日期:2014-11-13 10:19:16
11 [报告]
发表于 2014-10-22 08:34 |只看该作者
本帖最后由 iocg 于 2014-10-22 08:36 编辑

回复 8# ly5066113

如果现在数据是这样的。。改怎么调整代码??
A
  1. 京,张三,A,1235,TOYOTA,申请,a,401
  2. 津,李四,D,1237,HONDA,申请,b,401
  3. 冀,王五,C,1235,MAZDA,申请,c,402
  4. 皖,小明,D,1233,BUICK,申请,,501
  5. 内蒙古,小黄,E,1236,SATURN,申请,,501
  6. 辽,小黄,F,1236,SUBARU,申请,f,601
  7. 京,张三,A,1235,LEXUS,申请,g,630
  8. 津,李四,D,1238,HONDA,申请,,701
  9. 冀,王五,E,1235,MAZDA,申请,,801
  10. 皖,小红,D,1233,BUICK,申请,j,910
复制代码
B
  1. 京,张三,A,1235,TOYOTA,调整,a,901
  2. 津,李四,D,1237,HONDA,撤销,,905
  3. 沪,小雨,B,1237,CITROEN,添加,,908
  4. 冀,王五,C,1235,MAZDA,调整,,910
  5. 京,张三,A,1235,TOYOTA,撤销,,910
  6. 皖,小明,D,1233,BUICK,调整,f,912
  7. 吉,小胡,A,1237,Bentley,添加,g,1005
  8. 沪,小雨,B,1237,CITROEN,撤销,h,1006
复制代码
想要的结果
  1. 京,张三,A,1235,TOYOTA,申请,a,401
  2. 内蒙古,小黄,E,1236,SATURN,申请,,501
  3. 辽,小黄,F,1236,SUBARU,申请,f,601
  4. 京,张三,A,1235,LEXUS,申请,g,630
  5. 津,李四,D,1238,HONDA,申请,,701
  6. 冀,王五,E,1235,MAZDA,申请,,801
  7. 皖,小红,D,1233,BUICK,申请,j,910
  8. 皖,小明,D,1233,BUICK,调整,f,912
  9. 冀,王五,C,1235,MAZDA,调整,,910
  10. 吉,小胡,A,1237,Bentley,添加,g,1005
复制代码
对于本例子执行了如下
津,李四,D,1237,HONDA,申请,b,401
津,李四,D,1237,HONDA,撤销,,905       ==>撤销上一条申请,结果是删除该记录

京,张三,A,1235,TOYOTA,申请,a,401
京,张三,A,1235,TOYOTA,调整,a,901
京,张三,A,1235,TOYOTA,撤销,,910    ==>撤销上一条调整,结果是只保留申请记录

冀,王五,C,1235,MAZDA,申请,c,402
冀,王五,C,1235,MAZDA,调整,,910    ==>将申请改为调整,结果是只保留调整记录

皖,小明,D,1233,BUICK,申请,,501
皖,小明,D,1233,BUICK,调整,f,912    ==>将申请改为调整,结果是只保留调整记录

沪,小雨,B,1237,CITROEN,添加,,908
沪,小雨,B,1237,CITROEN,撤销,h,1006   ==>撤销上一条添加,结果是删除新添加的记录

吉,小胡,A,1237,Bentley,添加,g,1005   ==>添加新记录

   大家来帮个忙 @bulletmarquis@李满满@rulebook

论坛徽章:
6
处女座
日期:2014-04-02 16:07:17酉鸡
日期:2014-04-14 10:09:22子鼠
日期:2014-04-17 11:57:30辰龙
日期:2014-09-01 17:14:08戌狗
日期:2014-10-28 12:25:54未羊
日期:2014-11-14 11:31:58
12 [报告]
发表于 2014-10-23 16:48 |只看该作者
回复 11# iocg
  1.    awk -F, 'NR==FNR{t=$1","$2","$3","$4","$5;a[t]=$6;;aa[t]=$7","$8;next} {t=$1","$2","$3","$4","$5;b[t]=b[t]?b[t]" "$6:$6;bb[t]=$7","$8}END{for(i in b){split(b[i],p," ");if(length(p)%2==0&&p[length(p)]=="撤销"){b[i]=""}else{b[i]==p[length(p)]}};for(i in a){if(a[i]=="申请"&&b[i]=="调整"){c[i]=i",调整,"bb[i]}else if(a[i]=="申请"&&b[i]=="撤销"){;}else if(a[i]=="申请"&&b[i]==""){c[i]=i",申请,"aa[i]}};for(i in b){if(b[i]=="添加"){c[i]=i",添加,"bb[i]}};for(i in c){print c[i]}}' o oo
复制代码
试试
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP