免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1224 | 回复: 5
打印 上一主题 下一主题

[文本处理] 文本数据差异处理 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-08-12 22:44 |只看该作者 |倒序浏览
有以下两个文本
a.txt
139139 10.00
137137 119.00
139139 10.00
189189 1.00
139139 10.00
146146 88.00
b.txt
139139 10.00
137137 119.00
146146 88.00
比较a.txt比b.txt多出的数据,结果要求
139139 10.00
189189 1.00
139139 10.00
有没有比较快速的方法,求助

论坛徽章:
0
2 [报告]
发表于 2015-08-12 23:00 |只看该作者
diff a.txt b.txt

论坛徽章:
1
天蝎座
日期:2013-08-22 15:14:44
3 [报告]
发表于 2015-08-13 08:45 |只看该作者
  1. awk 'FNR==NR{a[$0]++}FNR<NR{b[$0]++}END{for(i in a) {for(j=b[i];j<a[i];j++) print i}}' a.txt b.txt
复制代码
Output:
189189 1.00
139139 10.00
139139 10.00

论坛徽章:
95
程序设计版块每日发帖之星
日期:2015-09-05 06:20:00程序设计版块每日发帖之星
日期:2015-09-17 06:20:00程序设计版块每日发帖之星
日期:2015-09-18 06:20:002015亚冠之阿尔艾因
日期:2015-09-18 10:35:08月度论坛发贴之星
日期:2015-09-30 22:25:002015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39程序设计版块每日发帖之星
日期:2015-10-05 06:20:00每日论坛发贴之星
日期:2015-10-05 06:20:002015年亚冠纪念徽章
日期:2015-10-06 10:06:482015亚冠之塔什干棉农
日期:2015-10-19 19:43:35程序设计版块每日发帖之星
日期:2015-10-21 06:20:00每日论坛发贴之星
日期:2015-09-14 06:20:00
4 [报告]
发表于 2015-08-13 09:44 |只看该作者
回复 1# adam_chenzh


    用 grep -f

论坛徽章:
7
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:57:092015小元宵徽章
日期:2015-03-06 15:58:18程序设计版块每日发帖之星
日期:2015-08-09 06:20:00每日论坛发贴之星
日期:2015-08-09 06:20:00程序设计版块每日发帖之星
日期:2015-08-22 06:20:00程序设计版块每日发帖之星
日期:2015-08-27 06:20:00
5 [报告]
发表于 2015-08-13 10:00 |只看该作者
本帖最后由 tuyajie 于 2015-08-13 10:01 编辑
  1. awk 'NR==FNR{a[$0]++;next}(a[$0]--<= 0)' b.txt a.txt
复制代码
这样不改变原来顺序

论坛徽章:
0
6 [报告]
发表于 2015-08-13 11:18 |只看该作者
guogang225 发表于 2015-08-13 08:45
Output:
189189 1.00
139139 10.00

不参考顺序,这个可行
谢谢
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP