免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2788 | 回复: 9
打印 上一主题 下一主题

[文本处理] 这个对比脚本怎么写啊 [复制链接]

论坛徽章:
1
巨蟹座
日期:2014-09-15 14:33:54
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-09-04 20:20 |只看该作者 |倒序浏览
我现在也在写个脚本啊,大概是这样
===========================
[root@Desktop]# cat file01
a
b
c

[root@ Desktop]# cat file02
c
f
a

[root@ Desktop]# diff file01  file02
1,2d0
< a
< b
4c2,3
<
---
> f
> a
===========================

其实我想直接得到file02文件中,只有f是在file01不存在的,也就是两个文件对比,输出的死“f”
这个怎么写呢?难点是file02的元素师顺序和file01不一样,

论坛徽章:
1
巨蟹座
日期:2014-09-15 14:33:54
2 [报告]
发表于 2013-09-04 20:30 |只看该作者
等大家解决啊

论坛徽章:
6
摩羯座
日期:2013-08-24 10:43:10狮子座
日期:2013-08-25 10:27:06天秤座
日期:2013-09-11 20:28:44午马
日期:2014-09-28 16:06:0015-16赛季CBA联赛之八一
日期:2016-12-19 13:55:0515-16赛季CBA联赛之天津
日期:2016-12-20 14:01:23
3 [报告]
发表于 2013-09-04 20:34 |只看该作者
  1. grep -vf file1 file2
复制代码

论坛徽章:
1
巨蟹座
日期:2014-09-15 14:33:54
4 [报告]
发表于 2013-09-04 20:49 |只看该作者
回复 3# cao627
  1. [root@sobey Desktop]# grep -vf file01 file02
  2. [root@sobey Desktop]# cat file01
  3. a
  4. b
  5. c

  6. [root@sobey Desktop]# cat file02
  7. c
  8. f
  9. a
复制代码
不行啊

论坛徽章:
1
巨蟹座
日期:2014-09-15 14:33:54
5 [报告]
发表于 2013-09-04 20:50 |只看该作者
  1. awk '{print NR, $0}' file1 file2 |sort -k2|uniq -u -f 1|sort -k1|awk '{print $2}'
复制代码
我用这个能得出
b

f

论坛徽章:
6
摩羯座
日期:2013-08-24 10:43:10狮子座
日期:2013-08-25 10:27:06天秤座
日期:2013-09-11 20:28:44午马
日期:2014-09-28 16:06:0015-16赛季CBA联赛之八一
日期:2016-12-19 13:55:0515-16赛季CBA联赛之天津
日期:2016-12-20 14:01:23
6 [报告]
发表于 2013-09-04 21:02 |只看该作者
回复 4# 20060502156
似乎是你的file01的空行引起的。删除空行应该能行。


   

论坛徽章:
6
摩羯座
日期:2013-08-24 10:43:10狮子座
日期:2013-08-25 10:27:06天秤座
日期:2013-09-11 20:28:44午马
日期:2014-09-28 16:06:0015-16赛季CBA联赛之八一
日期:2016-12-19 13:55:0515-16赛季CBA联赛之天津
日期:2016-12-20 14:01:23
7 [报告]
发表于 2013-09-04 21:08 |只看该作者
  1. grep -vwf file1 file2
复制代码
加-w选项能解决file1中空行问题。

论坛徽章:
1
巨蟹座
日期:2014-09-15 14:33:54
8 [报告]
发表于 2013-09-04 21:19 |只看该作者
回复 7# cao627


解决了,我想复杂了啊!

[root@ ]# cat file1
a
b
c

[root@ ]# cat file2
c
f
a

[root@]# grep -vwf file1 file2
f

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
9 [报告]
发表于 2013-09-04 21:54 |只看该作者
回复 1# 20060502156
  1. comm  -13 <(sort file01) <(sort file02)
复制代码

论坛徽章:
5
未羊
日期:2014-08-04 16:15:21天秤座
日期:2014-08-13 13:52:372015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:56:112015亚冠之浦和红钻
日期:2015-06-29 15:30:48
10 [报告]
发表于 2013-09-05 09:12 |只看该作者
  1. awk 'NR<=FNR{a[$0]=$0;next}{if($0 in a);else print $0}' file01 file02
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP