免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
1234下一页
最近访问板块 发新帖
查看: 12515 | 回复: 36
打印 上一主题 下一主题

请教一个面试题,关于大文件处理的 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-07-23 19:08 |只看该作者 |倒序浏览
两个文件,file1,file2,各包含10万个唯一的qq号码,但两个文件中的号码有部分重复,要求:
1、找出file1中有而file2中没有的qq号码
2、找出file2中有而file1中没有的qq号码
3、找出两个文件中都有的号码

用bash
谢谢!!

论坛徽章:
1
数据库技术版块每日发帖之星
日期:2016-01-24 06:20:00
2 [报告]
发表于 2009-07-23 19:09 |只看该作者
comm

论坛徽章:
0
3 [报告]
发表于 2009-07-23 19:15 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
4 [报告]
发表于 2009-07-23 19:32 |只看该作者

回复 #1 niyunjiu 的帖子

[linuxboy823@fedora ~]$ cat file1
1
2
3
4
5
6
[linuxboy823@fedora ~]$ cat file2
1
2
3
4
7
8

[linuxboy823@fedora ~]$ sort file1 file2 |uniq -d>file3


1、找出file1中有而file2中没有的qq号码

[linuxboy823@fedora ~]$ sort file1 file3|uniq -u
5
6
2、找出file2中有而file1中没有的qq号码
[linuxboy823@fedora ~]$ sort file2 file3|uniq -u
7
8

3、找出两个文件中都有的号码
[linuxboy823@fedora ~]$ sort file1 file2 |uniq -d
1
2
3
4

论坛徽章:
0
5 [报告]
发表于 2009-07-23 19:35 |只看该作者
tencent?

论坛徽章:
0
6 [报告]
发表于 2009-07-23 19:36 |只看该作者
有10万行哟

论坛徽章:
0
7 [报告]
发表于 2009-07-23 19:36 |只看该作者
comm,好东西呀

论坛徽章:
0
8 [报告]
发表于 2009-07-23 19:37 |只看该作者

回复 #3 lovegqin 的帖子

-23?
什么意思?

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
9 [报告]
发表于 2009-07-23 19:40 |只看该作者
原帖由 niyunjiu 于 2009-7-23 19:37 发表
-23?
什么意思?

-1        禁止显示第一栏(在 File1 中的行)。
-2        禁止显示第二栏(在 File2 中的行)。
-3        禁止显示第三栏(与 File1 和 File2 公共的行)。

论坛徽章:
0
10 [报告]
发表于 2009-07-23 19:43 |只看该作者
谢谢大家
1、common
2、sort + uniq
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP