免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: 力哥丶
打印 上一主题 下一主题

[文本处理] 俩文件处理 [复制链接]

论坛徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之北京
日期:2016-07-06 15:42:0715-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:0915-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56黄金圣斗士
日期:2015-12-02 11:44:35白银圣斗士
日期:2015-11-25 14:32:43白银圣斗士
日期:2015-11-23 12:53:352015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:482015亚冠之首尔
日期:2015-09-01 16:46:052015亚冠之德黑兰石油
日期:2015-08-31 11:39:192015亚冠之萨济拖拉机
日期:2015-08-28 21:06:5315-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53
11 [报告]
发表于 2013-01-10 11:18 |只看该作者
回复 10# rongpmcu


       我没有出现你的这个问题喔

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
12 [报告]
发表于 2013-01-10 11:23 |只看该作者
好复杂的问题。

论坛徽章:
93
2015年辞旧岁徽章
日期:2019-10-10 10:51:15CU大牛徽章
日期:2014-02-21 14:21:56CU十二周年纪念徽章
日期:2020-10-15 16:55:55CU大牛徽章
日期:2014-02-21 14:22:07羊年新春福章
日期:2019-10-10 10:51:39CU大牛徽章
日期:2019-10-10 10:55:38季节之章:春
日期:2020-10-15 16:57:40ChinaUnix元老
日期:2019-10-10 10:54:42季节之章:冬
日期:2019-10-10 10:57:17CU大牛徽章
日期:2014-02-21 14:22:52CU大牛徽章
日期:2014-03-13 10:40:30CU大牛徽章
日期:2014-02-21 14:23:15
13 [报告]
发表于 2013-01-10 11:48 |只看该作者
回复 12# blackold


顶 +10086。
复杂的 diff 都不能胜任了。

论坛徽章:
0
14 [报告]
发表于 2013-01-10 12:48 |只看该作者
本帖最后由 rongpmcu 于 2013-01-10 12:57 编辑

回复 11# reyleon


    # comm --version
comm (GNU coreutils) 8.5
Copyright (C) 2010 Free Software Foundation, Inc.
许可证:GPLv3+:GNU 通用公共许可证第3 版或更新版本<http://gnu.org/licenses/gpl.html>。
本软件是自由软件:您可以自由修改和重新发布它。
在法律范围内没有其他保证。

由Richard M. Stallman 和David MacKenzie 编写。


这样就可以
  1. # comm -3 --nocheck-order <(sort -t. -k4 -n CA|awk '!a[$0]++') <(sort -t. -k4 -n CB|awk '!a[$0]++')|xargs -l
复制代码
  1. If the `--check-order' option is given, unsorted inputs will cause a
  2. fatal error message.  If the option `--nocheck-order' is given,
  3. unsorted inputs will never cause an error message.  If neither of these
  4. options is given, wrongly sorted inputs are diagnosed only if an input
  5. file is found to contain unpairable lines.  If an input file is
  6. diagnosed as being unsorted, the `comm' command will exit with a
  7. nonzero status (and the output should not be used).

  8.    Forcing `comm' to process wrongly sorted input files containing
  9. unpairable lines by specifying `--nocheck-order' is not guaranteed to
  10. produce any particular output.  The output will probably not correspond
  11. with whatever you hoped it would be.
复制代码
我的理解 是不是comm认为
10.0.0.1
10.0.0.12这样就满足if an input file is found to contain unpairable lines ???

论坛徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之北京
日期:2016-07-06 15:42:0715-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:0915-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56黄金圣斗士
日期:2015-12-02 11:44:35白银圣斗士
日期:2015-11-25 14:32:43白银圣斗士
日期:2015-11-23 12:53:352015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:482015亚冠之首尔
日期:2015-09-01 16:46:052015亚冠之德黑兰石油
日期:2015-08-31 11:39:192015亚冠之萨济拖拉机
日期:2015-08-28 21:06:5315-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53
15 [报告]
发表于 2013-01-10 12:59 |只看该作者
回复 14# rongpmcu


    你的版本好新啊,哈哈,你用的啥系统?

[root@centos ~]# comm --version      
comm (GNU coreutils) 5.97
Copyright (C) 2006 Free Software Foundation, Inc.
This is free software.  You may redistribute copies of it under the terms of
the GNU General Public License <http://www.gnu.org/licenses/gpl.html>.
There is NO WARRANTY, to the extent permitted by law.

Written by Richard Stallman and David MacKenzie.

论坛徽章:
0
16 [报告]
发表于 2013-01-10 13:05 |只看该作者
回复 15# reyleon
用的fedora14  用了2年多了吧

  1. Linux rongp.com 2.6.35.6-45.fc14.i686 #1 SMP Mon Oct 18 23:56:17 UTC 2010 i686 i686 i386 GNU/Linux

  2. [root@rongp]  ~
  3. # cat /etc/issue
  4. Fedora release 14 (Laughlin)
  5. Kernel \r on an \m (\l)
复制代码

论坛徽章:
0
17 [报告]
发表于 2013-01-10 15:41 |只看该作者
回复 1# 力哥丶
  1. cat file1 file2 | sort  | uniq -c |  awk '$1~/^1/{print $0}'
复制代码

论坛徽章:
1
射手座
日期:2014-03-10 14:24:52
18 [报告]
发表于 2013-01-10 16:52 |只看该作者
我想能不能把第一个文件做个数组,如果第二个文件里的记录在第一个里就delete掉,如果不在就输出。

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
19 [报告]
发表于 2013-01-10 16:57 |只看该作者
回复 18# davidbeckham921


    可以,我一开始的思路就是这样,但是后来发现有更好的~

论坛徽章:
1
射手座
日期:2014-03-10 14:24:52
20 [报告]
发表于 2013-01-10 17:11 |只看该作者
yestreenstars 发表于 2013-01-10 16:57
回复 18# davidbeckham921


厉害呵呵,好多东西,还考虑怎么搞呢你就已经搞出来了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP