免费注册	查看新帖 \|


平台论坛博客文库

› 论坛 › 程序设计 › Shell › 两个文件求和

123 / 3 页下一页

最近访问板块

发新帖

楼主: gavinzhm

上一主题

下一主题

两个文件求和 [复制链接]

论坛徽章:: 0

11楼 [报告]

发表于 2010-08-16 21:42 |只看该作者

回复 9# gavinzhm

楼主，日本人没欺负你吧？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

12楼 [报告]

发表于 2010-08-17 08:27 |只看该作者

回复 gavinzhm

楼主，日本人没欺负你吧？
bbgg1983 发表于 2010-08-16 21:42

偶打工而已这种问题谈不上

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 23

15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27

白羊座
日期:2014-10-27 11:14:37

申猴
日期:2014-10-23 08:36:23

金牛座
日期:2014-09-30 08:26:49

午马
日期:2014-09-29 09:40:16

射手座
日期:2014-11-25 08:56:11

2015年辞旧岁徽章
日期:2015-03-03 16:54:15

2015年迎新春徽章
日期:2015-03-04 09:49:03

15-16赛季CBA联赛之山东
日期:2017-12-21 16:39:19

15-16赛季CBA联赛之广东
日期:2016-01-19 13:33:37

2015亚冠之山东鲁能
日期:2015-10-13 09:39:06

2015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57

13楼 [报告]

发表于 2010-08-17 12:46 |只看该作者

回复 10# gavinzhm

ly5066113@ubuntu:~$ cat 1.txt
2010/08/01 qw121.qhit.net 17189
mobile.daiwa.co.jp 15715
ot13.qhit.net 6514
mobile.daiwa.jp 982
set.daiwa.co.jp 6
2010/08/02 qw121.qhit.net 331485
mobile.daiwa.co.jp 259344
ot13.qhit.net 187007
mobile.daiwa.jp 1400
set.daiwa.co.jp 18
2010/08/03 qw121.qhit.net 348013
mobile.daiwa.co.jp 286724
ot13.qhit.net 198367
mobile.daiwa.jp 2061
set.daiwa.co.jp 20
ly5066113@ubuntu:~$ cat 2.txt
2010/08/01 mobile.daiwa.co.jp 3412
qw121.qhit.net 513
ot13.qhit.net 261
daiwa365fx.daiwa.co.jp 127
fx.daiwa.co.jp 50
mobile.daiwa.jp 50
daiwacfd.daiwa.co.jp 2
2010/08/02 mobile.daiwa.co.jp 8205
fx.daiwa.co.jp 1825
ot13.qhit.net 1461
qw121.qhit.net 923
daiwa365fx.daiwa.co.jp 440
mobile.daiwa.jp 148
daiwacfd.daiwa.co.jp 1
2010/08/03 mobile.daiwa.co.jp 8728
fx.daiwa.co.jp 1506
daiwa365fx.daiwa.co.jp 1469
ot13.qhit.net 1427
qw121.qhit.net 795
mobile.daiwa.jp 126
ly5066113@ubuntu:~$ awk -F '\t' 'FNR==1{i++}/^[0-9]/{d=$1;a[d]++}{b[$2]++;c[d","$2","i]=$3}END{for(i in a){printf i;for(j in b){print "\t"j"\t"c[i","j","1]+0"\t"c[i","j","2]+0"\t"c[i","j","1]+c[i","j","2]}}}' 1.txt 2.txt
2010/08/01 set.daiwa.co.jp 6 0 6
daiwa365fx.daiwa.co.jp 0 127 127
mobile.daiwa.jp 982 50 1032
fx.daiwa.co.jp 0 50 50
ot13.qhit.net 6514 261 6775
daiwacfd.daiwa.co.jp 0 2 2
qw121.qhit.net 17189 513 17702
mobile.daiwa.co.jp 15715 3412 19127
2010/08/02 set.daiwa.co.jp 18 0 18
daiwa365fx.daiwa.co.jp 0 440 440
mobile.daiwa.jp 1400 148 1548
fx.daiwa.co.jp 0 1825 1825
ot13.qhit.net 187007 1461 188468
daiwacfd.daiwa.co.jp 0 1 1
qw121.qhit.net 331485 923 332408
mobile.daiwa.co.jp 259344 8205 267549
2010/08/03 set.daiwa.co.jp 20 0 20
daiwa365fx.daiwa.co.jp 0 1469 1469
mobile.daiwa.jp 2061 126 2187
fx.daiwa.co.jp 0 1506 1506
ot13.qhit.net 198367 1427 199794
daiwacfd.daiwa.co.jp 0 0 0
qw121.qhit.net 348013 795 348808
mobile.daiwa.co.jp 286724 8728 295452
ly5066113@ubuntu:~$ awk --version
GNU Awk 3.1.6
Copyright (C) 1989, 1991-2007 Free Software Foundation.

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

davidbeckham921

论坛徽章:: 1

射手座
日期:2014-03-10 14:24:52

14楼 [报告]

发表于 2010-08-17 13:13 |只看该作者

学习……
果然滴水不漏啊

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

15楼 [报告]

发表于 2010-08-17 13:26 |只看该作者

回复 gavinzhm
ly5066113 发表于 2010-08-17 12:46

谢谢，今天到公司拿LINUX试了一下OK了
昨天在家用MAC试的好像有点问题

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 16

IT运维版块每日发帖之星
日期:2015-08-24 06:20:00

综合交流区版块每日发帖之星
日期:2015-10-14 06:20:00

IT运维版块每日发帖之星
日期:2015-10-25 06:20:00

IT运维版块每日发帖之星
日期:2015-11-06 06:20:00

IT运维版块每日发帖之星
日期:2015-12-10 06:20:00

平安夜徽章
日期:2015-12-26 00:06:30

2016猴年福章徽章
日期:2016-02-18 15:30:34

IT运维版块每日发帖之星
日期:2016-04-15 06:20:00

IT运维版块每日发帖之星
日期:2016-05-21 06:20:00

综合交流区版块每日发帖之星
日期:2016-08-16 06:20:00

2015七夕节徽章
日期:2015-08-21 11:06:17

IT运维版块每日发帖之星
日期:2015-08-14 06:20:00

16楼 [报告]

发表于 2010-08-17 13:33 |只看该作者

楼主在JAPAN啊，
薪水是不是比国内高很多啊。相对而言。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

17楼 [报告]

发表于 2010-08-22 11:06 |只看该作者

回复 15# gavinzhm

[root@Dan scripts]# awk 'NR==FNR{if(NF==3){flag=$1;a[flag" "$2]=$3}else{a[flag" "$1]=$2}}NR>FNR{if(NF==3){flag=$1;print flag"    "$2" "a[flag" "$2]" "$3" "a[flag" "$2]+$3}else{printf "          "$1" ";printf a[flag" "$1]!=null?a[flag" "$1]:"0";print " "$2"    "a[flag" "$1]+$2}}' linux.190 linux.191
2010/08/01    mobile.daiwa.co.jp 15715 3412 19127
         qw121.qhit.net 17189 513    17702
         ot13.qhit.net 6514 261    6775
         daiwa365fx.daiwa.co.jp 0 127    127
         fx.daiwa.co.jp 0 50    50
         mobile.daiwa.jp 982 50    1032
         daiwacfd.daiwa.co.jp 0 2    2
2010/08/02    mobile.daiwa.co.jp 259344 8205 267549
         fx.daiwa.co.jp 0 1825    1825
         ot13.qhit.net 187007 1461    188468
         qw121.qhit.net 331485 923    332408
         daiwa365fx.daiwa.co.jp 0 440    440
         mobile.daiwa.jp 1400 148    1548
         daiwacfd.daiwa.co.jp 0 1    1
2010/08/03    mobile.daiwa.co.jp 286724 8728 295452
         fx.daiwa.co.jp 0 1506    1506
         daiwa365fx.daiwa.co.jp 0 1469    1469
         ot13.qhit.net 198367 1427    199794
         qw121.qhit.net 348013 795    348808
         mobile.daiwa.jp 2061 126    2187

我也写了一个~花了我一个小时的时间~不过感觉很爽HOHO~

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

18楼 [报告]

发表于 2010-08-22 22:21 |只看该作者

回复 17# iori809

呆呆兄果然勇猛

我也搞了个把小时，还出的是个残次品。

看看各位老大的思路

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 15

2015年辞旧岁徽章
日期:2015-03-03 16:54:15

双鱼座
日期:2015-01-15 17:29:44

午马
日期:2015-01-06 17:06:51

子鼠
日期:2014-11-24 10:11:13

寅虎
日期:2014-08-18 07:10:55

酉鸡
日期:2014-04-02 12:24:51

双子座
日期:2014-04-02 12:19:44

天秤座
日期:2014-03-17 11:43:36

亥猪
日期:2014-03-13 08:13:51

未羊
日期:2014-03-11 12:42:03

白羊座
日期:2013-11-20 10:15:18

CU大牛徽章
日期:2013-04-17 11:48:45

19楼 [报告]

发表于 2010-08-23 13:33 |只看该作者

本帖最后由 rdcwayx 于 2010-08-23 13:38 编辑

我也写了一个，但要分开几步。感觉还是对awk里的三维数组的控制力不够啊。

# 先调整格式，使得每行都有日期。

awk '/\// {a=$1;print;next}{print a,$0}' file1 > temp1
awk '/\// {a=$1;print;next}{print a,$0}' file2 > temp2

复制代码

#得出结果，顺便将结果按照日期和总计的大小排序（注意这个可以输出 set.daiwa.co.jp的统计，这个域名只出现在file1, 不出现在file2, 但是楼主似乎不需要这个。如果不要求的话，将下面的END部分去掉就可以了。）

awk '
NR==FNR{f=FILENAME;a[$1];b[$1 FS $2 FS f]=$3;c[$1 FS $2];next}
{
s=$1 FS $2 FS f
if (($1 in a)&&(s in b)) print $1,$2,b[s],$3,$3+b[s]
if (!(s in b)) print $1,$2,0,$3,$3
d[$1 FS $2]
}
END { for (i in c) { if (!(i in d)) print i,b[i FS f],"0",b[i FS f] }}
' temp1 temp2|sort -k1.1,1.10 -k5.1,5.10nr >temp3

复制代码

# 再去掉日期部分，只保留和输出第一个日期。

awk '{
if (a[$1])
{printf "\t\t%-20s\t%d\t%d\t%d\n",$2,$3,$4,$5}
else
{a[$1]=$1;printf "%s\t%-20s\t%d\t%d\t%d\n",$1,$2,$3,$4,$5}}' temp3

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

20楼 [报告]

发表于 2010-08-23 14:15 |只看该作者

回复 18# jiwang1980

呵呵~我还差得远呢~
你要常来CU泡的话也可以呵呵

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

123 / 3 页下一页

发新帖

Chinaunix › 论坛 › 程序设计 › Shell › 两个文件求和

北京盛拓优讯信息技术有限公司. 版权所有京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号：11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员联系我们：huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP