论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2013-01-16 11:46 |只看该作者 |正序浏览

本帖最后由 nxzwt 于 2013-01-16 19:24 编辑

有2个文件a和b
a的内容如下，有100多万行
1.1.1.10    20
1.1.1.34    25
2.2.2.100 30
3.3.3.20    40
b的内容如下，有1万多行
1.1.1.0 1.1.1.31    财务一部
1.1.1.32 1.1.1.63 财务二部
2.2.2.0 2.2.2.127 技术部
3.3.3.0 3.3.3.63    人事部

要求从a里面读出数据，和b比较后输出成
1.1.1.10 20 财务一部
1.1.1.34 25 财务二部
2.2.2.100 30 技术部
3.3.3.20 40 人事部

这个用awk该怎么做？请高手指点，谢谢！！

文库|博客

seesea2517

富足长乐

论坛徽章:: 93

20楼 [报告]

发表于 2013-01-18 09:14 |只看该作者

回复 15# jils2013

有点类似，还是区别很大呢。因为lz说a文件很大，所以我没敢把a文件全部读进内存，而是把b文件读进内存做检索。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

yestreenstars

富甲一方

论坛徽章:: 32

19楼 [报告]

发表于 2013-01-18 09:10 |只看该作者

回复 16# Shell_HAT

可是我看出楼主的意思了，不然他就没必要写两个IP地址了，直接写个网络地址就好了~

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

seesea2517

富足长乐

论坛徽章:: 93

18楼 [报告]

发表于 2013-01-18 09:09 |只看该作者

回复 16# Shell_HAT

原来是这样，一个小小的帖子居然也有项目的影子，lz 是做产品或是策划的吧，哈哈。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

jils2013

稍有积蓄

论坛徽章:: 0

17楼 [报告]

发表于 2013-01-18 08:56 |只看该作者

回复 16# Shell_HAT
需求变更。。。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

Shell_HAT

版主

论坛徽章:: 33

16楼 [报告]

发表于 2013-01-17 23:27 |只看该作者

回复 13# seesea2517

我写代码的时候楼主顶楼数据不是这个样子滴，现在的样子是后来改的

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

jils2013

稍有积蓄

论坛徽章:: 0

15楼 [报告]

发表于 2013-01-17 16:22 |只看该作者

本帖最后由 jils2013 于 2013-01-17 16:25 编辑

和楼上的部分处理逻辑类似

[root@localhost ~]# cat a
1.1.1.10 20
1.1.1.34 25
2.2.2.100 30
3.3.3.20 40
[root@localhost ~]# cat b
1.1.1.0 1.1.1.31 C1
1.1.1.32 1.1.1.63 C2
2.2.2.0 2.2.2.127 T
3.3.3.0 3.3.3.63 R
[root@localhost ~]# awk 'function gi(str)
> {split(str,sa,".");i=sa[1]*255^3+sa[2]*255^2+sa[3]*255+sa[4];return i}
> BEGIN\
> {while(getline <"a"){i=gi($1);a[i]=$2;c[i]=$1;}}
> {b=gi($1);e=gi($2);for(dep=b;dep<=e;dep++){if(dep in a)print c[dep],a[dep],$3}}' b
1.1.1.10 20 C1
1.1.1.34 25 C2
2.2.2.100 30 T
3.3.3.20 40 R
[root@localhost ~]#