免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 4559 | 回复: 22
打印 上一主题 下一主题

探讨寻求awk的高效算法 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-01-05 18:38 |只看该作者 |倒序浏览
情形如下,有两个文件,一个name、一个nick
name内容如下:
黄一
何二
张三
李四
王五
赵六
陈八

nick内容如下:
san        张三
liu        赵六
jiu        吴九
si        李四
qi        田七

现要将nick中第二列值在name中有出现的,取出其第一列值,放入文件result中

我写的是
for x in `cat ./name`
  do
    awk '{if ($2=="'$x'")  print $1}' ./nick >> ./result
  done

但因为name文件中数据非常多,实际多达几万行,执行脚本耗时较长,而nick文件中数据只有几百行,所以我想能不能从nick中取第二列值,然后判断这个值是否存在在name中,这样效率会高点,但不知道有没有这种写法,请高手指教。

我的想法就是
awk '{if ($2 in ./name) print $1}' ./nick >> ./result
当然,我这么写是执行不了的,不知道awk有没有这样的功能,如果有,该怎么写呢?或者还有其他更快的算法来达到目的吗?

论坛徽章:
3
戌狗
日期:2014-09-10 17:07:162015年辞旧岁徽章
日期:2015-03-03 16:54:15wusuopu
日期:2016-06-17 17:43:45
2 [报告]
发表于 2009-01-05 18:42 |只看该作者

回复 #1 geriwolf 的帖子

  1. awk 'NR==FNR{a[$2]=$1}NR>FNR && ($1 in a){print a[$1]}' nick name
复制代码

论坛徽章:
0
3 [报告]
发表于 2009-01-05 18:50 |只看该作者
原帖由 ynchnluiti 于 2009-1-5 18:42 发表
awk 'NR==FNR{a[$2]=$1}NR>FNR && ($1 in a){print a[$1]}' nick name


看得好晕,不过不能运行呀,有错
awk: syntax error near line 1
awk: bailing out near line 1


对了,我要在bash下执行脚本

论坛徽章:
3
戌狗
日期:2014-09-10 17:07:162015年辞旧岁徽章
日期:2015-03-03 16:54:15wusuopu
日期:2016-06-17 17:43:45
4 [报告]
发表于 2009-01-05 18:53 |只看该作者

回复 #3 geriwolf 的帖子

我也是bash.不清楚你的文件内容。
GNU bash, version 3.2.39(
$ cat nick
san        张三
liu        赵六
jiu        吴九
si        李四
qi        田七
$ cat name
黄一
何二
张三
李四
王五
赵六
陈八
$ awk 'NR==FNR{a[$2]=$1}NR>FNR && ($1 in a){print a[$1]}' nick name
san
si
liu

论坛徽章:
3
戌狗
日期:2014-09-10 17:07:162015年辞旧岁徽章
日期:2015-03-03 16:54:15wusuopu
日期:2016-06-17 17:43:45
5 [报告]
发表于 2009-01-05 19:00 |只看该作者

回复 #3 geriwolf 的帖子

如果记录
san        张三
“san”和“张三”包含空格,上面的代码不能得到想要的结果

论坛徽章:
0
6 [报告]
发表于 2009-01-05 20:30 |只看该作者
for x in `cat ./nick`
  do
     y=`echo $x|awk '{print $1}'`
     z=`echo $x|awk '{print $2}'`
    awk '{if ($1=="'$z'")  print '"$y"'}' ./name >> ./result
  done

论坛徽章:
0
7 [报告]
发表于 2009-01-05 21:01 |只看该作者
写到数据库里去查比较好查。。。
呵呵
再不行建个索引,这么点记录应该用不了索引。

论坛徽章:
0
8 [报告]
发表于 2009-01-05 21:20 |只看该作者
原帖由 ynchnluiti 于 2009-1-5 18:42 发表
awk 'NR==FNR{a[$2]=$1}NR>FNR && ($1 in a){print a[$1]}' nick name


温习温习

论坛徽章:
0
9 [报告]
发表于 2009-01-05 21:28 |只看该作者
原帖由 geriwolf 于 2009-1-5 18:50 发表


看得好晕,不过不能运行呀,有错
awk: syntax error near line 1
awk: bailing out near line 1


对了,我要在bash下执行脚本

NR>FNR前面加个";"

论坛徽章:
0
10 [报告]
发表于 2009-01-05 21:42 |只看该作者

回复 #9 jinl 的帖子

为什么,这样有区别么?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP