免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 4294 | 回复: 11
打印 上一主题 下一主题

awk的script文件不能按照设计思路进行,请大家帮忙指正 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-10-11 15:25 |只看该作者 |倒序浏览
本帖最后由 x-dongzi 于 2011-10-11 15:45 编辑

我有两个文件,第一个是记录错误的文件,我需要把在第一个文件里面记录了错误的部分在第二个文件中删除,由于这两个文件不是能按照列来分开的,所以我直接用的是$0来表示。
代码如下,执行的时候使用的MSYS和cygwin环境下的gawk -f script.txt cuowu.txt quanbu.txt,结果发现并没有在quanbu文件中把cuowu的给剔除,实在是百思不得其解,因此发上来,让大家帮忙给看看。
看2楼3楼的指导,我是想先建立一个数组a,然后遍历数组a,将a中的元素与quanbu.txt文件中的每行匹配,看是不是可以,如果能匹配成功就不打印这一行。
这样$0~/j/写法有问题吗?
  1. NR==FNR{a[$0]=$0}
  2. NR>FNR{
  3.         printflag=1
  4.         for (j in a)
  5.         {
  6.                 if ($0~/j/)
  7.                 {printflag=0;}
  8.         }
  9.         if (printflag==1)
  10.         {print $0}
  11. }
复制代码
cuowu.txt
  1. 1aaaaaaaaa
  2. 2bbbbbbb
  3. 3ccccccccc
  4. 4eeeeeeeeee
  5. 5fffffffff
复制代码
quanbu.txt
  1. 1aaaaaaaaaaaaaaaaaaaaaaaaaaaa
  2. 2bbbbbbbbbbbbbbbbbbbbbbbbbb
  3. 4ddddddddddddddddddd
  4. 3cccccccccccccccccccccc
  5. 4eeeeeeeeeeeeeeeeeeee
  6. 5ffffffffffffffffffff
  7. aaaaaaaaaaaaaaaaaaaaaaaaaaaa
  8. hasdlfjasdf
  9. asdof8uewqor
  10. asdfasdf
  11. qwer1234234r
  12. zxxfsadfqwe
  13. dsafr23412
  14. dasfwqrqwrqw
  15. zxcvfqwrqwfrasfzvzfwarqwefasf
  16. weqrqwerqwerfwerqwerf
  17. asdfqwerweafasdfasdfasdf
  18. erwqeqwr2135opfy907fuwqe
  19. 3r2p184790udjfvlbnkvchnl
  20. sopfd7219437dncl,zn ,nkl hd
  21. dsfo872134dsidphaslvn. v
  22. dfqwp7oryodafak
  23. 354ef654126r31 fdasrwefsda231
  24. sdaf0897231904,jcxzv ,zxjhihdsfc
  25. 23re2wq65v4f1zsx.gf1asd
  26. dpouapr9u.mzx.cv /awf
  27. dsaliufop72nczxln ,asdjdf
复制代码

论坛徽章:
8
摩羯座
日期:2014-11-26 18:59:452015亚冠之浦和红钻
日期:2015-06-23 19:10:532015亚冠之西悉尼流浪者
日期:2015-08-21 08:40:5815-16赛季CBA联赛之山东
日期:2016-01-31 18:25:0515-16赛季CBA联赛之四川
日期:2016-02-16 16:08:30程序设计版块每日发帖之星
日期:2016-06-29 06:20:002017金鸡报晓
日期:2017-01-10 15:19:5615-16赛季CBA联赛之佛山
日期:2017-02-27 20:41:19
2 [报告]
发表于 2011-10-11 15:28 |只看该作者
$0~/j/    ?
其它没看太懂
或许用grep -Ff也能解决

论坛徽章:
1
摩羯座
日期:2014-12-29 15:59:36
3 [报告]
发表于 2011-10-11 15:30 |只看该作者
$0~j

百撕不得骑姐

评分

参与人数 1信誉积分 -1 收起 理由
expert1 -1 回答的很邪恶啊,注意语言

查看全部评分

论坛徽章:
0
4 [报告]
发表于 2011-10-11 15:44 |只看该作者
啊?我是想先建立一个数组a,然后遍历数组a,将a中的元素与quanbu.txt文件中的每行匹配,看是不是可以,如果能匹配成功就不打印这一行。
这样$0~/j/写法有问题吗?

论坛徽章:
3
CU十二周年纪念徽章
日期:2013-10-24 15:41:34狮子座
日期:2014-03-27 15:44:382015年辞旧岁徽章
日期:2015-03-03 16:54:15
5 [报告]
发表于 2011-10-11 15:45 |只看该作者
$0~j
这到底是神马

论坛徽章:
1
摩羯座
日期:2014-12-29 15:59:36
6 [报告]
发表于 2011-10-11 15:46 |只看该作者
啊?我是想先建立一个数组a,然后遍历数组a,将a中的元素与quanbu.txt文件中的每行匹配,看是不是可以,如果 ...
x-dongzi 发表于 2011-10-11 15:44


~/j/ 是匹配 j 这个字母

论坛徽章:
0
7 [报告]
发表于 2011-10-11 15:52 |只看该作者
不是吧,我在我的系统上试过,是直接把j认为是数组a的下标吧?

比如下面的:
NR==FNR{a[$0]=$0}
END{
        for (j in a)
        {
                print j;
        }
}

这个里面,j就是a的下标,也就是第一个文件的$0,不是字母

论坛徽章:
0
8 [报告]
发表于 2011-10-11 15:55 |只看该作者
回复 6# ziyunfei


不是吧,我在我的系统上试过,是直接把j认为是数组a的下标吧?

比如下面的:
NR==FNR{a[$0]=$0}
END{
        for (j in a)
        {
                print j;
        }
}

这个里面,j就是a的下标,也就是第一个文件的$0,不是字母

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
9 [报告]
发表于 2011-10-11 16:23 |只看该作者
回复 1# x-dongzi

cuowu.txt不太大的话...
$ awk 'NR==FNR{if(NR==1)a=$0;else a=a"|"$0;next}$0!~a{print}' cuowu.txt quanbu.txt

论坛徽章:
0
10 [报告]
发表于 2011-10-11 16:39 |只看该作者
回复  x-dongzi

cuowu.txt不太大的话...
$ awk 'NR==FNR{if(NR==1)a=$0;else a=a"|"$0;next}$0!~a{pri ...
jason680 发表于 2011-10-11 16:23


谢谢,这个看明白了,而且执行也成功,不过我的疑惑就是我的上述代码里面到底哪里错了~~~
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP