免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3238 | 回复: 7
打印 上一主题 下一主题

gawk如何检测到输入文件结束? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2008-11-28 13:28 |只看该作者 |倒序浏览
我要用一个awk脚本同时处理两个文件,每个文件使用不同的FS。正确的做法应该是在处理到第一个文件的末尾时给FS赋值,那么怎么才能知道现在是文件的最后一行呢?

论坛徽章:
0
2 [报告]
发表于 2008-11-28 13:38 |只看该作者
用getline

2.简单地读取一条记录

awk的 getline语句用于简单地读取一条记录。如果用户有一个数据记录类似两个物理记录,那么getline将尤其有用。它完成一般字段的分离(设置字段变量$0 FNR NF NR)。如果成功则返回1,失败则返回0(到达文件尾)。如果需简单地读取一个文件,则可以编写以下代码:



例:示例getline的使用



{while(getline==1)

{

#process the inputted fields

}

}

[ 本帖最后由 smallstar001 于 2008-11-28 13:42 编辑 ]

论坛徽章:
8
摩羯座
日期:2014-11-26 18:59:452015亚冠之浦和红钻
日期:2015-06-23 19:10:532015亚冠之西悉尼流浪者
日期:2015-08-21 08:40:5815-16赛季CBA联赛之山东
日期:2016-01-31 18:25:0515-16赛季CBA联赛之四川
日期:2016-02-16 16:08:30程序设计版块每日发帖之星
日期:2016-06-29 06:20:002017金鸡报晓
日期:2017-01-10 15:19:5615-16赛季CBA联赛之佛山
日期:2017-02-27 20:41:19
3 [报告]
发表于 2008-11-28 13:46 |只看该作者
可以比较NR FNR

论坛徽章:
0
4 [报告]
发表于 2008-11-28 14:03 |只看该作者
ARGIND==1
ARGIND==2

NR==FNR
NR>FNR


FILENAME=="xxxx"
FILENAME=="yyyy"

方法多种多样,随便选随便挑,视情况而定

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
5 [报告]
发表于 2008-11-28 14:08 |只看该作者
原帖由 pooronce 于 2008-11-28 14:03 发表
ARGIND==1
ARGIND==2

NR==FNR
NR>FNR


FILENAME=="xxxx"
FILENAME=="yyyy"

方法多种多样,随便选随便挑,视情况而定


这些方法都是检测第二个文件的开始,楼主是想要第一个文件的结束。
一般设置了FS,都是从下一行开始生效的。
因此可以这样:

NR>FNR{if(FNR==1){...;FS=...}}
对第二个文件的第一行做点特殊处理吧。

论坛徽章:
3
戌狗
日期:2014-09-10 17:07:162015年辞旧岁徽章
日期:2015-03-03 16:54:15wusuopu
日期:2016-06-17 17:43:45
6 [报告]
发表于 2008-11-28 15:15 |只看该作者
原帖由 smallstar001 于 2008-11-28 13:38 发表
用getline


直接用getline判断不出来第一个文件的结束。
  1. $ cat a
  2. 1:2:3:4:5:6
  3. 1:2:3:4:5:6
  4. $ cat b
  5. a b c d e f
  6. a b c d e f
  7. $ awk -F: 'BEGIN{FS=":"; while(getline <ARGV[1]) print $2; FS=" "; while(getline < ARGV[2]) print $2; exit}' a b
  8. 2
  9. 2
  10. b
  11. b
复制代码

论坛徽章:
0
7 [报告]
发表于 2008-11-28 18:56 |只看该作者
原帖由 ly5066113 于 2008-11-28 14:08 发表


这些方法都是检测第二个文件的开始,楼主是想要第一个文件的结束。
一般设置了FS,都是从下一行开始生效的。
因此可以这样:

NR>FNR{if(FNR==1){...;FS=...}}
对第二个文件的第一行做点特殊处理吧。

噢,这个时候已经将第一行读入$1,$2 ... 了吧
这个时候还可以重置 $1 $2 ... 吗?

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
8 [报告]
发表于 2008-11-28 19:02 |只看该作者

回复 #7 prc 的帖子

虽然不能重置FS,但可以通过split变相的达到效果。
其实第二个文件不改变FS,直接用split操作所有行也是可以的。
你可以把实际的情况拿出来,大家分析分析。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP