免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: bulletmarquis
打印 上一主题 下一主题

[文本处理] (21楼又有新问题,请大神关注)getline为何取不到最后一行 [复制链接]

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
11 [报告]
发表于 2014-09-29 11:04 |只看该作者
本帖最后由 jason680 于 2014-09-29 11:09 编辑

回复 1# bulletmarquis

a|b c|d e|f g

1. 1st time, awk read first data and assign to $0
  awk get "a" to assign $0
A: getline
   get next data "b" to assign to $0
B: getline v
   get next data "b" to assign to v

2. 2nd time, awk read next data and assign to $0
  awk get "c" to assign $0
A: getline
   get next data "d" to assign to $0
B: getline v
   get next data "d" to assign to v

3. 3rd time, awk read next data and assign to $0
  awk get "e" to assign $0
A: getline
   get next data "f" to assign to $0
B: getline v
   get next data "f" to assign to v

3. 4th time, awk read next data and assign to $0
  awk get "g" to assign $0
A: getline
   There is NO data to get and assign to $0
   Note: $0 keep the original data "g"
B: getline v
   There is NO data to get and assign to v
   Note: v keep the original data "f"

Don't forget one thing
程序是
依照写出来(的code),跑出结果
不是依照你想出来的,得到结果

   

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
12 [报告]
发表于 2014-09-29 11:08 |只看该作者
回复 10# bulletmarquis


暂时未找到这个问题的原因,RS 设置为正则表达式时,使用 getline 注意一下就好,不用 getline ,其他的是正常的:
  1. echo "a+b*c+d*e+f*g+h"|awk 'BEGIN{RS="[*+]"}1'
复制代码

论坛徽章:
2
摩羯座
日期:2014-11-03 15:28:56卯兔
日期:2015-01-04 17:20:51
13 [报告]
发表于 2014-09-29 11:08 |只看该作者
回复 11# jason680


    恩,我能理解getline和getline v两种方式打印的最后一个字符不一样

   就是不明白为啥
There is NO data to get

论坛徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之北京
日期:2016-07-06 15:42:0715-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:0915-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56黄金圣斗士
日期:2015-12-02 11:44:35白银圣斗士
日期:2015-11-25 14:32:43白银圣斗士
日期:2015-11-23 12:53:352015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:482015亚冠之首尔
日期:2015-09-01 16:46:052015亚冠之德黑兰石油
日期:2015-08-31 11:39:192015亚冠之萨济拖拉机
日期:2015-08-28 21:06:5315-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53
14 [报告]
发表于 2014-09-29 11:11 |只看该作者
回复 11# jason680


   

3. 4th time, awk read next data and assign to $0
  awk get "g" to assign $0
A: getline
   There is NO data to get and assign to $0
   Note: $0 keep the original data "g"
B: getline v
   There is NO data to get and assign to v
   Note: v keep the original data "f"


---
  为什么 就 NO data 了 ? 最后那个 h 呢?

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
15 [报告]
发表于 2014-09-29 11:12 |只看该作者
回复 9# ly5066113


    Tim 老师说得有理。

    另外,好像用[]才有问题。

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
16 [报告]
发表于 2014-09-29 11:13 |只看该作者
回复 13# bulletmarquis

Sorry, I got the some mistake.

It seems have some bug in awk with getline function
   

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
17 [报告]
发表于 2014-09-29 11:16 |只看该作者
回复 15# blackold


和 [ ] 无关,这样设置 RS=' |\\|' ,也一样有问题。

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
18 [报告]
发表于 2014-09-29 11:21 |只看该作者
本帖最后由 jason680 于 2014-09-29 11:21 编辑

@ly5066113 @ly5066113 @reyleon

It seems have some bug in awk

$ echo "a|b c|d e|f g|h" | awk -vRS='[ |]' '{print NF,NR,$0;getline;print}'
1 1 a
b
1 3 c
d
1 5 e
f
1 7 g
g

$ echo "a/b c/d e/f g/h" | awk -vRS='[ /]' '{print NF,NR,$0;getline;print}'
1 1 a
b
1 3 c
d
1 5 e
f
1 7 g
h

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
19 [报告]
发表于 2014-09-29 11:24 |只看该作者
回复 17# ly5066113


    嗯,刚才又试了,' |\\|' 确实也有问题。

    看起来是在[]中使用元字符或者有|都有问题。

使用命名类正常:
  1. $ echo "a|b c|d e|f g|h" | awk -vRS='[[:punct:][:space:]]' '{printf $0"  ";getline;print}'
  2. a  b
  3. c  d
  4. e  f
  5. g  h
复制代码

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
20 [报告]
发表于 2014-09-29 11:25 |只看该作者
应该是awk正则引擎出了问题,先列为悬案吧。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP