免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3303 | 回复: 16

[文本处理] 又一个getline问题~~ [复制链接]

论坛徽章:
2
摩羯座
日期:2014-11-03 15:28:56卯兔
日期:2015-01-04 17:20:51
发表于 2014-09-29 17:40 |显示全部楼层
问题果然不能在楼中楼问,太容易被忽略掉,还是另开新帖
  1. 当RS为默认的换行符时,用getline打印的时候,输出最后是没有空行的
  2. echo "a
  3. b
  4. c
  5. d"|awk '{printf $0"  ";getline;print $0}'
  6. a  b
  7. c  d
  8. 将RS改掉以后,输出会多出一个空行来
  9. echo "a b c d"|awk -vRS=' ' '{printf $0"  ";getline;print $0}'
  10. a  b
  11. c  d

  12. 如果在上面这个这个例子的输入中增加一个RT,输出又多出来2行
  13. echo "a b c d "|awk -vRS=' ' '{printf $0"  ";getline;print $0}'
  14. a  b
  15. c  d

  16.   

  17. 这个看起来是3个空行,但是第一和第三个是真正的空行,中间那行是两个空格,这两个空格是哪儿来的?

  18. 再把RS改成别的值
  19. echo "a_b_c_d_"|awk -vRS='_' '{printf $0"  ";getline;print $0}'
  20. a  b
  21. c  d

  22.   

  23. 情况与上面一样
  24. 我再追加一个空格
  25. echo "a_b_c_d_ "|awk -vRS='_' '{printf $0"  ";getline;print $0}'
  26. a  b
  27. c  d

  28.    

  29. 这次尾部的三行里,第一行是一个空格,很明显是$0,第二行是三个空格,这三个空格又是哪儿来的呢?
复制代码

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
发表于 2014-09-29 17:50 |显示全部楼层
回复 1# bulletmarquis

$ echo "a b c d "|awk -vRS=' ' '{printf "<"$0"> ";getline;print "<"$0">"}'
<a> <b>
<c> <d>
<
> <
>

$ echo "a b c d"|awk -vRS=' ' '{printf "<"$0"> ";getline;print "<"$0">"}'
<a> <b>
<c> <d
>

   

论坛徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之北京
日期:2016-07-06 15:42:0715-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:0915-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56黄金圣斗士
日期:2015-12-02 11:44:35白银圣斗士
日期:2015-11-25 14:32:43白银圣斗士
日期:2015-11-23 12:53:352015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:482015亚冠之首尔
日期:2015-09-01 16:46:052015亚冠之德黑兰石油
日期:2015-08-31 11:39:192015亚冠之萨济拖拉机
日期:2015-08-28 21:06:5315-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53
发表于 2014-09-29 18:08 |显示全部楼层
这个不是问题吧, 去看你的原帖.... echo 后面有一个newline 呐
  1. [root@localhost ~]# echo "a b c d"|awk -vRS=' ' '{printf $0"  ";getline;print $0}'   
  2. a  b
  3. c  d

  4. [root@localhost ~]# echo -n "a b c d"|awk -vRS=' ' '{printf $0"  ";getline;print $0}'
  5. a  b
  6. c  d
  7. [root@localhost ~]#
复制代码

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
发表于 2014-09-29 18:41 |显示全部楼层
赚积分的来了。

论坛徽章:
2
摩羯座
日期:2014-11-03 15:28:56卯兔
日期:2015-01-04 17:20:51
发表于 2014-09-29 18:48 |显示全部楼层
回复 3# reyleon


    echo的newline我能理解,我是奇怪那几个空格是怎么生成的

论坛徽章:
2
摩羯座
日期:2014-11-03 15:28:56卯兔
日期:2015-01-04 17:20:51
发表于 2014-09-29 18:49 |显示全部楼层
本帖最后由 bulletmarquis 于 2014-09-29 18:50 编辑

回复 4# blackold


    嘘,我是想激发论坛的活性嘛{:2_169:}

    最近看论坛大都是直接来求代码的,少有细致分析~~

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
发表于 2014-09-29 18:57 |显示全部楼层
回复 6# bulletmarquis


    出发点是好的。


在原贴已经说清楚了吧。
  1. $ echo "a b c d"|awk -vRS=' ' '{printf $0"==>";printf getline;print $0}'|nl -ba
  2.      1  a==>1b
  3.      2  c==>1d
  4.      3
复制代码

  1. $ echo "a b c d "|awk -vRS=' ' '{printf $0"==>";printf getline;print $0}'|nl -ba
  2.      1  a==>1b
  3.      2  c==>1d
  4.      3
  5.      4  ==>0
  6.      5
复制代码
没有 newline:
  1. $ echo -n "a b c d"|awk -vRS=' ' '{printf $0"==>";printf getline;print $0}'|nl -ba
  2.      1  a==>1b
  3.      2  c==>1d
复制代码
  1. $ echo -n "a b c d "|awk -vRS=' ' '{printf $0"==>";printf getline;print $0}'|nl -ba
  2.      1  a==>1b
  3.      2  c==>1d
复制代码
这样写清楚了吧。




论坛徽章:
2
摩羯座
日期:2014-11-03 15:28:56卯兔
日期:2015-01-04 17:20:51
发表于 2014-09-30 09:20 |显示全部楼层
回复 7# blackold


    我的疑问不在newline上

   而是如果RS不为空格,那我在最后一行后面加上一个分隔符和一个空格

   如果空格所在的NR是奇数,这个时候取getline的时候,会取到3个空格,这三个空格是怎么弄出来的?

   具体可以看1楼最后两个例子

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
发表于 2014-09-30 09:26 |显示全部楼层
回复 8# bulletmarquis


最后一个字段包含换行符。
a 就是你例子中的 $0
  1. awk 'BEGIN{a=" \n";printf a"  ";print a}'
复制代码

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
发表于 2014-09-30 09:28 |显示全部楼层
本帖最后由 blackold 于 2014-09-30 09:32 编辑

回复 8# bulletmarquis


    哪三个空格?
  1. $ echo "a_b_c_d_"|awk -vRS='_' '{printf $0"  ";getline;print $0}'|nl -ba
  2.      1  a  b
  3.      2  c  d
  4.      3
  5.      4
  6.      5
复制代码

  1. $ echo "a_b_c_d_ "|awk -vRS='_' '{printf $0"  ";getline;print $0}'|nl -ba
  2.      1  a  b
  3.      2  c  d
  4.      3  [
  5.      4  **[
  6.      5
复制代码
注: [ 为输出的空格, ** 这 printf $0"  " 双引号中的空格。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP