免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 2739 | 回复: 10

[学习共享] 关于awk FS与RS的疑问 [复制链接]

论坛徽章:
22
处女座
日期:2014-10-11 13:33:292015亚冠之塔什干火车头
日期:2015-07-20 19:59:042015亚冠之塔什干火车头
日期:2015-07-26 10:59:31程序设计版块每日发帖之星
日期:2015-08-05 06:20:00每日论坛发贴之星
日期:2015-08-05 06:20:00程序设计版块每日发帖之星
日期:2015-08-07 06:20:00每日论坛发贴之星
日期:2015-08-07 06:20:002015亚冠之阿尔纳斯尔
日期:2015-10-01 15:23:28白银圣斗士
日期:2015-12-07 17:17:06操作系统版块每日发帖之星
日期:2015-12-27 06:20:002015亚冠之广州富力
日期:2015-07-08 15:48:31程序设计版块每日发帖之星
日期:2015-06-11 22:20:00
发表于 2015-08-02 10:53 |显示全部楼层
在man awk中有这么两段话

If RS is set to the null string, then records are separated by blank lines.  When RS is set to the null string, the newline  character  always  acts  as  a
       field separator, in addition to whatever value FS may have

In the special case that FS is a single space, fields  are separated  by  runs of spaces and/or tabs and/or newlines.


----------------------------------------------------------------------------------------------------------------------
理解1:默认情况下,\n即是FS也是RS
理解2:当RS为\n时,\n就不是FS
理解3:当RS=""时,如果我将FS变为“:”,此时FS为冒号和\n
理解4:当RS=""时,如果不重新定义FS,此时FS应该是不变的

哪些理解是对的,各位朋友说说看。

论坛徽章:
30
申猴
日期:2014-04-10 09:43:532015年亚洲杯纪念徽章
日期:2015-03-20 14:40:232015亚冠之阿尔纳斯尔
日期:2015-06-02 18:59:042015亚冠之阿尔希拉尔
日期:2015-06-30 15:22:572015亚冠之大阪钢巴
日期:2015-07-20 10:44:332015亚冠之阿尔纳斯尔
日期:2015-10-28 14:57:5215-16赛季CBA联赛之新疆
日期:2015-12-25 10:18:45黑曼巴
日期:2016-06-26 21:39:5315-16赛季CBA联赛之山西
日期:2016-07-25 21:54:2715-16赛季CBA联赛之北京
日期:2016-10-27 12:07:2315-16赛季CBA联赛之八一
日期:2017-07-07 16:39:0915-16赛季CBA联赛之吉林
日期:2017-09-04 12:14:43
发表于 2015-08-02 11:54 |显示全部楼层
回复 1# 聆雨淋夜
3是对的


   

论坛徽章:
54
2015亚冠之德黑兰石油
日期:2015-07-07 13:00:1615-16赛季CBA联赛之深圳
日期:2016-03-31 09:03:5415-16赛季CBA联赛之辽宁
日期:2016-05-09 20:38:15程序设计版块每日发帖之星
日期:2016-05-12 06:20:0015-16赛季CBA联赛之四川
日期:2016-05-13 15:19:4715-16赛季CBA联赛之福建
日期:2016-05-15 20:24:34每日论坛发贴之星
日期:2016-05-16 06:20:0015-16赛季CBA联赛之吉林
日期:2016-05-26 11:49:4715-16赛季CBA联赛之广东
日期:2016-05-26 13:49:18极客徽章
日期:2016-12-07 14:05:2315-16赛季CBA联赛之广夏
日期:2016-12-20 17:33:532017金鸡报晓
日期:2017-01-10 15:19:56
发表于 2015-08-02 12:30 |显示全部楼层
本帖最后由 haooooaaa 于 2015-08-02 13:20 编辑

个人感觉 4 正确
  1. $ more a
  2. 1: 2
  3. 3: 4
  4. $ awk -vRS= '{print $1,$3}' a
  5. 1: 3:
复制代码
3的话, 如果设置RS='', FS不设置, \n可以分隔, 设置了就不行了.
  1. $ more a
  2. 1: 2
  3. 3: 4

  4. $ awk -vRS= '{printf "%s|%s|%s|%s|  %s",$1,$2,$3,$4,NF}' a
  5. 1:|2|3:|4|  4

  6. $ awk -vRS= -F "[ :]" '{printf "%s|%s|%s|%s|  %s",$1,$2,$3,$4,NF}' a
  7. 1||2
  8. 3||  5

  9. $ awk -vRS= -F "[ ]" '{printf "%s|%s|%s|%s|  %s",$1,$2,$3,$4,NF}' a
  10. 1:|2
  11. 3:|4||  3
复制代码
对于2, 应该是 RS 优先级更高?
  1. $ echo "a-b-c-d" | awk -F '-' '{print $2,$3}'
  2. b c

  3. $ echo "a-b-c-d" | awk -F '-' -vRS='-' '{print $2,$3}'





  4. $ echo "a-b-c-d" | awk -F '-' -vRS='-' '{print $1}'
  5. a
  6. b
  7. c
  8. d

  9. $ echo "a-b-c-d" | awk -F '-' -vRS='-' '{print FS}'
  10. -
  11. -
  12. -
  13. -
复制代码

论坛徽章:
22
处女座
日期:2014-10-11 13:33:292015亚冠之塔什干火车头
日期:2015-07-20 19:59:042015亚冠之塔什干火车头
日期:2015-07-26 10:59:31程序设计版块每日发帖之星
日期:2015-08-05 06:20:00每日论坛发贴之星
日期:2015-08-05 06:20:00程序设计版块每日发帖之星
日期:2015-08-07 06:20:00每日论坛发贴之星
日期:2015-08-07 06:20:002015亚冠之阿尔纳斯尔
日期:2015-10-01 15:23:28白银圣斗士
日期:2015-12-07 17:17:06操作系统版块每日发帖之星
日期:2015-12-27 06:20:002015亚冠之广州富力
日期:2015-07-08 15:48:31程序设计版块每日发帖之星
日期:2015-06-11 22:20:00
发表于 2015-08-02 13:40 |显示全部楼层
发帖之前我以为3、4都是正确的,1和2是互斥的关系,其中一个是正确的

论坛徽章:
22
处女座
日期:2014-10-11 13:33:292015亚冠之塔什干火车头
日期:2015-07-20 19:59:042015亚冠之塔什干火车头
日期:2015-07-26 10:59:31程序设计版块每日发帖之星
日期:2015-08-05 06:20:00每日论坛发贴之星
日期:2015-08-05 06:20:00程序设计版块每日发帖之星
日期:2015-08-07 06:20:00每日论坛发贴之星
日期:2015-08-07 06:20:002015亚冠之阿尔纳斯尔
日期:2015-10-01 15:23:28白银圣斗士
日期:2015-12-07 17:17:06操作系统版块每日发帖之星
日期:2015-12-27 06:20:002015亚冠之广州富力
日期:2015-07-08 15:48:31程序设计版块每日发帖之星
日期:2015-06-11 22:20:00
发表于 2015-08-02 13:41 |显示全部楼层
回复 3# haooooaaa
感谢你的回答,还得慢慢揣摩。



   

论坛徽章:
5
白羊座
日期:2014-10-28 11:23:27水瓶座
日期:2015-01-20 10:19:022015亚冠之柏斯波利斯
日期:2015-07-11 18:17:2015-16赛季CBA联赛之同曦
日期:2015-12-23 12:38:582016猴年福章徽章
日期:2016-02-18 15:30:34
发表于 2015-08-02 21:57 |显示全部楼层
本帖最后由 klainogn 于 2015-08-02 21:59 编辑

回复 3# haooooaaa
对于情况3的理解应该是正确的,你举出的例子中FS的设置方式比较特殊,用了正则的方式,如果使用的是普通字符方式,FS是会自动把"\n"做为其中一种域分割符的
  1. $ awk -vRS= -F ":" '{printf "%s|%s|%s|%s|  %s\n",$1,$2,$3,$4,NF}' a
  2. 1|2|3|4|  4
复制代码

论坛徽章:
22
处女座
日期:2014-10-11 13:33:292015亚冠之塔什干火车头
日期:2015-07-20 19:59:042015亚冠之塔什干火车头
日期:2015-07-26 10:59:31程序设计版块每日发帖之星
日期:2015-08-05 06:20:00每日论坛发贴之星
日期:2015-08-05 06:20:00程序设计版块每日发帖之星
日期:2015-08-07 06:20:00每日论坛发贴之星
日期:2015-08-07 06:20:002015亚冠之阿尔纳斯尔
日期:2015-10-01 15:23:28白银圣斗士
日期:2015-12-07 17:17:06操作系统版块每日发帖之星
日期:2015-12-27 06:20:002015亚冠之广州富力
日期:2015-07-08 15:48:31程序设计版块每日发帖之星
日期:2015-06-11 22:20:00
发表于 2015-08-04 14:07 |显示全部楼层
还是没有最终答案。

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
发表于 2015-08-04 15:07 |显示全部楼层
回复 1# 聆雨淋夜


1、3、4 是对的

FS 有4种情况
1: 空字符
2: 一个空格(默认情况)
3: 单个字符
4: 正则表达式

当 RS="" 时,如果 FS 是“3: 单个字符”,会将 \n 加入到 FS 中

论坛徽章:
22
处女座
日期:2014-10-11 13:33:292015亚冠之塔什干火车头
日期:2015-07-20 19:59:042015亚冠之塔什干火车头
日期:2015-07-26 10:59:31程序设计版块每日发帖之星
日期:2015-08-05 06:20:00每日论坛发贴之星
日期:2015-08-05 06:20:00程序设计版块每日发帖之星
日期:2015-08-07 06:20:00每日论坛发贴之星
日期:2015-08-07 06:20:002015亚冠之阿尔纳斯尔
日期:2015-10-01 15:23:28白银圣斗士
日期:2015-12-07 17:17:06操作系统版块每日发帖之星
日期:2015-12-27 06:20:002015亚冠之广州富力
日期:2015-07-08 15:48:31程序设计版块每日发帖之星
日期:2015-06-11 22:20:00
发表于 2015-08-04 15:11 |显示全部楼层
本帖最后由 聆雨淋夜 于 2015-08-04 15:11 编辑

回复 8# ly5066113
当RS=""  如果FS不是单个字符(正则表达式),那\n就不属于FS了是吧


   

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
发表于 2015-08-04 15:22 |显示全部楼层
回复 9# 聆雨淋夜


当 FS 为空字符或者正则表达式的时候,\n 就不属于 FS
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP