免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 2758 | 回复: 13
打印 上一主题 下一主题

[文本处理] 菜鸟求助:awk变量的问题 [复制链接]

论坛徽章:
1
白银圣斗士
日期:2015-11-23 10:45:24
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-09-15 10:18 |只看该作者 |倒序浏览
[ 本帖最后由 helloclei 于 2015-09-15 10:31 编辑 ]

正在看《awk与sed第三版》的电子版,第二章最后有一个关于州排序的问题,如下:
[backcolor=Yellow][root@localhost shell]# cat list
John Daggett, 341 King Road, Plymouth MA
Alice Ford, 22 East Broadway, Richmond VA
Orville Thomas, 11345 Oak Bridge Road, Tulsa OK
Terry Kalkas, 402 Lans Road, Beaver Falls PA
Eric Adams, 20 Post Road, Sudbury MA
Hubert Sims, 328A Brook Road, Roanoke VA
Amy Wilde, 334 Bayshore Pkwy, Mountain View CA
Sal Carpenter, 73 6th Street, Boston MA[/backcolor]
nameState脚本内容如下:
[backcolor=Yellow][root@localhost shell]# cat nameState
s/MA/, Masschusetts/
s/VA/, Virginia/
s/OK/, Oklahoma/
s/PA/, Pennsylvania/
s/CA/, California/[/backcolor]

byState内容如下:
[backcolor=Yellow][root@localhost shell]# cat byState
#!/bin/bash
awk -F, '{
print $4", "$0
}' $*|
sort|
awk -F, '
$1 == LastState {
print "\t" $2
}
$1 != LastState {
LastState = $1
print $1
print "\t" $2
}'[/backcolor]

执行的结果如下:
[backcolor=Yellow][root@localhost shell]# sed -f nameState list| bash byState
California
         Amy Wilde
Masschusetts
         Eric Adams
         John Daggett
         Sal Carpenter
Oklahoma
         Orville Thomas
Pennsylvania
         Terry Kalkas
Virginia
         Alice Ford
         Hubert Sims[/backcolor]

问题:
请问 $1 == LastState  这个判断是怎么定义的?书里说LastState是指上一个记录的州名,但是前面没有定义过这个变量,awk程序怎么会知道它就是上一条记录的州名呢?

论坛徽章:
8
摩羯座
日期:2014-11-26 18:59:452015亚冠之浦和红钻
日期:2015-06-23 19:10:532015亚冠之西悉尼流浪者
日期:2015-08-21 08:40:5815-16赛季CBA联赛之山东
日期:2016-01-31 18:25:0515-16赛季CBA联赛之四川
日期:2016-02-16 16:08:30程序设计版块每日发帖之星
日期:2016-06-29 06:20:002017金鸡报晓
日期:2017-01-10 15:19:5615-16赛季CBA联赛之佛山
日期:2017-02-27 20:41:19
2 [报告]
发表于 2015-09-15 10:31 |只看该作者
亲自测试下吧

论坛徽章:
1
白银圣斗士
日期:2015-11-23 10:45:24
3 [报告]
发表于 2015-09-15 10:33 |只看该作者
回复 2# waker

已经测试过了,结果跟书里的也是一样的,不过就是有点不明白这个 LastState  变量之前没有定义过,awk怎么会知道就是上条记录的州名
   

论坛徽章:
8
摩羯座
日期:2014-11-26 18:59:452015亚冠之浦和红钻
日期:2015-06-23 19:10:532015亚冠之西悉尼流浪者
日期:2015-08-21 08:40:5815-16赛季CBA联赛之山东
日期:2016-01-31 18:25:0515-16赛季CBA联赛之四川
日期:2016-02-16 16:08:30程序设计版块每日发帖之星
日期:2016-06-29 06:20:002017金鸡报晓
日期:2017-01-10 15:19:5615-16赛季CBA联赛之佛山
日期:2017-02-27 20:41:19
4 [报告]
发表于 2015-09-15 10:36 |只看该作者
#!/bin/bash
awk -F, '{
print $4", "$0
}' $*|
sort|
awk -F, '
$1 == LastState {
print "\t" $2
}
$1 != LastState {
LastState = $1
print $1
print "\t" $2
}'

论坛徽章:
8
摩羯座
日期:2014-11-26 18:59:452015亚冠之浦和红钻
日期:2015-06-23 19:10:532015亚冠之西悉尼流浪者
日期:2015-08-21 08:40:5815-16赛季CBA联赛之山东
日期:2016-01-31 18:25:0515-16赛季CBA联赛之四川
日期:2016-02-16 16:08:30程序设计版块每日发帖之星
日期:2016-06-29 06:20:002017金鸡报晓
日期:2017-01-10 15:19:5615-16赛季CBA联赛之佛山
日期:2017-02-27 20:41:19
5 [报告]
发表于 2015-09-15 10:38 |只看该作者
那句红色的和你最初的提问一致吗?

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
6 [报告]
发表于 2015-09-15 10:39 |只看该作者
awk -F, '
    $1 == LastState {
        print "\t" $2
    }
    $1 != LastState {
        LastState = $1
        print $1
        print "\t" $2
    }
'
处理第一行的时候,LastState这个变量没有值,$1 == LastState 为 false,$1 != LastState 为 true 然后进行赋值操作 LastState = $1
处理第二行的时候,LastState有值啦

论坛徽章:
1
白银圣斗士
日期:2015-11-23 10:45:24
7 [报告]
发表于 2015-09-15 10:43 |只看该作者
回复 5# waker

修改过了,现在的是对的。
   

论坛徽章:
1
白银圣斗士
日期:2015-11-23 10:45:24
8 [报告]
发表于 2015-09-15 11:01 |只看该作者
回复 6# Shell_HAT
按照这个解释那我是否可以把这两个条件前后颠倒一下呢?(刚才试了一下,发现结果是有重复的部分,不知道问题出在哪里?)

[root@localhost shell]# cat byState
#!/bin/bash
awk -F, '{
print $4", "$0
}' $*|
sort|
awk -F, '
$1 != LastState {
LastState = $1
print $1
print "\t" $2
}
$1 == LastState {
print "\t" $2
}'
[root@localhost shell]# sed -f nameState list | bash byState
California
         Amy Wilde
         Amy Wilde
Masschusetts
         Eric Adams
         Eric Adams
         John Daggett
         Sal Carpenter
Oklahoma
         Orville Thomas
         Orville Thomas
Pennsylvania
         Terry Kalkas
         Terry Kalkas
Virginia
         Alice Ford
         Alice Ford
         Hubert Sims

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
9 [报告]
发表于 2015-09-15 12:33 |只看该作者
回复 8# helloclei


    顺序是不能颠倒的。不要让shell去执行这个代码,从文本第一行开始处理,自己在纸上写写就明白了。

论坛徽章:
1
白银圣斗士
日期:2015-11-23 10:45:24
10 [报告]
发表于 2015-09-15 14:10 |只看该作者
回复 9# Shell_HAT


    哈哈,谢谢黑哥,在纸上写写果然明白了这个逻辑,不过你说不能用shell是什么意思?因为我这个byState脚本开头就是表明使用shell了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP