免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2308 | 回复: 6
打印 上一主题 下一主题

[文本处理] 求助,我的awk语句错在哪? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-05-12 11:13 |只看该作者 |倒序浏览
有一个文本file1
AAAA,324343,343439
        ,jlklklkj ,334434
        ,09090,jkjkjk
BBBB, 4435454 ,456546
        ,234343434,765765
如果第一列为空,则取上一条记录的第一列。处理后的文本如下:
AAAA,324343,343439
AAAA,jlklklkj ,334434
AAAA ,09090,jkjkjk
BBBB, 4435454 ,456546
BBBB,234343434,765765

我的命令如下:
awk -F, '{if($1>" ") kk=$1  printf("%s %s %s\n",$kk,$2,$3)}' file1
可生成的文本不正确
AAAA,324343,343439 324343  343439   
       ,jlklklkj ,334 jlklklkj 334434434
       ,09090,jkjkjk, 09090  jkjkjk   
BBBB, 4435454 ,456 4435454 456
       ,234343434,765765765 234343434 765765765
请大家帮我分析一下,命令行错在哪?

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
2 [报告]
发表于 2014-05-12 11:28 |只看该作者
回复 1# lcz88990200


1. check it by space pattern

$ awk 'BEGIN{FS=OFS=","}{if($1~/^ *$/)$1=kk;else kk=$1}1' file1
AAAA,324343,343439
AAAA,jlklklkj ,334434
AAAA,09090,jkjkjk
BBBB, 4435454 ,456546
BBBB,234343434,765765


   

论坛徽章:
0
3 [报告]
发表于 2014-05-12 11:42 |只看该作者
谢谢,已能运行

论坛徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之北京
日期:2016-07-06 15:42:0715-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:0915-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56黄金圣斗士
日期:2015-12-02 11:44:35白银圣斗士
日期:2015-11-25 14:32:43白银圣斗士
日期:2015-11-23 12:53:352015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:482015亚冠之首尔
日期:2015-09-01 16:46:052015亚冠之德黑兰石油
日期:2015-08-31 11:39:192015亚冠之萨济拖拉机
日期:2015-08-28 21:06:5315-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53
4 [报告]
发表于 2014-05-12 13:18 |只看该作者
本帖最后由 reyleon 于 2014-05-12 13:18 编辑

if($1>" ")  


这是神马?

论坛徽章:
0
5 [报告]
发表于 2014-05-13 13:03 |只看该作者
awk中引用名称变量时不需要$,譬如print NF,即表示打印NF的值,即该条数据中域的数量。
awk中$表示引用位置变量,譬如print $NF,即表示打印第NF个域的内容,即该条数据中最后一个域的内容。

在本例中,kk的值并非是合法的整型数据,所以awk将其当作0处理,打印了该条数据的全部内容。
AAAA,324343,343439 324343  343439
先是$0,然后$2,然后$3。

论坛徽章:
1
狮子座
日期:2014-04-19 19:35:43
6 [报告]
发表于 2014-05-13 16:55 |只看该作者
大神,你写代码能不能用添加代码文字啊,你这么写看的好吃力。。。回复 2# jason680


   

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
7 [报告]
发表于 2014-05-13 17:05 |只看该作者
回复 6# 驱魔圣手

write your question directly. thank you!!!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP