免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 4269 | 回复: 11
打印 上一主题 下一主题

[文本处理] 请教一个awk的问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-10-24 16:00 |只看该作者 |倒序浏览
数据文件如下:
[id=123] key=a
[id=456] key=b
[id=789] key=c
[id=123] value=aa
[id=456] value=bb

如果我想通过a来找到aa,应该如何做?

ps:我的思路是找到a的那一行,取出“id=123”,然后作为接下来查找的变量,这样就能找到“[id=123] value=aa”这一行,但是不知道该怎样保存中间变量并用于接下来的查找

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
2 [报告]
发表于 2013-10-24 16:06 |只看该作者
  1. [root@localhost ~]# cat i
  2. [id=123] key=a
  3. [id=456] key=b
  4. [id=789] key=c
  5. [id=123] value=aa
  6. [id=456] value=bb
  7. [root@localhost ~]# awk '/key=a/{s=$1;next}$1==s{print gensub(/.*=(.*)/,"\\1",$2)}' i
  8. aa
  9. [root@localhost ~]#
复制代码

论坛徽章:
36
摩羯座
日期:2013-09-23 16:37:312015年亚洲杯之沙特阿拉伯
日期:2015-04-14 09:10:172015亚冠之柏太阳神
日期:2015-06-25 08:48:212015亚冠之武里南联
日期:2015-07-28 09:01:082015亚冠之莱赫维亚
日期:2015-07-28 15:44:172015亚冠之柏斯波利斯
日期:2015-09-06 14:08:52白银圣斗士
日期:2015-11-25 17:06:2815-16赛季CBA联赛之吉林
日期:2015-12-09 16:59:072016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之辽宁
日期:2016-04-14 09:29:04luobin
日期:2016-06-17 17:46:3615-16赛季CBA联赛之天津
日期:2016-08-16 14:11:01
3 [报告]
发表于 2013-10-24 16:12 |只看该作者
本帖最后由 LikeLx 于 2013-10-24 16:14 编辑

awk -F "[][]+" '/key=a/{a[$2];next}{if($2 in a) print substr($3,8,2)}'  不知道符合要求不?

论坛徽章:
0
4 [报告]
发表于 2013-10-24 17:15 |只看该作者
本帖最后由 yaozhibing41001 于 2013-10-24 17:17 编辑

回复 1# jseanjj
  1. [root@localhost ~]# cat a
  2. [id=123] key=a
  3. [id=456] key=b
  4. [id=789] key=c
  5. [id=123] value=aa
  6. [id=456] value=bb
  7. [root@localhost ~]# awk -vFS='[]=[]' -vkey=a '$NF==key{key2=$3}$3==key2 && $5 != key{print $0}' a        
  8. [id=123] value=aa
  9. [root@localhost ~]# awk -vFS='[]=[]' -vkey=b '$NF==key{key2=$3}$3==key2 && $5 != key{print $0}' a
  10. [id=456] value=bb
复制代码

论坛徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之北京
日期:2016-07-06 15:42:0715-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:0915-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56黄金圣斗士
日期:2015-12-02 11:44:35白银圣斗士
日期:2015-11-25 14:32:43白银圣斗士
日期:2015-11-23 12:53:352015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:482015亚冠之首尔
日期:2015-09-01 16:46:052015亚冠之德黑兰石油
日期:2015-08-31 11:39:192015亚冠之萨济拖拉机
日期:2015-08-28 21:06:5315-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53
5 [报告]
发表于 2013-10-24 18:00 |只看该作者
我觉得楼主应该说一下你想怎么触发这个条件!

论坛徽章:
0
6 [报告]
发表于 2013-10-24 19:59 |只看该作者
本帖最后由 quanzhou722 于 2013-10-24 20:30 编辑

楼上的几位都可能有问题,都是顺序执行的,谁能保证value 一定在key的下面?

这才对
grep -Po '(?<=id=).*(?=] key=a)' a.txt |xargs -i  grep -Po '(?<=id={}] value=).*' a.txt
grep -Po '(?<=id=).*(?=] key=a)' a.txt |xargs -i  awk -F '=' '/id={}/&&/value/ {print $3}' a.txt

论坛徽章:
29
程序设计版块每日发帖之星
日期:2016-02-29 06:20:0015-16赛季CBA联赛之天津
日期:2016-08-10 10:33:1115-16赛季CBA联赛之深圳
日期:2016-08-17 15:07:2015-16赛季CBA联赛之佛山
日期:2016-11-07 11:33:5015-16赛季CBA联赛之广夏
日期:2016-11-15 09:13:31CU十四周年纪念徽章
日期:2016-11-24 14:12:25极客徽章
日期:2016-12-07 14:03:4015-16赛季CBA联赛之深圳
日期:2016-12-07 17:15:2715-16赛季CBA联赛之北京
日期:2016-12-22 09:30:0115-16赛季CBA联赛之深圳
日期:2016-12-22 10:49:2115-16赛季CBA联赛之山西
日期:2017-02-10 09:05:3215-16赛季CBA联赛之同曦
日期:2017-02-27 14:19:08
7 [报告]
发表于 2013-10-24 21:01 |只看该作者
awk -F"=" '/key/{a[$3]=+$2;}/value/{b[+$2]=$3}END{print b[a["a"]]}'  file

论坛徽章:
0
8 [报告]
发表于 2013-10-24 21:47 |只看该作者
回复 2# yestreenstars


     大神,你好。我刚学shell不久,刚才看了你给的代码很强大,

gensub(/.*=(.*)/,"\\1",$2)  可否指点一下 \\1 是什么意思?

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
9 [报告]
发表于 2013-10-24 22:02 |只看该作者
回复 8# wang390750
表示前面的正则表达式里第一对小括号匹配到的内容~

   

论坛徽章:
15
2015年辞旧岁徽章
日期:2015-03-03 16:54:15双鱼座
日期:2015-01-15 17:29:44午马
日期:2015-01-06 17:06:51子鼠
日期:2014-11-24 10:11:13寅虎
日期:2014-08-18 07:10:55酉鸡
日期:2014-04-02 12:24:51双子座
日期:2014-04-02 12:19:44天秤座
日期:2014-03-17 11:43:36亥猪
日期:2014-03-13 08:13:51未羊
日期:2014-03-11 12:42:03白羊座
日期:2013-11-20 10:15:18CU大牛徽章
日期:2013-04-17 11:48:45
10 [报告]
发表于 2013-10-25 07:40 |只看该作者
  1. awk -v str="a" 'BEGIN{str="key=" str}/key/{if ($2==str) key=$1}/value/{b[$1]=$2}END{print b[key]}' infile

  2. value=aa
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP