免费注册	查看新帖 \|


平台论坛博客文库

› 论坛 › 程序设计 › Shell › 关于awk的一个问题

12 / 2 页下一页

最近访问板块

发新帖

查看: 5053 | 回复: 15

上一主题

下一主题

关于awk的一个问题 [复制链接]

论坛徽章:: 0

电梯直达

跳转到指定楼层

1楼 [收藏(0)] [报告]

发表于 2007-05-21 11:00 |只看该作者 |倒序浏览

一个文件如下：

time1:111111111 - 20070521
time2:<TEST><ID>20070521</ID>
abc
efg
</TEST>
time3:222222222
time4:333333333
time5:<TEST><ID>20070521</ID>
aaa
bbb
</TEST>
time6:444444444
time7:<TEST><ID>20070520</ID>
ccc
ddd
</TEST>
time8:444444444

复制代码

现在的要求是要得到：

time1:111111111 - 20070521
time2:<TEST><ID>20070521</ID>
abc
efg
</TEST>
time5:<TEST><ID>20070521</ID>
aaa
bbb
</TEST>

复制代码

即取得包含20070521的行，如果该行是个xml格式的字符串，则把余下的行都取出。

我的思路如下，先取得包含在<TEST>...</TEST>的段落，然后在判断改段落是否包含20070531
但是我只知道怎么取得<TEST>...</TEST>的段落.

/<TEST>/, /<\/TEST>/{
print
}

复制代码

文库|博客

论坛徽章:: 8

摩羯座
日期:2014-11-26 18:59:45

2015亚冠之浦和红钻
日期:2015-06-23 19:10:53

2015亚冠之西悉尼流浪者
日期:2015-08-21 08:40:58

15-16赛季CBA联赛之山东
日期:2016-01-31 18:25:05

15-16赛季CBA联赛之四川
日期:2016-02-16 16:08:30

程序设计版块每日发帖之星
日期:2016-06-29 06:20:00

2017金鸡报晓
日期:2017-01-10 15:19:56

15-16赛季CBA联赛之佛山
日期:2017-02-27 20:41:19

2楼 [报告]

发表于 2007-05-21 11:13 |只看该作者

awk 'BEGIN{RS="time"}
/20070521/{printf RS$0}' urfile

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

3楼 [报告]

发表于 2007-05-21 11:20 |只看该作者

多谢waker 的指点，不过time是系统时间，并不是固定的字符

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 8

摩羯座
日期:2014-11-26 18:59:45

2015亚冠之浦和红钻
日期:2015-06-23 19:10:53

2015亚冠之西悉尼流浪者
日期:2015-08-21 08:40:58

15-16赛季CBA联赛之山东
日期:2016-01-31 18:25:05

15-16赛季CBA联赛之四川
日期:2016-02-16 16:08:30

程序设计版块每日发帖之星
日期:2016-06-29 06:20:00

2017金鸡报晓
日期:2017-01-10 15:19:56

15-16赛季CBA联赛之佛山
日期:2017-02-27 20:41:19

4楼 [报告]

发表于 2007-05-21 11:30 |只看该作者

不是固定字符就用regex，都是一样一样的啊

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

5楼 [报告]

发表于 2007-05-21 13:27 |只看该作者

原帖由 waker 于 2007-5-21 11:30 发表
不是固定字符就用regex，都是一样一样的啊

regex？你的意思是RS可以用正则表达式？

'BEGIN{RS=/[0-9]*:[0-9]*:[0-9]*/} /20070521/ {printf $0}'

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 8

摩羯座
日期:2014-11-26 18:59:45

2015亚冠之浦和红钻
日期:2015-06-23 19:10:53

2015亚冠之西悉尼流浪者
日期:2015-08-21 08:40:58

15-16赛季CBA联赛之山东
日期:2016-01-31 18:25:05

15-16赛季CBA联赛之四川
日期:2016-02-16 16:08:30

程序设计版块每日发帖之星
日期:2016-06-29 06:20:00

2017金鸡报晓
日期:2017-01-10 15:19:56

15-16赛季CBA联赛之佛山
日期:2017-02-27 20:41:19

6楼 [报告]

发表于 2007-05-21 13:34 |只看该作者

awk 'BEGIN{RS="[^\n]*:"}
/20070521/{printf a$0}
{a=RT}' urfile

复制代码

ps. I use gawk

[ 本帖最后由 waker 于 2007-5-21 13:36 编辑 ]

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

7楼 [报告]

发表于 2007-05-21 14:06 |只看该作者

awk: (FILENAME=talog FNR=131) fatal: not enough arguments to satisfy format string

这个是什么问题？一行的字符太多？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 8

摩羯座
日期:2014-11-26 18:59:45

2015亚冠之浦和红钻
日期:2015-06-23 19:10:53

2015亚冠之西悉尼流浪者
日期:2015-08-21 08:40:58

15-16赛季CBA联赛之山东
日期:2016-01-31 18:25:05

15-16赛季CBA联赛之四川
日期:2016-02-16 16:08:30

程序设计版块每日发帖之星
日期:2016-06-29 06:20:00

2017金鸡报晓
日期:2017-01-10 15:19:56

15-16赛季CBA联赛之佛山
日期:2017-02-27 20:41:19

8楼 [报告]

发表于 2007-05-21 14:14 |只看该作者

printf函数格式用错了，少了参数

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

9楼 [报告]

发表于 2007-05-21 14:54 |只看该作者

原帖由 waker 于 2007-5-21 14:14 发表
printf函数格式用错了，少了参数

格式用错?

gawk 'BEGIN{RS="[^\n]*:"} /136816189/ {printf a$0} {a=RT}' soapmsg

复制代码

跟你的例子一样啊

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 8

摩羯座
日期:2014-11-26 18:59:45

2015亚冠之浦和红钻
日期:2015-06-23 19:10:53

2015亚冠之西悉尼流浪者
日期:2015-08-21 08:40:58

15-16赛季CBA联赛之山东
日期:2016-01-31 18:25:05

15-16赛季CBA联赛之四川
日期:2016-02-16 16:08:30

程序设计版块每日发帖之星
日期:2016-06-29 06:20:00

2017金鸡报晓
日期:2017-01-10 15:19:56

15-16赛季CBA联赛之佛山
日期:2017-02-27 20:41:19

10楼 [报告]

发表于 2007-05-21 15:00 |只看该作者

关键是我们看不到你的数据，不知道[^\n]*:在你那里匹配什么
举个例子吧
[waker@proxy ~]$ awk 'BEGIN{a="123";printf a}'
123[waker@proxy ~]$ awk 'BEGIN{a="123%f";printf a}'
awk: cmd. line:1: fatal: not enough arguments to satisfy format string
`123%f'
^ ran out for this one

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

12 / 2 页下一页

发新帖

Chinaunix › 论坛 › 程序设计 › Shell › 关于awk的一个问题

北京盛拓优讯信息技术有限公司. 版权所有京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号：11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员联系我们：huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP