论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2009-07-16 15:47 |只看该作者 |倒序浏览

5可用积分

对脚本不熟，我想查找一个字符串，然后取该字符串所在行的下一行的倒数几个字符。
满足条件的可能有多行。

举个例子这个文本文件中有大量如下内容

xxxx yyyyy 部门：A 姓名：张三
这个人的工资是 2000

我的目的是把部门A中所有人的工资列出来，写到另一个文件中。

操作系统是hpux

[ 本帖最后由 cyf2003 于 2009-7-16 15:57 编辑 ]

最佳答案

ywlscpl

查看完整内容

[ 本帖最后由 ywlscpl 于 2009-7-16 17:31 编辑 ]

文库|博客

ywlscpl

富甲一方

论坛徽章:: 0

2楼 [报告]

发表于 2009-07-16 15:47 |只看该作者

awk -F '部门：|姓名：|年龄：|的工资是' '/部门：/&&$2~/A/{sub(/ +$/,"",$3);a[$3]}/的工资是/&&($1 in a){print $2+0}' file

复制代码

[root@Mylinux tmp]# cat file
xxxx yyyyy 部门：A 姓名：张三年龄：22
张三的工资是 2000元
zafasfxxx asdfasfas 部门：B 姓名：李四年龄：33
李四的工资是 30000元
但是可能出现下面的情况：
xxxx yyyyy 部门：A 姓名：张三年龄：22
zafasfxxx asdfasfas 部门：B 姓名：李四年龄：33
张三的工资是 2000元
李四的工资是 30000元
[root@Mylinux tmp]# awk -F '部门：|姓名：|年龄：|的工资是' '/部门：/&&$2~/A/{sub(/ +$/,"",$3);a[$3]}/的工资是/&&($1 in a){print $2+0}' file
2000
2000

复制代码

[ 本帖最后由 ywlscpl 于 2009-7-16 17:31 编辑 ]

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

00306

家境小康

论坛徽章:: 0

3楼 [报告]

发表于 2009-07-16 15:49 |只看该作者

给点提示？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

ly5066113

巨富豪门

论坛徽章:: 23

4楼 [报告]

发表于 2009-07-16 15:55 |只看该作者

回复 #1 cyf2003 的帖子

假设取3个字符：

sed -n '/yoursting/{n;s/.*$...$$/\1/p;}' urfile

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

ywlscpl

富甲一方

论坛徽章:: 0

5楼 [报告]

发表于 2009-07-16 15:56 |只看该作者

取倒数3个字符
awk '/字符串/{getline;print substr($0,length($0)-2)}' file

倒数4个就-3

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

blackold

大富大贵

论坛徽章:: 5

6楼 [报告]

发表于 2009-07-16 16:05 |只看该作者

回复 #1 cyf2003 的帖子

LZ的意思应该是取第二行的第二个字段吧。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

kwokcn

大富大贵

论坛徽章:: 0

7楼 [报告]

发表于 2009-07-16 16:06 |只看该作者

grep -Po '(?<=姓名：|这个人的工资是 )[^\n]*' URFILE | xargs -n 2

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

00306

家境小康

论坛徽章:: 0

8楼 [报告]

发表于 2009-07-16 16:08 |只看该作者

原帖由 ly5066113 于 2009-7-16 15:55 发表
假设取3个字符：

sed -n '/yoursting/{n;s/.*$...$$/\1/p;}' urfile

又学了一招，用...代表三个字符

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

ywlscpl

富甲一方

论坛徽章:: 0

9楼 [报告]

发表于 2009-07-16 16:10 |只看该作者

也可这样，针对提供的文本

awk '$NF~/名字/{getline;print $NF}' file

[ 本帖最后由 ywlscpl 于 2009-7-16 16:11 编辑 ]

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

cyf2003

白手起家

论坛徽章:: 0

10楼 [报告]

发表于 2009-07-16 16:42 |只看该作者

谢谢大家的回复。收益非浅。
我仔细看了一下这个文本文件，发现比我之前看到的要复杂点。

由于是多线程程序，所以写出来的日志，这2行未必是紧挨这写出来的，中间可能插入别的行。比如：

大部分日志应该是：

xxxx yyyyy 部门：A 姓名：张三年龄：22
张三的工资是 2000元
zafasfxxx asdfasfas 部门：B 姓名：李四年龄：33
李四的工资是 30000元

但是可能出现下面的情况：

xxxx yyyyy 部门：A 姓名：张三年龄：22
zafasfxxx asdfasfas 部门：B 姓名：李四年龄：33
张三的工资是 2000元
李四的工资是 30000元

所以原来的需求就不对了，也就是不能取接下来的第二行，而应该以某个关键字，比如姓名，来找到下面最近的一行，我想这个难度应该比较大了吧？

另外取倒数几个字符也不合理，因为数字有多有少，谢谢kwokcn的细心。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

12 / 2 页下一页

返回列表

Chinaunix › 论坛 › 程序设计 › Shell › 求助：处理文本

求助：处理文本 [复制链接]

最佳答案

回复 #1 cyf2003 的帖子

回复 #1 cyf2003 的帖子

浏览过的版块