免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2127 | 回复: 7
打印 上一主题 下一主题

文本抽取信息 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-07-01 21:04 |只看该作者 |倒序浏览
大家好
我有一个文件test.txt,内容如下:
file name: a
project name: ap
job name: apj1
per: axy
ru: 123
file name: a2
project name: a3p
job name: apj1d
per: axsy
ru: 12df3
wn sfnao aowe
file name: as
project name: adp
job name: apjdp1
per: ax12y
ru: 12ds3
还有一个文件info,内容如下:
axy
axsy
ax12y
要求得到的输出为
ap apj1
a3p apj1d
adp apjdp1
我写的程序tmp.sh如下:
#!/bin/sh
while read line
do
awk -F: '{if($1~/project name/){rn=NR;pn=$2};if($1~/job name/ && NR==rn+1) jn=$2;if($1~/per/ && $2~/"'$line'"/ && NR==rn+3) print pn,jn}' test.txt
done < info

我的程序的输出为空行,我不知道是什么原因,请大侠指教.
注: 我在do与awk之间加上一行:echo $line
输出为:
axy
axsy
ax12y

论坛徽章:
0
2 [报告]
发表于 2009-07-01 21:31 |只看该作者
不一定要用awk,grep配合也行

论坛徽章:
0
3 [报告]
发表于 2009-07-01 21:43 |只看该作者
但是我不会用grep呀
其实我的意思就是要提取相关信息的问题,也就是说如果我有一个参数是a,那么我想提取的信息就是per为a的信息段的project name和job name域的信息

论坛徽章:
0
4 [报告]
发表于 2009-07-01 21:55 |只看该作者
其实我也想用file name作为RS 用换行符作为FS,这样就直接输出$2,$3也可以的

论坛徽章:
0
5 [报告]
发表于 2009-07-01 22:10 |只看该作者

回复 #4 hfvbc 的帖子

#!/bin/sh
while read line
do
awk 'BEGIN{FS="\n";RS="file name:"} /'$line'/{print $2,$3}' test.txt
done < info


或者

#!/bin/sh
while read line
do
awk 'BEGIN{FS="\n";RS="file name:"} /'$line'/{sub(/project name: /,"",$2);sub(/job name: /,"",$3);print $2,$3}' test.txt
done < info

[ 本帖最后由 chenwenming_zj 于 2009-7-1 22:24 编辑 ]

论坛徽章:
0
6 [报告]
发表于 2009-07-02 00:22 |只看该作者
谢谢啊,不过我的程序是哪里错了呢?
我找不出来,请大侠指教.
谢谢

论坛徽章:
0
7 [报告]
发表于 2009-07-02 08:52 |只看该作者
哪位用getline寫個?

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
8 [报告]
发表于 2009-07-02 09:01 |只看该作者

回复 #1 hfvbc 的帖子

try:

  1. awk '/project/{p=$3}/job/{j=$3}/per/{a[$2]=p" "j}NR>FNR{print a[$1]}' test.txt info
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP