免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3808 | 回复: 19
打印 上一主题 下一主题

[文本处理] 用awk语句截取字符串 [复制链接]

论坛徽章:
1
15-16赛季CBA联赛之广夏
日期:2016-04-12 15:53:16
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2016-04-10 18:44 |只看该作者 |倒序浏览
[107202][14Jan16 12:13:51.955] [Info] Tfrt vgfbb.14.1.fregfeDftrgSgrhyrth:frth: frwefrs 6, ge5g5g-[frtdg4:14-fergt] Tgtt Fgtgtgt.14.1 Sfr-cft.werty.WER.Styhruyjuy htrhryhuur der DEFERF32:C1ER6TYUIO7 [PPT-Y:1/3 F:0/0]-OK, RTYU-[P:1727 G:1662 H:65]

[105553][14Jan16 13:09:31.792] [Info] Tfrt vgfbb.17.1.fregfeDftrgSgrhyrth:frth: frwefrs 6, ge5g5g-[frtdg4:17-fergt] Tgtt Fgtgtgt.17.1 Sfr-cft.werty.WER.Ecfghbbg htrhryhuur der YJGFCV32 [PPT-Y:1/3 F:0/0]-OK, RTYU-[P:1797 G:1542 H:15]

用:
awk -F'[ .]' -v OFS="|" '{print "t1="$(NF-13),"t2="gensub(/.*:/,"","g",$(NF-5))}' file
得出
t1=14|t2=C1ER6TYUIO7
t1=17|t2=YJGFCV32

用:
awk -F'[ .]' -v OFS="|" '{print "t1="$(NF-13),"t2="gensub(/.*:/,"","g",$(NF-5)),"t3="gensub(/ ([^:]*):/,"\\1","g",$(NF-5))}' file
则打印整行


我要的结果是:
t1=14|t2=C1ER6TYUIO7|t3=DEFERF32
t1=17|t2=YJGFCV32|t3=YJGFCV32

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
2 [报告]
发表于 2016-04-10 19:10 |只看该作者
回复 1# _lpq
[107202][14Jan16 12:13:51.955] [Info] Tfrt vgfbb.14.1.fregfeDftrgSgrhyrth:frth: frwefrs 6, ge5g5g-[frtdg4:14-fergt] Tgtt Fgtgtgt.14.1 Sfr-cft.werty.WER.Styhruyjuy htrhryhuur der DEFERF32:C1ER6TYUIO7 [PPT-Y:1/3 F:0/0]-OK, RTYU-[P:1727 G:1662 H:65]



$ awk 'match($0,"[.]([0-9]+)[.].* der ([^: ]+)(:([^ ]+))?",a){print "t1="a[1]"|t2="(a[4]?a[4]:a[2])"|t3="a[2]}' file
t1=14|t2=C1ER6TYUIO7|t3=DEFERF32
t1=17|t2=YJGFCV32|t3=YJGFCV32


   

论坛徽章:
1
15-16赛季CBA联赛之广夏
日期:2016-04-12 15:53:16
3 [报告]
发表于 2016-04-10 19:36 |只看该作者
回复 2# jason680


    谢谢~

我用的是:awk -F'[ .]' -v OFS="|" '{split($(NF-5),t,":")}{print "t1="$(NF_13),"t2="(t[2]?t[2]:t[1]),"t3="t[1]}' file
结果成功了,我高兴哦~~
但是不知道和你的哪个快一点。。
我试试。。

论坛徽章:
1
15-16赛季CBA联赛之广夏
日期:2016-04-12 15:53:16
4 [报告]
发表于 2016-04-10 20:20 |只看该作者
回复 2# jason680


     谢谢,但是我要通过匹配关键字,然后对那行进行处理,我用了我的方法报错


gawk: cmd.line:1: (FILENAME=D:\Users\Amy\Desktop\1.txt FNR=1) fatal:attempt to access field -6

论坛徽章:
28
15-16赛季CBA联赛之八一
日期:2016-02-22 19:10:4215-16赛季CBA联赛之深圳
日期:2016-12-01 10:34:0415-16赛季CBA联赛之新疆
日期:2016-12-07 10:24:2915-16赛季CBA联赛之同曦
日期:2016-12-15 12:06:43CU十四周年纪念徽章
日期:2016-12-18 13:03:4415-16赛季CBA联赛之吉林
日期:2017-01-03 15:52:2515-16赛季CBA联赛之辽宁
日期:2017-01-04 14:58:2415-16赛季CBA联赛之辽宁
日期:2017-01-15 09:42:512016科比退役纪念章
日期:2017-02-06 17:21:50黑曼巴
日期:2017-02-10 15:46:1215-16赛季CBA联赛之上海
日期:2017-03-18 10:14:5415-16赛季CBA联赛之青岛
日期:2017-03-18 22:00:44
5 [报告]
发表于 2016-04-10 20:24 |只看该作者
  1. sed -r 's/.*\.([0-9]+)\..*der\s([^: ]*)(:(\S*))?.*/t1=\1|t2=\4|t3=\2/;s/=(\|t3=(.*))/=\2\1/'
复制代码

论坛徽章:
1
15-16赛季CBA联赛之广夏
日期:2016-04-12 15:53:16
6 [报告]
发表于 2016-04-10 20:26 |只看该作者
回复 2# jason680


    我的代码是awk -F'[ .]' -v OFS="|" '/'"${t1}"'/{split($(NF-5),t,":")}{print $(NF_13),(t[2]?t[2]:t[1]),t[1]}' 1.txt > flie1
然后报错
gawk: cmd.line:1: (FILENAME=D:\Users\Amy\Desktop\1.txt FNR=1) fatal:attempt to access field -6

论坛徽章:
1
15-16赛季CBA联赛之广夏
日期:2016-04-12 15:53:16
7 [报告]
发表于 2016-04-10 20:34 |只看该作者
回复 2# jason680

请看这个~,上面回复的有点小问题

        我的代码是awk -F'[ .]' -v OFS="|" '/'"${t1}"'/{split($(NF-5),t,":")}{print $(NF-13),(t[2]?t[2]:t[1]),t[1]}' 1.txt > flie1
然后报错
gawk: cmd.line:1: (FILENAME=D:\Users\Amy\Desktop\1.txt FNR=1) fatal:attempt to access field -6

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
8 [报告]
发表于 2016-04-10 20:42 |只看该作者
  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;

  4. my $sFmt = "t1=%s|t2=%s|t3=%s\n";
  5. while (<>){
  6.     if (/.*?(?<=\bvgfbb\.)(\d+).*? ([A-Z0-9]+)(:([A-Z0-9]+))? /){
  7.         if (defined $3){
  8.             printf ($sFmt,$1,$2,$4);
  9.             next;
  10.         }
  11.         printf ($sFmt,$1,$2,$2);
  12.     }
  13. }
复制代码

论坛徽章:
1
15-16赛季CBA联赛之广夏
日期:2016-04-12 15:53:16
9 [报告]
发表于 2016-04-10 20:53 |只看该作者
回复 8# sunzhiguolu


    谢谢~

暂时没看perl

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
10 [报告]
发表于 2016-04-10 21:03 |只看该作者
回复 9# _lpq
装个 perl 解释器就能用了, 可以试下. 共同学习, 共同进步.

   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP