免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 10576 | 回复: 18
打印 上一主题 下一主题

[文本处理] 如何用awk提取数据?根据特定的字符 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-07-16 10:24 |只看该作者 |倒序浏览
本帖最后由 vkqo 于 2013-07-16 10:46 编辑

比如a文件
jacs----18977795465----false----95
“tesn----15974464981----true----63”
lack----13312311332----mini----78

我只想提取每行第二个----字符前面的数据
提取以后就是这样的
jacs----18977795465
“tesn----15974464981
lack----13312311332

用awk怎么操作?

论坛徽章:
0
2 [报告]
发表于 2013-07-16 10:30 |只看该作者
@vkqo

你一行的第二个分隔符有没有写错啊?
  1. awk 'BEGIN{FS="----"}{print $1FS$2}' urfile  | sed 's/---false//'
复制代码

论坛徽章:
50
15-16赛季CBA联赛之广夏
日期:2018-11-05 09:42:462015年亚冠纪念徽章
日期:2015-07-23 11:58:122015亚冠之广州富力
日期:2015-07-07 08:26:172015亚冠之塔什干棉农
日期:2015-06-29 09:08:072015年亚洲杯之伊朗
日期:2015-03-08 20:51:012015年迎新春徽章
日期:2015-03-04 09:58:11未羊
日期:2014-10-16 22:41:47处女座
日期:2014-10-16 15:33:33酉鸡
日期:2014-03-13 12:54:10巳蛇
日期:2014-03-10 14:39:052015亚冠之德黑兰石油
日期:2015-07-29 12:46:372015亚冠之德黑兰石油
日期:2015-08-07 12:54:11
3 [报告]
发表于 2013-07-16 10:33 |只看该作者
本帖最后由 WilliBhamlll 于 2013-07-16 10:33 编辑
  1. awk '{print gensub(/([^-]+-+[^-]+).*/,"\\1","1")}'
复制代码

论坛徽章:
0
4 [报告]
发表于 2013-07-16 10:38 |只看该作者
第二行没写错,有的就是有个“符号

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
5 [报告]
发表于 2013-07-16 10:45 |只看该作者
本帖最后由 关阴月飞 于 2013-07-16 10:46 编辑

回复 1# vkqo


第一行没写错的话,你的要求和你所要的结果是有冲突的


比如a文件
jacs----18977795465---false----95

论坛徽章:
0
6 [报告]
发表于 2013-07-16 10:46 |只看该作者
搞错了,第一行写错了,我重新改一下

论坛徽章:
0
7 [报告]
发表于 2013-07-16 10:49 |只看该作者
回复 3# WilliBhamlll
大侠,看你awk和sed很精通呀,有什么好的学习方法吗?请大侠赐教呀

   

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
8 [报告]
发表于 2013-07-16 10:50 |只看该作者
回复 6# vkqo

这样的话,二楼的方法就可以了
  1. awk -F '----' '{print $1FS$2}' urfile   
复制代码

论坛徽章:
0
9 [报告]
发表于 2013-07-16 10:52 |只看该作者
windows下用gawk可以不??

论坛徽章:
50
15-16赛季CBA联赛之广夏
日期:2018-11-05 09:42:462015年亚冠纪念徽章
日期:2015-07-23 11:58:122015亚冠之广州富力
日期:2015-07-07 08:26:172015亚冠之塔什干棉农
日期:2015-06-29 09:08:072015年亚洲杯之伊朗
日期:2015-03-08 20:51:012015年迎新春徽章
日期:2015-03-04 09:58:11未羊
日期:2014-10-16 22:41:47处女座
日期:2014-10-16 15:33:33酉鸡
日期:2014-03-13 12:54:10巳蛇
日期:2014-03-10 14:39:052015亚冠之德黑兰石油
日期:2015-07-29 12:46:372015亚冠之德黑兰石油
日期:2015-08-07 12:54:11
10 [报告]
发表于 2013-07-16 11:12 |只看该作者
回复 7# wsleichao3

惭愧,我这样谈不上精通啊,还有很多不懂!
说到学习方法,我个人比较喜欢来论坛学习,把关于awk和sed相关的贴子尽可能都看看,由其是精华贴。主要是学习解决问题的思路,看一遍不懂,就多看几遍,然后多加练习。
另外要坚持,只要每天有时间,就来论坛看看贴,回答问题,我相信持续几个月或一年半载,这方面能力肯定会得到提高!
再推荐看一下zooyo版主的博客,里面大量关于awk/sed的实例解析,很不错!

   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP