免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: lemoncoral
打印 上一主题 下一主题

[文本处理] 提取文件中的url [复制链接]

论坛徽章:
0
11 [报告]
发表于 2014-06-29 20:44 |只看该作者
回复 9# 关阴月飞

感觉用得如鱼得水!谢谢!

另外追问下,在awk中,是否可以做到这样的效果,读入一行,然后进行正则匹配,然后把匹配部分的字符串(比如上面的这个url部分)单独提出来赋给一个变量?
这样就能实现类似grep -o 的效果,如果能很简单地实现就好,如果太复杂或者太曲线,就不如用grep -o。

   

论坛徽章:
0
12 [报告]
发表于 2014-06-29 20:45 |只看该作者
回复 10# MeRcy_PM

感谢,这个可能就应该是grep的菜!我总在想用awk来实现,也许本身就没对路

   

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
13 [报告]
发表于 2014-06-29 20:51 |只看该作者
回复 11# lemoncoral

    另外追问下,在awk中,是否可以做到这样的效果,读入一行,然后进行正则匹配,然后把匹配部分的字符串(比如上面的这个url部分)单独提出来赋给一个变量?
这样就能实现类似grep -o 的效果,如果能很简单地实现就好,如果太复杂或者太曲线,就不如用grep -o。


这是可以的,但awk中的正则没grep那么强,有些东东不支持....

论坛徽章:
36
摩羯座
日期:2013-09-23 16:37:312015年亚洲杯之沙特阿拉伯
日期:2015-04-14 09:10:172015亚冠之柏太阳神
日期:2015-06-25 08:48:212015亚冠之武里南联
日期:2015-07-28 09:01:082015亚冠之莱赫维亚
日期:2015-07-28 15:44:172015亚冠之柏斯波利斯
日期:2015-09-06 14:08:52白银圣斗士
日期:2015-11-25 17:06:2815-16赛季CBA联赛之吉林
日期:2015-12-09 16:59:072016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之辽宁
日期:2016-04-14 09:29:04luobin
日期:2016-06-17 17:46:3615-16赛季CBA联赛之天津
日期:2016-08-16 14:11:01
14 [报告]
发表于 2014-06-30 09:58 |只看该作者
  1. sed "s/.*url('\([^']*\).*/\1/"
复制代码

论坛徽章:
0
15 [报告]
发表于 2014-06-30 12:52 |只看该作者
回复 14# LikeLx

感谢,这是可以的!


   

论坛徽章:
0
16 [报告]
发表于 2014-06-30 17:44 |只看该作者
回复 13# 关阴月飞

awk的正则好像和grep差不多,grep -P以后用的是Perl的正则,这个确实比较强大。
不过Perl的零宽断言必须长度确定,不能(?<=url('?),比较可惜。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP