论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2008-10-07 15:35 |只看该作者 |倒序浏览

就像grep的-oP 参数那样，只匹配出正则指定的内容抓取出来，请问awk里有函数能做到吗？

另外，awk (gawk) 确定不支持 (?<= xxx) & (?= xxx) 这样的lookbehind符号吗？

我现在只能是不停的变量中转，再gsub，这样重复做好几次，浪费时间/工作量啊　:wink:

update: match($0,/regexp/,array) 这样的方式便可把结果抓到后面的数组中，其中array[0]为整个匹配串，[1]及后面的分别表式括号括处的匹配部分

[ 本帖最后由 pooronce 于 2008-10-8 14:37 编辑 ]

文库|博客

ly5066113

巨富豪门

论坛徽章:: 23

2楼 [报告]

发表于 2008-10-07 15:39 |只看该作者

原帖由 pooronce 于 2008-10-7 15:35 发表
就像grep的-oP 参数那样，只匹配出正则指定的内容抓取出来，请问awk里有函数能做到吗？

另外，awk (gawk) 确定不支持 (?

?= 这种东西只有perl支持吧？
如果你觉得awk不方便那就用grep或perl好了。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

pooronce

稍有积蓄

论坛徽章:: 0

3楼 [报告]

发表于 2008-10-07 15:48 |只看该作者

awk的RS控制很方便啊。。。

看起来，难道我只好用Perl了么

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

pooronce

稍有积蓄

论坛徽章:: 0

4楼 [报告]

发表于 2008-10-07 15:55 |只看该作者

抱歉，再请教一下:

awk支持像sed等的那种括号替换法么:　s/abc(.*)def/\1/
这一种，在awk中怎么实现呢

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

leetaedong

稍有积蓄

论坛徽章:: 1

5楼 [报告]

发表于 2008-10-07 15:57 |只看该作者

原帖由 pooronce 于 2008-10-7 15:55 发表
抱歉，再请教一下:

awk支持像sed等的那种括号替换法么:　s/abc(.*)def/\1/
这一种，在awk中怎么实现呢

不支持的.

不过可以通过substr 变通.

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

ly5066113

巨富豪门

论坛徽章:: 23

6楼 [报告]

发表于 2008-10-07 15:58 |只看该作者

原帖由 pooronce 于 2008-10-7 15:48 发表
awk的RS控制很方便啊。。。

看起来，难道我只好用Perl了么

perl不是也有$/可以控制？

gnu awk 的gensub 好象支持\1，你可以试试。

不如把你的需求说一说，论坛里这么多人，也许有你意想不到的方法。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

pooronce

稍有积蓄

论坛徽章:: 0

7楼 [报告]

发表于 2008-10-07 16:20 |只看该作者

是搜索结果的一部份
需要把每条目的Location/Store的链接地址/Seller User ID/ 这三部份用TAB分开放到一行里

问题就在，一是很bt，主要内容全部在一行里（这一行里有46万个字符），二是这三部分数据不是每条目都有的，可能会有不同的缺失

笨办法的话，先切割成行出来后，再做二次处理。。。但我不想用
想找出方法来用较少时间一次处理成功　（因为有大量的类似htm要一起处理，时间消耗上是比较可观的）

[ 本帖最后由 pooronce 于 2008-10-8 15:23 编辑 ]

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

pooronce

稍有积蓄

论坛徽章:: 0

8楼 [报告]

发表于 2008-10-08 14:38 |只看该作者

问题解决。。。
gensub不好用。。。或者说是我仍没学会怎么用吧，不知道为啥\x的方式是空的

但后来发现match很好用，能直接把正则匹配的内容抓到数组里，这样就比较好的解决了我的需要了 >_<

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

返回列表

Chinaunix › 论坛 › 程序设计 › Shell › [已解决]awk里是否可以通过正则匹配一段文本放到某变量 ...

[已解决]awk里是否可以通过正则匹配一段文本放到某变量中？ [复制链接]