12 3 / 3 页下一页

论坛徽章:: 1

电梯直达

1楼 [收藏(0)] [报告]

发表于 2012-12-29 18:23 |只看该作者 |倒序浏览

本帖最后由 tank064 于 2012-12-29 18:23 编辑

cat gggg
1
2
3
aaa
4
5
bbb
6
7
ccc
1
ddd
3
eee
2
fff
6
本来想匹配 1 与 3 之间的行
awk '/1/,/3/' gggg
1
2
3
1
ddd
3
会把匹配到的行都显示处来,但只想要特定的行.google后,查到下面这句:
awk '{t=t RS $0}END{print gensub(/.*(1.*3).*/,"\\1",1,t)}' ggggg
1
ddd
3

复制代码

这里的{t=t RS $0} 是什么意思,怎么用的?

t=t RS $0 即t=t+RS+$0 把字符串连接起来后赋值?
还有:
gensub(/.*(1.*3).*/,"\\1",1,t) t前面这个1是做什么用的? man awk

gsub(r, s [, t]) For each substring matching the regular expression r in the string t, substitute the
string s, and return the number of substitutions. If t is not supplied, use $0. An &
in the replacement text is replaced with the text that was actually matched. Use \& to
get a literal &. (This must be typed as "\\&"; see GAWK: Effective AWK Programming for
a fuller discussion of the rules for &’s and backslashes in the replacement text of
sub(), gsub(), and gensub().)

复制代码

没看到这个的说明.

文库|博客

reyleon

大富大贵

论坛徽章:: 60

2楼 [报告]

发表于 2012-12-29 18:30 |只看该作者

gensub(r, s, h [, t]) Search the target string t for matches of the regular expression r. If h is a string beginning with g or G, then replace all
matches of r with s. Otherwise, h is a number indicating which match of r to replace. If t is not supplied, $0 is used
instead. Within the replacement text s, the sequence \n, where n is a digit from 1 to 9, may be used to indicate just the text
that matched the n’th parenthesized subexpression. The sequence \0 represents the entire matched text, as does the character &.
Unlike sub() and gsub(), the modified string is returned as the result of the function, and the original target string is not
changed.

复制代码

指的是第一次匹配到的内容

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

blackold

大富大贵

论坛徽章:: 5

3楼 [报告]

发表于 2012-12-29 18:53 |只看该作者

回复 1# tank064

你具体是想要什么？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

tank064

稍有积蓄

论坛徽章:: 1

4楼 [报告]

发表于 2012-12-29 21:36 |只看该作者

本帖最后由 tank064 于 2012-12-29 21:37 编辑

回复 3# blackold
回黑哥：

就是 awk '/line1/,/line2/{print}' file 这样会把所有的line1 到line2 之间所有的行都显示出来，但如果file中line1 line2 line1 line2 有多个这样的范围，怎么才能指定匹配具体哪个范围呢？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

waker

富甲一方

论坛徽章:: 8

5楼 [报告]

发表于 2012-12-30 09:49 |只看该作者

回复 4# tank064

你能用汉语描述"特定范围"的特征么?如果能,为什么不描述清楚?如果不能,那么用计算机语言就能描述清楚了?

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

Shell_HAT

版主

论坛徽章:: 33

6楼 [报告]

发表于 2012-12-30 11:21 |只看该作者

t=t RS $0 即t=t+RS+$0 把字符串连接起来后赋值?

是的，实际上它是把整个文件的内容都赋值给变量t，用以在END里面的gensub做替换。自己print一下就知道了：

awk '{t=t RS $0}END{print t}' urfile

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

Shell_HAT

版主

论坛徽章:: 33

7楼 [报告]

发表于 2012-12-30 11:22 |只看该作者

gensub(/.*(1.*3).*/,"\\1",1,t) t前面这个1是做什么用的? man awk

你应该man gawk

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

Shell_HAT

版主

论坛徽章:: 33

8楼 [报告]

发表于 2012-12-30 11:25 |只看该作者

回复 4# tank064

你google到的那个代码，它也仅仅是利用的正则表达式的贪婪性来匹配最后一个1到3之间的内容而已。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

tank064

稍有积蓄

论坛徽章:: 1

9楼 [报告]

发表于 2013-01-04 10:42 |只看该作者

回复 5# waker
是这样的,假如一个文本是这样:

line1xxxx
......
line2xxxx
......
line1xxxx
......
line2xxxx
......
line1xxxx
......
line2xxxx
......

这段文本中有三段line1xxxx 到 line2 xxxx 这样的行范围匹配. /line1xxxx/,/line2xxxx/ 这样会从第一个范围的line1xxxx 所在行匹配到最后一个范围的line2xxxx所在行,
也许这并不是我所希望得到的结果. 如果我这是想匹配到地一个 line1xxxx 到lie2xxxx的范围或是第二个,亦或是第三个时, 这时该如何匹配?

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

tank064

稍有积蓄

论坛徽章:: 1

10楼 [报告]

发表于 2013-01-04 10:45 |只看该作者

回复 3# blackold

是这样的,假如一个文本是这样:

line1xxxx
......
line2xxxx
......
line1xxxx
......
line2xxxx
......
line1xxxx
......
line2xxxx
......

这段文本中有三段line1xxxx 到 line2 xxxx 这样的行范围匹配. /line1xxxx/,/line2xxxx/ 这样会从第一个范围的line1xxxx 所在行匹配到最后一个范围的line2xxxx所在行,
也许这并不是我所希望得到的结果. 如果我这是想匹配到地一个 line1xxxx 到lie2xxxx的范围或是第二个,亦或是第三个时, 这时该如何匹配?

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

12 3 / 3 页下一页

返回列表

Chinaunix › 论坛 › 程序设计 › Shell › awk匹配到的多个范围选择问题(老帖)

[文本处理] awk匹配到的多个范围选择问题(老帖) [复制链接]