12 3 4 5 6 7 8 9 10 ... 11 / 11 页下一页

【5楼解答的很详细，大家可以讨论下】sed 地址和模式匹配的问题 [复制链接]

Nalternative

白手起家

论坛徽章:: 0

电梯直达

1楼 [收藏(0)] [报告]

发表于 2011-06-25 09:25 |只看该作者 |倒序浏览

本帖最后由 expert1 于 2011-07-22 13:59 编辑

[root@oracle tmp]# cat e_test.txt
1
2
3
4
5
6
[root@oracle tmp]# sed -e '1,2d' -e '1,2d' e_test.txt
4
5
6
[root@oracle tmp]# sed '1,2d' e_test.txt |sed '1,2d'
5
6

这两个命令为啥结果不一样，-e怎么执行的？

第一个命令执行的没有 3

文库|博客

zooyo

禁止发言

论坛徽章:: 3

2楼 [报告]

发表于 2011-06-25 10:13 |只看该作者

PATT:1$
HOLD:$
COMM:1,2 d
PATT:2$
HOLD:$
COMM:1,2 d
PATT:3$
HOLD:$
COMM:1,2 d
PATT:3$
HOLD:$
COMM:1,2 d
PATT:4$
HOLD:$
COMM:1,2 d
PATT:4$
HOLD:$
COMM:1,2 d
PATT:4$
HOLD:$
4
PATT:5$
HOLD:$
COMM:1,2 d
PATT:5$
HOLD:$
COMM:1,2 d
PATT:5$
HOLD:$
5
PATT:6$
HOLD:$
COMM:1,2 d
PATT:6$
HOLD:$
COMM:1,2 d
PATT:6$
HOLD:$
6

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

Nalternative

白手起家

论坛徽章:: 0

3楼 [报告]

发表于 2011-06-25 10:50 |只看该作者

zooyo 发表于 2011-06-25 10:13

看不懂，另外这个是咋跟踪出来的？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

xiaopan3322

大富大贵

论坛徽章:: 0

4楼 [报告]

发表于 2011-06-25 11:26 |只看该作者

回复 3# Nalternative

sedsed: http://sedsed.sourceforge.net/

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

yinyuemi

大富大贵

论坛徽章:: 2

5楼 [报告]

发表于 2011-06-25 14:57 |只看该作者

本帖最后由 yinyuemi 于 2011-06-25 14:59 编辑

回复 1# Nalternative

这个问题很有趣，所以研究下，下面是我的理解，如果有不对的地方，请大家指正

首先我觉得两段代码执行结果不同，原因比较简单，第二个代码因为使用了管道，所以相当于两个sed程序独立完成对文本的处理，第一个虽然使用了-e，但始终是在一个sed里完成的，这里我主要想说下为什么第一个代码会得出lz那样的输出结果。
（最初，我的觉得输出结果应该是

3
4
5
6

复制代码

，为什么3没有了呢？）

经过多次尝试，变化代码，最后发现问题的关键是第二个1,2这个匹配上，
sed -e '1,2d' -e '1,2d'
中的第一个1,2匹配没有问题，将第1和2行删除，
当执行到第二个1,2匹配的时候，由于第1和2行已经被删除，所以此时读入patten的行号为3，那么“1 ” 匹配是失败的，怎么还会把第三3行的数据删除呢？
原来是和line1,line2或/pattern/,line(line,/pattern/)这样的匹配模式有关，
1, 如果line和pattern匹配成功时，sed从line1匹配，直到line2或/pattern/

seq 6 |sed -n '1,3p'
1
2
3

复制代码

2, 如果匹配不成功时，又有下面几种情况：
<a>, line=0时，只能使用0，/pattern/的模式，即从头匹配，直到pattern

seq 6 |sed -n '0,/3/p'
1
2
3

复制代码

但下面的模式不能使用

seq 6 |sed -n '0,3p'
sed: -e expression #1, char 4: invalid usage of line address 0

复制代码

关于0,/pattern/的原文解释：

A line number of 0 can be used in an address specification like 0,/regexp/ so that sed will try to match regexp in the first input line too. In other words, 0,/regexp/ is similar to 1,/regexp/, except that if addr2 matches the very first line of input the 0,/regexp/ form will consider it to end the range, whereas the 1,/regexp/ form will match the beginning of its range and hence make the range span up to the second occurrence of the regular expression.

<b>, line 匹配成功，/pattern/匹配不成功，则是，从line行到最后一行

seq 6 |sed -n '3,/v/p'
3
4
5
6

复制代码

<c> 就是lz举的例子中第二个line1，line2的特殊匹配情况，下面我把具体执行过程写下，

seq 6 |sed -e '1,2'd -e '1,2'd
读入第一行，1，2匹配成功，执行d，删除第一行，
读入第二行，1，2匹配成功，执行d，删除第一行
（这时，第一个-experssion执行完毕，执行第二个-experssion）
读入第三行，1，2匹配成功了一半，因为1匹配成功，这里可以像<a>中0一样，"try to match regexp in the first input line too",所以执行d，删除第三行。
读入第四行，1，2匹配失败，第二个experssion执行结束，
读入第五行，第六行，结束。

复制代码

为了更好的理解，结合前面<b>的情况，执行下面代码：

line1=2
seq 6|sed -e '1,3d' -e"$line1,3d"
5
6
#看来只要line1小于当前读入的行号就判读成功,你可以试试line1等于3的情况
seq 6 |sed -e '1,2d' -e"$line1,/v/d'
#没有输入，因为/v/匹配失败，所以命令d会一直执行到最后一行，把所有行都被删除。
seq 6 |sed -e '1,2d' -e"$line1,5d'
6
#命令d只执行到第5行

复制代码

非常感谢lz的例子，让我对sed的模式匹配加深了理解
最后再show两个和sed用法很类似的awk例子，呵呵

seq 6 |awk '!i++,/3/'
1
2
3
seq 6 |awk '/3/,0'
3
4
5
6

复制代码

你看懂了么？

评分

参与人数 1	可用积分 +10	收起理由
xiaopan3322	+ 10	好！！！

查看全部评分

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

Nalternative

白手起家

论坛徽章:: 0

6楼 [报告]

发表于 2011-06-25 15:12 |只看该作者

回复 Nalternative

这个问题很有趣，所以研究下，下面是我的理解，如果有不对的地方，请大家指正 ...
yinyuemi 发表于 2011-06-25 14:57

非常感谢！解答的这么详细，不明白都不行了！

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

liion631818

富足长乐

论坛徽章:: 10

7楼 [报告]

发表于 2011-06-25 16:21 |只看该作者

学习

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

zooyo

禁止发言

论坛徽章:: 3

8楼 [报告]

发表于 2011-06-25 17:20 |只看该作者

只有膜拜了。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

xrzs1986

丰衣足食

论坛徽章:: 1

9楼 [报告]

发表于 2011-06-26 01:09 |只看该作者

佩服 yinyuemi (SS) 兄的学习与分享精神~

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

xrzs1986

丰衣足食

论坛徽章:: 1

10楼 [报告]

发表于 2011-06-26 01:40 |只看该作者

回复 5# yinyuemi

这里的”1，2匹配成功了一半，因为1匹配成功，“我看的不太明白：
1匹配成功了？前面的1,2d不是已经把1,2都删掉了嘛~ 后面的1和2都应该是匹配失败的啊？麻烦 yinyuemi 帮忙解释下~ 谢谢~

seq 6 |sed -e '1,2'd -e '1,2'd
读入第一行，1，2匹配成功，执行d，删除第一行，
读入第二行，1，2匹配成功，执行d，删除第一行
（这时，第一个-experssion执行完毕，执行第二个-experssion）
读入第三行，1，2匹配成功了一半，因为1匹配成功，这里可以像<a>中0一样，"try to match regexp in the first input line too",所以执行d，删除第三行。
读入第四行，1，2匹配失败，第二个experssion执行结束，
读入第五行，第六行，结束。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

12 3 4 5 6 7 8 9 10 ... 11 / 11 页下一页

返回列表

Chinaunix › 论坛 › 程序设计 › Shell › 【5楼解答的很详细，大家可以讨论下】sed 地址和模式匹 ...