Chinaunix

标题: 如何用sed或者awk截取长路径中的某段 [打印本页]

作者: jackwenghui    时间: 2009-01-08 14:44
标题: 如何用sed或者awk截取长路径中的某段
各位大虾
如我有一个路径 aaaa/bbbb/cccc/ddddd/eeeee/ffffff
我希望用正则表达式取出ffffff之前的路径~~
应该怎么写?
作者: ly5066113    时间: 2009-01-08 14:45
标题: 回复 #1 jackwenghui 的帖子
$ str="aaaa/bbbb/cccc/ddddd/eeeee/ffffff"
$ echo ${str%/*}
aaaa/bbbb/cccc/ddddd/eeeee
$ dirname $str
aaaa/bbbb/cccc/ddddd/eeeee
作者: haimming    时间: 2009-01-08 14:45
周经贴
作者: jackwenghui    时间: 2009-01-08 14:49
那如果写成正则表达式应该怎么写啊?
作者: biglazybug    时间: 2009-01-08 14:53
sed -r 's/(.*)\/.*/\1/'
作者: jackwenghui    时间: 2009-01-08 14:56
标题: 回复 #5 biglazybug 的帖子
假设我不知道有多少个‘/‘呢?也就是,如果能够从后向前查找,这个应该怎么写?我实验了一下,好像不行啊~~~

[ 本帖最后由 jackwenghui 于 2009-1-8 15:00 编辑 ]
作者: welcome008    时间: 2009-01-08 14:58
echo "aa/bb/cc/dd/ee/fffff"|awk 'BEGIN{FS="fffff"}{print $1}'
作者: biglazybug    时间: 2009-01-08 14:59
标题: 回复 #6 jackwenghui 的帖子
试试看呗 写多少个不都一样吗 都是去掉最后一个斜线后的
作者: welcome008    时间: 2009-01-08 14:59
原帖由 jackwenghui 于 2009-1-8 14:56 发表
假设我不知道有多少个‘/‘呢?也就是,如果能够从后向前查找,这个应该怎么写?



awk -F\/ 'BEGIN{OFS="/"}{$NF="";print $0}'
作者: 寂寞烈火    时间: 2009-01-08 15:09
原帖由 haimming 于 2009-1-8 14:45 发表
周经贴


作者: zjsyzsj    时间: 2009-01-08 15:09
原帖由 jackwenghui 于 2009-1-8 14:44 发表
各位大虾
如我有一个路径 aaaa/bbbb/cccc/ddddd/eeeee/ffffff
我希望用正则表达式取出ffffff之前的路径~~
应该怎么写?

echo "aaaa/bbbb/cccc/ddddd/eeeee/ffffff"|sed 's/ffff.*//p'
作者: zjsyzsj    时间: 2009-01-08 15:11
原帖由 biglazybug 于 2009-1-8 14:53 发表
sed -r 's/(.*)\/.*/\1/'

能不能把你写的解释一下,我刚开始学看不懂意思。
作者: haimming    时间: 2009-01-08 15:30
标题: 回复 #12 zjsyzsj 的帖子
我也刚学,来试试
s--替换参数,格式s/str1/str2/,str2会换掉str1
这里,(.*)\/.*是str1,这是个正则表达式,其中.表示一个任意可打印字符,*表示任意个前面的“.",(.*)加括号的作用在于给匹配到的串加个标签(等会用),
(.*)\/.*就是目录的格式,如aa/bb/cc等
\1是str2,这里\1就是前面的标签内容
如,前面匹配到“aa/bb”,那么,\1就是aa了

(错解,删除两行)

不知对否,大懒虫?

[ 本帖最后由 haimming 于 2009-1-8 16:17 编辑 ]
作者: biglazybug    时间: 2009-01-08 15:39
标题: 回复 #13 haimming 的帖子
应该没有你说的类似循环匹配那么个过程(.*)\/ 中的*是贪婪的 意思就是会最大匹配 也就是说 后面的那个.*只会是最后一个斜线后面的内容
作者: haimming    时间: 2009-01-08 15:46
明白,谢谢!
那(.*)\/.*,这里有两个" .* ",它们是根据什么去分赃的呢?
第一个.*不会把所有的都吃了吗?
作者: 我是DBA    时间: 2009-01-08 15:52
标题: 回复 #15 haimming 的帖子
后面的/就是来约束它的啊,说,你到这就好了,别再吃了。后面的不是你的了。
作者: smallstar001    时间: 2009-01-08 15:54
原帖由 haimming 于 2009-1-8 15:46 发表
明白,谢谢!
那(.*)\/.*,这里有两个" .* ",它们是根据什么去分赃的呢?
第一个.*不会把所有的都吃了吗?


根据正则表达式的贪婪性, 第一个.*会最大程度的去吃
作者: haimming    时间: 2009-01-08 15:58
.也包括了"/"吧?
那样,第一个.*应该会“说这也是我的,后面的.*你就别吃了”啊
作者: biglazybug    时间: 2009-01-08 15:59
标题: 回复 #17 smallstar001 的帖子
在这个例子里就是充分利用了这个贪吃特性
作者: haimming    时间: 2009-01-08 16:03
犯傻,想极端了,就想能吃就吃,如果那样的话,.*就全部吃了,设它也没意思了,呵呵
现在明白了
作者: biglazybug    时间: 2009-01-08 16:04
标题: 回复 #6 jackwenghui 的帖子
没明白你的意思 从后找 还是取 最后一个斜线前的值吗




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2