免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1761 | 回复: 7
打印 上一主题 下一主题

【用sed能实现吗?】 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2006-09-25 15:04 |只看该作者 |倒序浏览
"http://www.baidu.com/s?ct=0&ie=gb2312&bs=浦东八百伴&sr=&z=&cl=3&f=8&wd=浦东八百伴+地址"
"http://www.baidu.com/s?ie=gb2312&bs=上海如家快捷酒店+闸北&sr=&z=&cl=3&f=8&wd=上海如家快捷酒店+闸北交通&ct=0"
"http://www.baidu.com/s?tn=sitehao123&ct=0&ie=gb2312&bs=阳江闸坡海陵岛&sr=&z=&cl=3&f=8&wd=东方银滩度假酒店"
"http://www.baidu.com/s?wd=广西南宁饭店&lm=0&si=&rn=10&tn=jjo1cn&ie=gb2312&ct=0&cl=3&f=1&rsp="


这个是apache文件的一部分
我现在想要 wd=后的内容。
例如:第二行中的  上海如家快捷酒店+闸北交通  第三行的 东方银滩度假酒店 第四行的 广西南宁饭店
用sed如何实现呢?

cat baidu.txt | sed  -e 's/\("http:\/\/www.baidu.com\/.*\)wd=\(.*\)[\"\&]*/ \2/'

但是不行的。
请帮帮我。谢谢。

论坛徽章:
0
2 [报告]
发表于 2006-09-25 15:22 |只看该作者
  1. sed  's/.*wd\=\([^&"]*\).*/\1/'   
复制代码

论坛徽章:
0
3 [报告]
发表于 2006-09-25 16:04 |只看该作者
cat baidu.txt | LANG=LC_ALL sed  -e 's/.*wd=\([^&"]*\).*/\1/'

论坛徽章:
0
4 [报告]
发表于 2006-09-25 16:21 |只看该作者
thanks, nhjidle  
你的方法可以哦。
谢谢了。

论坛徽章:
0
5 [报告]
发表于 2006-09-25 16:50 |只看该作者
sed -n -e 's/.*wd=//g
{
s/[&"l].*//g
p
}' data

论坛徽章:
0
6 [报告]
发表于 2006-09-25 18:37 |只看该作者
不好意思,忘记问了,如果前边有ip地址呢?
219.138.118.80 "http://www.baidu.com/s?wd=酒店装修图片&lm=0&si=&rn=10&ie=gb2312&ct=0&cl=3&f=1&rsp=1"
59.42.181.170 "http://www.baidu.com/s?wd=广州七天连锁酒店&lm=0&si=&rn=10&ie=gb2312&ct=0&cl=3&f=1&rsp=7"
68.126.185.9 "http://www.baidu.com/s?ie=gb2312&bs=上海宾馆+标准四人房&sr=&z=&cl=3&f=8&wd=上海宾馆+四人房&ct=0"
218.13.182.194 "http://www.baidu.com/s?lm=0&si=&rn=10&ie=gb2312&ct=0&wd=珠海海湾大酒店&pn=20&cl=3"
218.63.201.9 "http://www.baidu.com/s?tn=yncninfo&sort=&pn=0&cl=3&rn=10&ct=0&lm=0&wd=岗位座右铭&content=&search=实名&I22=搜索"
58.33.10.35 "http://www.baidu.com/s?ct=0&ie=gb2312&bs=浦东八百伴&sr=&z=&cl=3&f=8&wd=浦东八百伴+地址"

论坛徽章:
0
7 [报告]
发表于 2006-09-25 21:48 |只看该作者
以上那些方法都可以吧?
  1. cat baidu.txt | sed 's/*.wd=//g'
复制代码

[ 本帖最后由 awk就是awp加ak 于 2006-9-25 21:52 编辑 ]

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
8 [报告]
发表于 2006-09-25 22:08 |只看该作者
sed 's/.*wd=//;s/["|&].*//'
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP