免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1524 | 回复: 5
打印 上一主题 下一主题

html提取数据 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-05-22 11:54 |只看该作者 |倒序浏览
<img src=image/ad1.gif width="128" height="36"/><what />
<img src='image/ad2.gif' width="128" height="36" />
<what ><img 1/>
<img 2
>
<img
3 >
使用正则<img [^>]*> 提出以结果为:
<img src=image/ad1.gif width="128" height="36"/><what />
<img src='image/ad2.gif' width="128" height="36" />
<what ><img />
我想要的结果是:
<img src=image/ad1.gif width="128" height="36"/>
<img src='image/ad2.gif' width="128" height="36" />
<img 1/>
<img 2
>
<img
3 >

论坛徽章:
0
2 [报告]
发表于 2012-05-22 12:00 |只看该作者
[root@localhost test]# sed -n '/<img [^>]*/,/>/p' 111
<img src=image/ad1.gif width="128" height="36"/><what />
<img src='image/ad2.gif' width="128" height="36" />
<what ><img />
<img src
>
<img
src >
现在以下问题解决了:
<img src
>
<img
src >
以下问题没有解决
<img src=image/ad1.gif width="128" height="36"/><what />
<what ><img />

论坛徽章:
0
3 [报告]
发表于 2012-05-22 13:21 |只看该作者
  1. sed  's/\(^<.*>\)<.*>/\1/' file
复制代码

论坛徽章:
1
辰龙
日期:2014-05-22 11:38:58
4 [报告]
发表于 2012-05-22 18:27 |只看该作者
  1. awk -vRS="<img [^>]*>" 'RT{print RT}'
复制代码

论坛徽章:
1
辰龙
日期:2014-05-22 11:38:58
5 [报告]
发表于 2012-05-22 18:45 |只看该作者
  1. sed ':a;/<img [^>]*>/!{N;ba};s/\(<img [^>]*>\).*/\1/'
复制代码

论坛徽章:
0
6 [报告]
发表于 2012-05-29 15:21 |只看该作者
回复 5# winway1988


    能否给我讲讲这么长都什么意思 ,一般的都能看懂,太长就完蛋了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP