免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3007 | 回复: 12
打印 上一主题 下一主题

HTML标签匹配问题.比较着急,谢谢了 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-02-23 07:09 |只看该作者 |倒序浏览
如何匹配出
类似于
<meta  <meta/>
<input <input name="aaa" />
<div <div id="sss"/>
<link <link url="123" />
<test<test name='te'/>
等等, 想找到这种 以 <标签名开头 + 中间任意字符 或 没有 + 空格斜杠大于号(" />") 结尾的 标签 ,并不想找到  "<标签名" 开始,并没有结束的,正则表达式应该怎么写.

例如 我想找到 <input name="aaa" />,并不想让 <link  被找到,
<test name='te'/>能被找到 , <test 不能.

谢谢了, 万分感激.

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
2 [报告]
发表于 2011-02-23 07:16 |只看该作者
本帖最后由 yinyuemi 于 2011-02-23 07:22 编辑

try:

sed -n -r '/^<(.*) <(.*)\/>$/p'

or

awk '/^<(.*)>$/ && length($0)>20'

论坛徽章:
0
3 [报告]
发表于 2011-02-23 07:41 |只看该作者
正则的话怎么写啊

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
4 [报告]
发表于 2011-02-23 07:44 |只看该作者
/^\<\(.*\)\ \<\(.*\)\/\>$/

论坛徽章:
0
5 [报告]
发表于 2011-02-23 08:06 |只看该作者
不行啊,还是没出来

论坛徽章:
0
6 [报告]
发表于 2011-02-23 08:07 |只看该作者
/^\\<("+key+"\\)\\  \\<\\("+key+".*)/>$

key 是我程序里取出的 html tag标签

论坛徽章:
0
7 [报告]
发表于 2011-02-23 08:13 |只看该作者
只拿 <meta  这种的也可以
不匹配 <meta/> 和  <link name='123' /> 这种

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
8 [报告]
发表于 2011-02-23 08:20 |只看该作者
有点乱,你是想要匹配字段的一部分值,还是只要满足匹配就全部输出

论坛徽章:
0
9 [报告]
发表于 2011-02-23 08:27 |只看该作者
<meta   <a><div/><meta /><abc><abc/><b><link name='111'/><h2/><key ssk='sss'/><link

拿到 key为 meta 时   获得 <meta  而不是 <meta />
key 为 link时 获得 <link 而不是 <link name='111'/>

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
10 [报告]
发表于 2011-02-23 09:19 |只看该作者
回复 9# herrapfel


    再试试这个:
  1. key2=link
  2. echo "<meta   <a><div/><meta /><abc><abc/><b><link name='111'/><h2/><key ssk='sss'/><link" |grep -o "<$key2 "
  3. <link

  4. key1=meta
  5. echo "<meta   <a><div/><meta /><abc><abc/><b><link name='111'/><h2/><key ssk='sss'/><link" |grep -o "<$key [^/]"
  6. <meta  
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP