免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 2855 | 回复: 13
打印 上一主题 下一主题

sed 匹配 · 符号的问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-11-13 09:31 |只看该作者 |倒序浏览
一段HTML
<br style="font-family: 宋体; font-size: 9pt">
          <a href=/index.php?gid=61><font color="#ff9000"><b>[<u>网络技术</u>]</b></font></a>
          <a href="/forumdisplay.php?fid=29"  target=_blank>安全技术 </a>
         ·<a href="/forumdisplay.php?fid=30"  target=_blank>网络技术 </a>
          ·<a href="/forumdisplay.php?fid=34"  target=_blank>存储备份 </a>
          ·<a href="/forumdisplay.php?fid=45"  target=_blank>服务器及硬件技术</a>
          ·<a href="/forumdisplay.php?fid=94"  target=_blank>Cisco技术</a>
我要显示 所有 ·  到</a>之间的内容
sed -n '/·/,/<\/a>/p'
为啥总是失败?

论坛徽章:
0
2 [报告]
发表于 2009-11-13 09:46 |只看该作者

回复 #1 ztj2247 的帖子

使用这个试试:
sed -n '/\·/,/<\/a>/p'  file

#即把“·”转义一下。

论坛徽章:
0
3 [报告]
发表于 2009-11-13 09:49 |只看该作者

回复 #1 ztj2247 的帖子

sed  -r '/\.|<\/a>/s/\.(.*)<\/a>.*/\1/'

论坛徽章:
0
4 [报告]
发表于 2009-11-13 10:01 |只看该作者
第2个可以 但没达到要求 因为html 还有其他的内容
所以现要求 单行匹配 ·  到</a>之间的内容 不进行多行匹配
要如何实现?

论坛徽章:
11
金牛座
日期:2015-03-19 16:56:22数据库技术版块每日发帖之星
日期:2016-08-02 06:20:00数据库技术版块每日发帖之星
日期:2016-04-24 06:20:00数据库技术版块每日发帖之星
日期:2016-04-13 06:20:00IT运维版块每日发帖之星
日期:2016-04-13 06:20:00数据库技术版块每日发帖之星
日期:2016-02-03 06:20:00数据库技术版块每日发帖之星
日期:2015-08-06 06:20:00季节之章:春
日期:2015-03-27 15:54:57羊年新春福章
日期:2015-03-27 15:54:37戌狗
日期:2015-03-19 16:56:41数据库技术版块每日发帖之星
日期:2016-08-18 06:20:00
5 [报告]
发表于 2009-11-13 10:14 |只看该作者

回复 #4 ztj2247 的帖子

你要的只是其中的中文吧....html去掉?

sed -n '/\.</,/<\/a>/s#\.<a[^<]*>\(.*\)</a>#\1#p'

论坛徽章:
0
6 [报告]
发表于 2009-11-13 10:38 |只看该作者
楼上也不对
我只想匹配
·<a href="/forumdisplay.php?fid=30"  target=_blank>网络技术 </a>
·<a href="/forumdisplay.php?fid=34"  target=_blank>存储备份 </a>
·<a href="/forumdisplay.php?fid=45"  target=_blank>服务器及硬件技术</a>
·<a href="/forumdisplay.php?fid=94"  target=_blank>Cisco技术</a>
的内容
sed '/\·.*<\/a>/p' 为什么显示不了??

论坛徽章:
0
7 [报告]
发表于 2009-11-13 10:40 |只看该作者

回复 #6 ztj2247 的帖子

sed -n '/\·.*<\/a>/p'

论坛徽章:
1
数据库技术版块每日发帖之星
日期:2016-01-24 06:20:00
8 [报告]
发表于 2009-11-13 10:44 |只看该作者

回复 #6 ztj2247 的帖子

你前面的那个点不是英文的“.”吧,试试这个:

sed -n '/·<.*<\/a>/'p urfile

论坛徽章:
0
9 [报告]
发表于 2009-11-13 10:44 |只看该作者
原帖由 ztj2247 于 2009-11-13 10:38 发表
楼上也不对
我只想匹配
·网络技术
·存储备份
·服务器及硬件技术
·Cisco技术
的内容
sed '/\·.*/p' 为什么显示不了??


$ cat file
<br style="font-family: 宋体; font-size: 9pt">
          <a href=/index.php?gid=61><font color="#ff9000"><b>[<u>网络技术</u>]</b>< /font></a>
          <a href="/forumdisplay.php?fid=29"  target=_blank>安全技术 </a>
         ·<a href="/forumdisplay.php?fid=30"  target=_blank>网络技术 </a>
          ·<a href="/forumdisplay.php?fid=34"  target=_blank>存储备份 </a>
          ·<a href="/forumdisplay.php?fid=45"  target=_blank>服务器及硬件技术</a>
          ·<a href="/forumdisplay.php?fid=94"  target=_blank>Cisco技术</a>
$ sed -n '/\·/,/<\/a>/p'  file
         ·<a href="/forumdisplay.php?fid=30"  target=_blank>网络技术 </a>
          ·<a href="/forumdisplay.php?fid=34"  target=_blank>存储备份 </a>
          ·<a href="/forumdisplay.php?fid=45"  target=_blank>服务器及硬件技术</a>
          ·<a href="/forumdisplay.php?fid=94"  target=_blank>Cisco技术</a>

论坛徽章:
0
10 [报告]
发表于 2009-11-13 10:45 |只看该作者
原帖由 wtuter 于 2009-11-13 10:40 发表
sed -n '/\·.*/p'

总算可以了 就少个-n   -n 啥意思啊达人
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP