免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2538 | 回复: 5
打印 上一主题 下一主题

关于html解析的问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-12-13 11:21 |只看该作者 |倒序浏览

  1. <html>
  2.     <body>
  3.         <div>
  4.             <div class="here">1this's the value</div>
  5.         <a>ttttt</a>
  6.         <br>yyyy <font >sss</font>
  7.        <br>zzzzzz <font >sss</font>
  8.         </div>
复制代码
我使用HTML::TreeBuilder::XPath来解析,但是好像不能找到yyyy  zzzzzz这些字符串。
要么就是找到所有的字符串,问问这类查找有什么好的方法。

论坛徽章:
0
2 [报告]
发表于 2010-12-13 11:27 |只看该作者
最好把yyyyy zzzzz这样的东西放到一个特定的标签里边,比如div之类的
<br>可能也行,但是要封闭起来

论坛徽章:
0
3 [报告]
发表于 2010-12-13 11:58 |只看该作者
目前的情况是 yyyyy zzzzz都没有在标签里边。如果在标签里面我就知道该怎么做了
就算在标签外面该怎么取值呢?

论坛徽章:
0
4 [报告]
发表于 2010-12-14 09:01 |只看该作者
自己顶一下
有没有什么好点的方法?

论坛徽章:
46
15-16赛季CBA联赛之四川
日期:2018-03-27 11:59:132015年亚洲杯之沙特阿拉伯
日期:2015-04-11 17:31:45天蝎座
日期:2015-03-25 16:56:49双鱼座
日期:2015-03-25 16:56:30摩羯座
日期:2015-03-25 16:56:09巳蛇
日期:2015-03-25 16:55:30卯兔
日期:2015-03-25 16:54:29子鼠
日期:2015-03-25 16:53:59申猴
日期:2015-03-25 16:53:29寅虎
日期:2015-03-25 16:52:29羊年新春福章
日期:2015-03-25 16:51:212015亚冠之布里斯班狮吼
日期:2015-07-13 10:44:56
5 [报告]
发表于 2010-12-14 09:43 |只看该作者
用外层那个 div 吧,你什么标记都没有让模块怎么找

论坛徽章:
0
6 [报告]
发表于 2010-12-14 09:49 |只看该作者
用treebuilder不行的话就用正则吧~
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP