- 论坛徽章:
- 0
|
本帖最后由 david_95 于 2016-03-29 18:13 编辑
我想取得 xpath 对应的html contents, 就是 带 html tag attributes 等内容。我用 $treeParser->as_XML_compact($xpath_setting) 有时候会报错 ,我猜是因为网页内容可能不完整,无法解析为xml
我后来又找到 $treeParser->findnodes_as_string($xpath_setting), 但是这个有缺陷: 对应xpath 只有一个node 时,是ok 的。 如果xpath 有一批对应的node ,就只能把第一层node 的html tag 找出来。
例如: 我用到 xpath: .//div[contains(\@id,\"Widget\")] ,这个对应十个 div , 每隔div 下有多个node.
而 findnodes_as_string ,就只能找出十个div , div 下的node 内容就丢失了。
取得内容是就像 <div id="ns_0WNSWFKX64E4EKK8BYVR_1831_Widget" class="a-section unified_widget rcm widget s9hl s9Widget s9Multipack"></div>
而div 下还应该有多个html node..
请教我该怎么作,才能把对应十个div 下,所有的html 内容都获得?
|
|