- 论坛徽章:
- 0
|
<?php
$str = "<?xml version=\"1.0\" encoding=\"utf-8\"?><coreg360getOfferCollectionResponse xmlns=\"http://www.ifficient.com/\"><coreg360getOfferCollectionResult>
<Offer><OfferID>26565</OfferID><OfferName>Walmart - Gift Card</OfferName><HTML>&lt;TR&gt;&lt;TD&gt;
&lt;TABLE border=\"0\"&gt;
&lt;TBODY&gt;
</HTML></Offer></coreg360getOfferCollectionResult></coreg360getOfferCollectionResponse>";
$html = '';
function ReadXml($result){
$xmlParser = xml_parser_create();
xml_parser_set_option($xmlParser, XML_OPTION_CASE_FOLDING, false);
xml_set_element_handler($xmlParser, "startElement", "endElement");
xml_set_character_data_handler($xmlParser, "characterData");
//xml_set_default_handler($xmlParser, "defaultHandler");
xml_parse($xmlParser, $result, true);
xml_parser_free($xmlParser);
}
function defaultHandler($parser, $data) {
echo $data;
}
function startElement($parser, $name, $attrs) {
global $HTML_tag;
if("HTML"==$name) {
$HTML_tag=true;
echo 'aaaaa';
}
}
function characterData($parser, $data) {
global $HTML_tag, $html;
if($HTML_tag==true) {
$html.=html_entity_decode($data);
}
}
function endElement($parser, $name) {
global $HTML_tag;
if("HTML"==$name) {
$HTML_tag=false;
echo 'bbbbb';
}
}
ReadXml($str);
echo $html;
?>
输出的结果请查看浏览器源代码。
这里输出的结果为什么是
TRTD
TABLE border="0"
TBODY
< 和 > 都被自动删除了,xml_parser执行的过程中删除的,这是经过我的研究得出的结论。
希望大侠们帮帮忙。
[ 本帖最后由 lookingfor 于 2009-8-10 19:44 编辑 ] |
|