- 论坛徽章:
- 0
|
首先得向大家申明,在分析XML这篇里,我原版引用了zlzj2010仁兄的大作,原因是想让大家重复读一个例子,起到了两遍印象的作用。当然这有剽窃的嫌疑,不过能更好的说明XML的概念和应用,只好担起这个罪名。这里先向“zlzj2010”仁兄谢罪,版主如果认为不适,请删掉他。
第二章 分析XML
2.2.1为什么要分析?
首先我们生成XML的目的不是要将XML文档显示在计算机的屏幕上,它是作为一个标准的消息结构存在的,接受消息的一方根据需要取出XML文档是节点所标识的数据,然后再将这些数据作相应的处理,这才是XML文档存在的意义。
因此,之所以要分析XML是要从XML文档中获取节点数据。这,就是原因。
2.2.2 分析的方法
一、 DOM(文档对象模型)方法:
W3C已于2000年11月13日推出了规范DOM level 2,DOM是用于访问和更新文档的接口,它与语言无关。因而可以用各种语言在各种平台上实现。这个接口表示了一棵可以访问和修改的树。注意这里DOM可以更新和访问的文档对象当然不仅限于XML文档,也可以是HTML。所以,DOM提供了一系列的访问、存取THML和XML文件的方法。利用DOM规范,可以实现DOM 文档和XML之间的相互转换,遍历、操作相应DOM文档的内容。可以说,要自由的操纵XML文件,就要用到DOM规范。
最后读者要记住的是:
1、 DOM接口表示了一棵树,我们要了解这棵树的结构。
2、 我们要了解的是w3c为DOM接口提供的访问、存取对象的方法。
A、DOM树的结构:
树的节点类型 描 述
Document接口 表示了DOM文档对象。
Element接口 表示了可以表示文档中元素节点.如<姓名>;李华</姓名>;
Node接口 表示了元素叶节点
NodeList接口 表示了元素叶节点列表
Text接口 表示了叶节点内容。如:李华
Comment接口 表示了叶节点内容
Comment接口 表示了叶节点内容
元素节点和叶节点如果和XML对比来看,元素节点表示了名称标签和叶节点则表示了节点内容。如:
<?xml version="1.0" encoding="GB2312"?>;
<学生花名册>;
<学生 性别 = "男">;
<姓名>;李华</姓名>;
</学生>;
</学生花名册>;
其中:学生花名册、学生、姓名等表示是元素节点,而“李华”表示是叶节点。由此可见在DOM树操作过程如果我们想获取元素节点名称那么必须申明一个Element对象,如上例中“学生花名册”“学生”,如果想获取叶节点名称必须申明一个Node对象或者NodeList对象,如上例中的“姓名”,如果想获取叶节点内容必须申明一个Text对象。
可以看出,一个结构良好的XML文档和DOM树有着一一对应的关系。
B、DOM提供的方法:(http://java.sun.com/j2se/1.4.2/docs/api/index.html)
DOM提供的类:包含在rt.jar核心类中,存放位置在\jdk1.4\jre\lib\rt.jar在这个包里包含了几个至关重要的类,它们包括:
javax.xml.parsers.*:XML解析器接口,提供的DoumentBuilder和DocumentBuilderFactory组合可以对XML文件进行解析,转换成DOM文档。
org.w3c.dom.*:XML的DOM实现,提供了Document、DocumentType、Node、NodeList、Element、Text等接口,这些接口均是访问DOM文档所必须的。我们可以利用这些接口创建、遍历、修改DOM文档。
javax.xml.transform.dom和javax.xml.transform.stream:提供了DOMSource类和StreamSource类,可以用来将更新后的DOM文档写入生成的XML文件中
org.apache.crimson.tree.XmlDocument:写XML文件要用到。
示例1 e:/test/XMLTest.java(文件目录可自行创建)
导读:有了上面的基础知识后我们知道,所谓XML分析其实质就是创建一个DOM树对象将获取XML文档元素分析到这棵树中(具体如何分析到DOM树中这里我们可以不关心这个问题),通过访问这棵树的元素节点、叶节点等内容达到访问XML文档的目的。所以分析一个XML大致上要分以下几步骤:
1、 创建一个DOM树对象:三步
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();//获得一个XML文件的解析器,参照以下文档可查看DocumentBuilderFactory类的方法。
http://java.sun.com/j2ee/1.4/docs/api/javax/xml/parsers/DocumentBuilderFactory.html - newDocumentBuilder()
DocumentBuilder db = null;// 解析XML文件生成DOM文档的接口类,以便访问DOM。
http://java.sun.com/j2ee/1.4/docs/api/javax/xml/parsers/DocumentBuilder.html
db = dbf.newDocumentBuilder();//创建一个新的初始化的DocumentBuilder对象,该对象用于创建一个新的DOM对象。
(DocumentBuilderFactory、DocumentBuilder两个类都包含在javax.xml.parsers.*)
Document document = builder.newDocument();//通过DOM文档的接口类创建一个新的DOM文档。
总结:获得解析器-à创建DOM接口类-à创建DOM文档
2、 将XML文件分析到已建立的DOM树对象中
doc = db.parse(inFile);
parse是DocumentBuilder类提供的一种方法,用于解析指定的XML文档的内容并返回一个新的DOM文档对象。
其中inFile表示要分析的XML文件。
3、 利用Document接口提供的方法访问DOM树,达到获取XML文档元素的目的。主要方法列表如下:
表一:Document接口提供的常用的方法
方法名 描 述 返回值
createElement
(String tagName) 创建一个Element对象 Element
createTextNode(String data) 创建一个Text Node对象 Text
getDocumentElement() 获取DOM树的根节点 Element
getElementById
(String elementId) 根据elementId获取节点 Element
getElementsByTagName
(String tagname) 根据标识名获取节点 Element
表二:NodeList提供的常用方法
方法名 描 述 返回值
getLength() 获取Node列表中元素的个数 int
item(int index) 按序号返回Node列表元素 Node
其它方法:http://java.sun.com/j2se/1.4.2/docs/api/index.html
示例2 示例1中所用到的bean e:/test/StudentBean.java
- public class StudentBean {
- private String sex; //学生性别
- private String name; //学生姓名
- private int age; //学生年龄
- private String phone; //电话号码
- public void StudentBean()
- {}
- public void setSex(String s) {
- sex = s;
- }
- public void setName(String s) {
- name = s;
- }
- public void setAge(int a) {
- age = a;
- }
- public void setPhone(String s) {
- phone = s;
- }
- public String getSex() {
- return sex;
- }
- public String getName() {
- return name;
- }
- public int getAge() {
- return age;
- }
- public String getPhone() {
- return phone;
- }
- }
复制代码
操作示例:
e:\test\>;javac StudentBean.java
e:\test\>;javac XMLTest.java
e:\test\>;java XMLTest |
|