首页 > 开发 > XML > 正文

DOM文档如何与XML文件互换?

2024-07-21 02:04:33
字体:
来源:转载
供稿:网友
 

文简要描述了dom的概念和内部逻辑结构,实例讲述dom文档操作和xml文件互相转换的java实现过程。

 

1. dom简介

 

目前,w3c已于2000年11月13日推出了规范dom level 2。文档对象模型(dom)是html和xml文档的编程接口规范,它与平台和语言是无关的,因而可以用各种语言在各种平台上实现。该模型定义了thml和xml文件在内存中的逻辑结构(即为文档),提供了访问、存取thml和xml文件的方法。利用dom规范,可以实现dom 文档和xml之间的相互转换,遍历、操作相应dom文档的内容。可以说,要自由的操纵xml文件,就要用到dom规范。

 

2. dom内部逻辑结构

 

dom文档中的逻辑结构可以用节点树的形式进行表述。通过对xml文件的解析处理,xml文件中的元素便转化为dom文档中的节点对象。dom的文档节点有document、element、comment、type等等节点类型,其中每一个dom文档必须有一个document节点,并且为节点树的根节点。它可以有子节点,或者叶子节点如text节点、comment节点等。任何的格式良好的xml文件中的每一个元素均有dom文档中的一个节点类型与之对应。利用dom接口将xml文件转化成dom文档后,我们就可以自由的处理xml文件了。

 

3. java中的dom接口

 

dom规范提供的api的规范,目前sun公司推出的jdk1.4测试版中的java api遵循了 dom level 2 core推荐接口的语义说明,提供了相应的java语言的实现。

 

在org.xml.dom中,jkd1.4提供了document、documenttype、node、nodelist、element、text等接口,这些接口均是访问dom文档所必须的。我们可以利用这些接口创建、遍历、修改dom文档。

 

在javax.xml.parsers中,jkd1.4提供的doumentbuilder和documentbuilderfactory组合可以对xml文件进行解析,转换成dom文档。

 

在javax.xml.transform.dom和javax.xml.transform.stream中,jdk1.4提供了domsource类和streamsource类,可以用来将更新后的dom文档写入生成的xml文件中。

 

4. 例程

 

4.1 将xml文件转化成dom文档

 

这个过程是获得一个xml文件解析器,解析xml文件转化成dom文档的过程。

 

jdk1.4中,document接口描述了对应于整个xml文件的文档树,提供了对文档数据的访问,是该步骤的目标。document接口可以从类documentbuilder中获取,该类包含了从xml文档获得dom文档实例的api。xml的解析器可以从类documentbuilderfactory中获取。在jdk1.4中,xml文件转化成dom文档可以有如下代码实现:

 

//获得一个xml文件的解析器

 

documentbuilderfactory factory = documentbuilderfactory.newinstance();

//解析xml文件生成dom文档的接口类,以便访问dom。

 

documentbuilder builder = factory.newdocumentbuilder();

document = builder.parse( new file(filename) );

 

4.2 遍历dom文档

 

获得接口类document实例后,可以对dom的文档树进行访问。要遍历dom文档,首先要获得root元素。然后获得root元素的子节点列表。这里通过递归的方法实现遍历的目的。

 

//获得root元素

 

element element = document.getdocumentelement();

 

//获得root元素的子节点列表

 

nodelist = element.getchildnodes();

 

//用递归方法实现dom文档的遍历

 

getelement(nodelist);

 

 

其中getelement方法实现如下:

 

 

  public void getelement(nodelist nodelist){  node cnode;  int i,len;  string str;  if(nodelist.getlength() == 0)  // 该节点没有子节点  return;  }  for(i=0;i 1)  system.out.println(" "+str+" "+len);  }  }  }

 

注意:上面的代码只是显示node类型和text类型的对象。它们的类型标识分别是1和3。

 

4.3 修改dom文档

 

修改dom文档的api在dom level 2 core规范中做了说明,jkd1.4中的org.xml.dom中实现了这些api。修改dom文档操作主要集中在document、element、node、text等类中,这里给出的例子中是在解析出的dom文档中增加一系列对象,对应与在xml文件中增加一条记录。

 

// 获得root对象

 

element root = document.getdocumentelement();

// 在dom文档中增加一个element节点

 

element booktype = document.createelement("computes");

//将该节点转化成root对象的子节点

 

root.appendchild(cdrom);

//在dom文档中增加一个element节点

 

element booktitle = document.createelement("title");

//将该节点转化成booktype对象的子节点

 

booktype.appendchild(booktitle);

//在dom文档中增加一个text节点

 

text bookname = document.createtextnode("understand corba");

//将该节点转化成bookname对象的子节点

 

booktitle.appendchild(bookname);

 

4.4 将dom文档转化成xml文件

 

// 获得将dom文档转化为xml文件的转换器,在jdk1.4中,有类transformerfactory

// 来实现,类transformer实现转化api。

 

transformerfactory tfactory = transformerfactory.newinstance();

transformer transformer = tfactory.newtransformer();

// 将dom对象转化为domsource类对象,该对象表现为转化成别的表达形式的信息容器。

 

domsource source = new domsource(document);

/* 获得一个streamresult类对象,该对象是dom文档转化成的其他形式的文档的容器,

可以是xml文件,文本文件,html文件。这里为一个xml文件。*/

streamresult result = new streamresult(new file(“text.xml”));

// 调用api,将dom文档转化成xml文件。

 

transformer.transform(source,result);

 

这里提供了该例程的完整程序,该例程在windows 2000中jdk1.4环境中运行通过。

 

以上给出了一个例子,读者可以从中了解到对dom操作的思路。因为对dom的操作均遵循了dom规范,所以也适用于其它语言对dom的处理。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表