作者:马晓宁
xml(可扩展标记语言)看起来可能像某种w3c标准――现在没有什么实际影响,即使以后能派上用场,也是很久以后的事。但实际上,它现在已经得到了应用。所以,不要等到xml已被加进了你最喜爱的html编辑器中才开始使用它。它现在就可以解决各种内部问题和b2b系统问题。
在sparks.com,我们使用xml来标准化从java对象到html数据显示等不同系统之间的数据表示。
特别需要指出的是,我们发现,只要以非常基本的xml结构来实现标准化,就可以更容易地共享和操作数据。在这一过程中,我们发现了使用xml的很多有效方法。下面详细介绍我们现在的应用情况。
标准化
在使用xml之前,建立与你要使用的信息不同的xml数据格式。
生成动态xml
从数据库中生成html并不新鲜,但生成xml却很新鲜。这里我们介绍具体的生成步骤。
用xsl作为模板语言
xsl(可扩展样式表语言)是定义xml数据显示格式的好方法,如果写成几个静态模板会更有效。
生成html
xml加上xsl就等于html。这听起来似乎不对,但用户所见的我们的html页面其实就是xml和xsl共同产生的效果。
一、标准化
xml的能力来自于它的灵活性。但不幸的是,它有时太灵活了,以至于你会面对一个空白的页面,发愁该怎么解决问题。
在任何xml的项目中,第一步工作都是创建标准的数据格式。为此你要作出以下决定:
• 要涉及哪些数据
• 是否要使用dtd(文件类型定义)
• 是否要使用dom(文档对象模型)或sax(xml的简化api)解析
确定数据:
因为没有标准的xml格式,开发者可以自由地开发自己的格式。然而,如果你的格式只能被一个应用程序识别,那么你只能运行这个程序来使用该格式。如果还有其他程序也能读懂你的xml格式,那显然会更有帮助。如果某个xml格式被修改,则使用它的系统可能也需要被修改,所以你应该建立尽可能完整的格式。因为大多数系统忽略它们无法识别的标签,所以改变一个xml格式的最安全的方法是添加标签,而不是修改标签。
单击此处查看xml数据格式实例
在sparks.com,我们查看了不同的产品展示需要的所有产品数据。尽管并不是所有的页面都使用全部数据,但我们还是由此开发出适用于所有数据的非常完整的xml数据格式。例如,我们的产品明细信息页面显示的数据要比产品浏览页面多。然而,我们在这两种情况下仍然使用相同的数据格式,因为每个页面的xsl模板都只使用它所需要的字段。
是否使用dtd
在sparks.com,我们使用组织良好的xml,而不使用仅仅是正确的xml,因为前者不需要dtd。dtd在用户点击和看到页面之间加入了一个处理层。我们发现这一层需要太多的处理。当然,在以xml格式与其他公司通信时,使用dtd还是很不错的。因为dtd能在发送和接受时能保证数据结构正确。
选择解析引擎
现在,可以使用的解析引擎有好几个。选择哪一个几乎完全取决于你的应用需要。如果你决定使用dtd,那么这个解析引擎必须能使你的xml被dtd验证。你可以将验证另放到一个进程中,但那样会影响性能。
sax和dom是两个基本的解析模型。sax基于事件,所以在xml被解析时,事件被发送给引擎。接下来,事件与输出文件同步。dom解析引擎为动态xml数据和xsl样式表建立层次树状结构。通过随机访问dom树,可以提供xml数据,就象由xsl样式表来决定一样。sax模型上的争论主要集中于对dom结构的内存降低过度和加快xsl样式表解析时间缩短方面。
然而,我们发现使用sax的很多系统并没有充分发挥它的能力。这些系统用它来建立dom结构并通过dom结构来发送事件。用这种方法,在任何xml处理之前必须从样式表中建立dom,所以性能会下降。
二、生成动态xml
一旦建立了xml格式,我们需要一种能够将其从数据库中动态移植的方法。
生成xml文档相对来说比较简单,因为它只需要一个可以处理字符串的系统。我们建立了一个使用java servlet、enterprise javabean server、jdbc和rdbms(关系型数据库管理系统)的系统。
• servlet通过把生成xml文档的任务交给enterprise javabean (ejb)来处理产品信息请求。
• ejb使用jdbc从数据库里查询所需的产品详细信息。
• ejb生成xml文件并把它传递给servlet。
• servlet调用解析引擎,从xml文件和静态的xsl样式表中创建html输出。
(有关xsl应用的其他信息,请参阅用xsl作为模板语言。)
生成xml的例子
在java中创建xml文档字符串的真正代码可以分成几个方法和类。
启动xml生成过程的代码放在ejb方法里。这一实例会立即创建一个stringbuffer,以便存储生成的xml字符串。
stringbuffer xml = new stringbuffer();
xml.append(xmlutils.begindocument("/browse_find/browse.xsl", "browse", request));
xml.append(product.toxml());
xml.append(xmlutils.enddocument("browse");
out.print(xml.tostring());
后面的三个xml.append()变元本身就是对其他方法的调用。
产生文件头
第一个附加方法调用xmlutils类来产生xml文件头。我们的java servlet中的代码如下:
public static string begindocument(string stylesheet, string page)
{
stringbuffer xml = new stringbuffer();
xml.append("<?xml version=/"1.0/"?>/n")
.append("<?xml-stylesheet href=/"")
.append(stylesheet).append("/"")
.append(" type =/"text/xsl/"?>/n");
xml.append("<").append(page).append(">/n");
return xml.tostring();
}
这段代码生成了xml文件头。<?xml>标签把本文件定义为支持1.0版本的xml文件。第二行代码指向用以显示数据的正确样式表的位置。最后包括进去的是项级标签(本实例中为<browse>)。在文件末尾,只有<browse>标签需要被关闭。
<?xml version="1.0"?> <?xml-stylesheet href="/browse_find/browse.xsl" type="text/xsl"?> <browse>
填入产品信息
完成了文件头后,控制方法会调用java对象来产生它的xml。本例中调用的是product对象。product对象使用两个方法来产生它的xml表示。第一个方法toxml()通过产生<product>和</product>标签来建立product节点。然后它会调用internalxml(),这样就能提供产品xml所需的内容。internalxml()是一系列的stringbuffer.append()调用。stringbuffer也被转换成字符串并返回给控制方法。
public string toxml()
{
stringbuffer xml = new stringbuffer("<product>/n");
xml.append(internalxml());
xml.append("</product>/n");
return xml.tostring();
}
public string internalxml()
{
stringbuffer xml = new
stringbuffer("/t")
.append(producttype).append("/n");
xml.append("/t").append(idvalue.trim())
.append("/n");
xml.append("/t").append(idname.trim())
.append("/n");
xml.append("/t").append(page.trim())
.append("/n");