在继续阅读本文之前,您务必要对我们在本专栏中将要讨论的一些技术有所了解。我们要使用的技术包括:可扩展的样式表语言转换(Extensible Stylesheet Language Transformations,XSLT)、XML 路径语言(XML Path Language,XPath)和资源描述框架(Resource Description Framework,RDF)。在 参考资料部分有到关于所有这些技术的信息的链接。
4Suite Server 概述
我们将使用由本文作者参与开发的 XML 资源库 4Suite Server(4SS)作为本文中示例的应用程序基础。4Suite Server 是一个 XML 资源库,它带有许多用于 XML 数据和元数据管理的功能程序,无论使用 Python 与否,这些功能程序都使得 4Suite Server 非常适合 Web 服务的快速开发。
本文中的示例是用 4Suite Server 0.11 编写的,需要使用 Python 1.5.2 或更高版本和 4Suite 0.11。在 参考资料部分有下载所有这些应用程序的链接。
在线软件资源库
本文是“Python Web Services Developer”专栏的第二部分,却是关于构建在线软件资源库的三部分系列的第一部分。在这部分中,我们将构建我们的基础架构。在随后的专栏中,我们将特别描述如何使用各种协议(例如,简单对象访问协议(Simple Object Access Protocol,SOAP)、HTTP 和 WWW 分布式编写和版本控制(WWW Distributed Authoring and Versioning,WebDAV))搜索建立了索引的内容和基于代理的内容添加或内容检索。
我们的在线软件资源库服务模式是基于 RPMFind.net 中的 RDF 模式的,但关系不太紧密。RPMFind 是一个用流行的 Red Hat 包管理器(Red Hat Package Manager,RPM)格式为 UNIX 和 Linux 软件包编制目录的系统。它包含关于软件包的关键元数据(包括作者、版本和描述,格式为 RDF,详见 清单 1)。关于 RDF 的简短定义,请阅读本专栏的前一期,或者去 参考资料部分查找这个简单格式基本介绍的链接。
XML 的实际格式是不相关的。事实上,因为所描述的技术适用于任何类型的 XML 内容,所以根本没必要去描述软件。您可以用这种技术描述书的目录、雇员信息,或者甚至是餐馆的酒类一览表。
这个示例中使用的所有代码和数据文件都可以从 参考资料部分的链接下载。
文档定义
在 4SS 的 XML 资源库中,文档定义允许您指定 XML 内容和 RDF 元数据之间的一个映射。为此,您需要定义由三个 XPath 表达式组成的集:一个主语(subject)表达式、一个谓语(predicate)表达式和一个宾语(object)表达式。XPath 表达式允许您在文档中定义一个节点关系集,并允许根据这些关系从文档返回内容的子集。当在资源库中添加、修改和删除每个 XML 文档时,都要根据 XML 文档求这些 XPath 表达式的值。求得的语句,也被称为 三元组(triple),被自动添加到 RDF 数据库(被称作 模型)中,或从其中删除。如果修改了文档,也要更改元组以反映发生的更改,如果文档被删除了,就要把元组从 RDF 服务器上删除。文档定义可以从其它文档继承定义的信息,这允许您定义 XML 内容到 RDF 元数据信息的复杂映射。
新闻热点
疑难解答