基于关系数据库的时态XML存取研究.doc
上传人:sy****28 上传时间:2024-09-10 格式:DOC 页数:3 大小:30KB 金币:16 举报 版权申诉
预览加载中,请您耐心等待几秒...

基于关系数据库的时态XML存取研究.doc

基于关系数据库的时态XML存取研究.doc

预览

在线预览结束,喜欢就下载吧,查找使用更方便

16 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

DNFGKwww.dnf717.comsjl摘要:时间是自然界无所不在的客观属性,更是信息的重要属性。能够根据时序进行访问的XML文档称之为时态XML。针对时态XML文档这种特殊的文档,应用一种数据模型进行时态的扩展并在此数据模型的基础上研究基于关系数据库时态XML数据的存储和查询方法。该方法使时态XML的查询变成可以在关系数据库里使用SQL语句的一般查询。中国论文网关键词:关系数据库;时态XML;数据模型;存储;查询0引言随着Web技术的发展,扩展标记语言(XML)作为下一代Web的“数据表达”和“数据交换”的标准正在成为事实。把XML与数据库结合,是当前数据库研究领域的一个热点。然而,时间是自然界无所不在的客观属性,更是信息的重要属性,将时态引入XML具有重要的现实意义。越来越多的数据使用XML进行表示和存储,而如何对XML数据进行有效地存储、查询变得尤为重要。引入“时态表达”后,XML文档多了时态的属性,这样就能够记录下XML文档的一系列修改痕迹[1]。另一方面,加入了时态信息之后,相对于传统关系模型的灵活性差以及SQL语言的可扩展性低等缺点,XML比这两者能够更好地支持时态信息表达和时态查询。1XML与数据库XML即可扩展的标记语言,是一套定义语义标记的规范,它将文档用标记定义成计算机方便识别的数据类型。随着网络应用发展,XML数据已大量存在,尤其是电子商务、数字图书馆等应用理念的发展使XML类型的数据成为当前主流的数据形式。传统的数据库中的数据结构性很强,而Web上的数据最大特点就是半结构化。XML可作为表示半结构化数据的模型,可以很容易地将XML的文档描述与关系数据库中的属性一一对应起来,实施精确地查询与模型抽取[2]。相对于数据库技术,XML技术在数据应用方面具有跨平台、易表义等优点。XML文件又是数据的集合,我们甚至可以把数据库中的数据和XML数据看成是同一数据的不同表现形式。如果能过在这两种数据表现形式之间提供一映射,那么就可以实现这两种数据表现形式的转换。同样也可以将数据从基于关系数据库的存储形式,转变成标记语言的XML格式。正如摘要中提到的,时间是自然界无所不在的客观属性,真实的事件无一不打上时间的烙印:一个事件必定是在某个时间点上发生的。时态特性是信息的客观存在,加入了时态的xml能够提供对时态数据库切实有效的支持方案[7]。在本文中讨论了实现时态xml在关系数据库中的存储和查询的处理。本文对XML进行有效时间的扩展,提出了一个基于结点有效时间标记的时态XML数据模型,基于这种存储模型,我们对时态XML的查询可以最终转换为对传统表结构和数据的查询。2XPath及时态XML的扩展描述2.1XPath简介XPath[3]基于XML的树形结构建立数据模型,XML文档被描述为一棵由结点集构成的树模型(treemodel),它有7种类型结点。其中,文档顺序是对文档中所有结点定义的一个顺序,该顺序对应于在XML文档中每个结点的开始标记的出现顺序。XPath模型完整的保持了XML文档的信息,包括文档的结构和数据。可以直接在这个模型的基础上对XML文档进行操作[4]。在XPath语法中,是通过一系列的路径匹配规则来实现的,路径匹配与文件路径的表示相仿。2.2时态XML的扩展描述能够支持“时态”的XML为时态XML。时态XML中的有效时间描述了数据对象在现实世界中真实有效的时间,它可以用扩展了时态的XPath来描述[5]。需要注意的是,XML的父节点的有效时间区间必须覆盖所有子节点的有效时间区间。另外需要提出的是,本文采用在XML树结点加入了有效时间标记的例子来说明XML文档的存储和查询的实现。为了讨论的方便,本文中的时间粒度为年,并且使用MicrosoftSQLServer2000为数据库软件。将下表1表示成时态XML文档就是表1下方的时态XML文档:3时态XML文档在关系数据库中的存取目前,基于关系数据库的查询处理是对XML的查询处理研究中一个重要的思路。当前很多关系数据库产品中都有对xml的支持。XML查询处理建立在关系数据库之上的优点是可以直接利用关系数据库成熟的查询优化和索引技术[6],也不用为并发控制、安全性等问题做额外的工作。当然在实现上也还是有点复杂,关键的步骤有:1)将XML数据转存到关系数据库的表中;2)将XML查询转化为对应的SQL查询。3.1时态XML文档在关系数据库中的存储XML文档在关系数据库中的存储也有很多种方法,比如按字符串存储、树表示法、映射关系等[7]。本文采用基于路径的XML树表示方法,首先从根结点开始按树的先序遍历给各结点编号,如下图1所示:接着,把所有结点分为两类,存进两个表中,即值表和非值表中。存储为以下关系模式(Schema)[8],其