如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
时尚购物www.1yhk.comnza摘要:空间查询及优化技术是研究空间数据的难点。轮廓查询技术对于各种数据库和网络应用中的空间查询及优化起着至关重要的作用,已经成为空间查询及优化领域的热点课题。该文对现有的轮廓查询关键技术进行了分析和总结,并对未来的发展方向进行了展望。中国论文网关键词:空间数据库;轮廓查询;轮廓更新中图分类号:TP311文献标识码:A文章编号:1009-3044(2012)28-6645-03近年来,空间数据库作为一门非常前沿的交叉学科,逐渐成为热点研究领域。它在地理信息系统,多媒体信息系统,计算机辅助设计,数据仓库技术等诸多应用领域中都起着非常重要的作用。因此,空间数据库以及对空间数据库进行查询优化的研究备受关注。“轮廓”这个概念最初是2001年Borzsonyi[1]等人在VLDB(VeryLargeDatabases)会议上作为一个操作被提出来的。在d维空间中,轮廓是一个d维点的集合,是由在所有维上不被其它任何点支配的点组成,记作SP(D,S)。假定一个点的集合p1,p2,p3,…,pn,点pi支配点,pj当且仅当点pi在任意维上的坐标都不小于点pj对应的坐标,且至少在某一维上比pj大。轮廓查询在涉及多标准决策的应用中起着非常重要的作用。例如,在网上购买手机,手机的功能各有差异,可能功能强大的手机价位高,功能一般的手机价位低,在考虑多种因素的情况下,如何选择适合自己的最佳方案,轮廓的计算可以轻松解决此类问题。由于轮廓查询技术有着重要的理论实际应用价值,因此一直受到相关专家和学者的重点关注。目前,轮廓计算方法很多,本文将分为轮廓算法、高维空间下的轮廓查询和轮廓更新技术三部分介绍。1轮廓查询轮廓计算的基本观点,就是将所有的轮廓点都求出来。主要有以下几种方法:嵌套循环方法(BNL)[1]、D&C(Divide-and-Conquer)[1]方法、位图方法[2]、索引轮廓查询方法[2]、排序过滤轮廓查询方法SFS(SortFilterSlyline)[3]、最近邻查询方法[4]、基于窗口查询的轮廓查询方法[5]等。1.1BNL和D&C计算轮廓的最直接方法就是将每个数据点p与其他的数据点进行比较,如果点p不被支配,那么它就是轮廓的一部分。BNL方法就是基于这个思想扫描数据文件,将一个轮廓点的候选列表放在主存中,初始的时列表中只有第一个数据点,之后每个点p都通过支配定义来判断该点是不是轮廓点。BNL的应用性很广泛,因为它无需将数据文件排序或索引就可以应用到任意维上。但是它的列表大小可能会超过主存容量,此时,所有溢出的数据点就会被添加到一个临时文件中,这就需要执行多次BNL。而且BNL在渐进性方面有着明显不足,在返回第一个轮廓点之前必须对整个数据集进行读取。D&C和BNL都是Borzsonyi[1]在2001年的ICDE会议上提出的。D&C是将数据集划分为多个分区,然后利用主存算法来分别计算每个分区的局部轮廓,最终的轮廓通过将局部轮廓筛选合并获得。1.2位图方法和索引轮廓查询方法Tan[2]等人在2001年的VLDB会议上创新的提出了位图轮廓查询方法,将所有的信息在位图中编码来确定一个点是否在轮廓上。位图法的效率依赖于位图操作的速度,而且对于每个要检测的数据点来说,必须检索所有点的位图来得到对应位,因此如果不同值的数码非常大的话,空间代价会相当高,所以这种方法很不适合动态数据集的运算。索引轮廓查询方法也是Tan等人同时提出的。它把d维的数据点集分成d个列表,如果在第i轴上的坐标在所有维上是最小的,也就是说对于所有j≠i有pi≤pj,那么将点p=(p1,p2,…pd)放到第i个列表中(1≤i≤d)。这种方法的优点是能够快速返回列表前端的轮廓点,缺点是返回轮廓点的顺序是固定的,因此无法支持用户自定义的优先选择标准。1.3排序过滤轮廓查询方法Chomicki[3]在2003的ICDE会议上提出了BNL的改进方法-排序过滤轮廓查询方法SFS。根据一个优先选择函数首先对整个数据集进行排序,候选点按照分值以升序插入到列表中,因为具有低分值的点可能支配大量的点,因此,使得修剪更有效。SFS算法展现出渐进性的特点,因为数据的预排序能够确保支配点q的点必须在q之前被访问,因此,能够立即将插入到列表中的点作为轮廓点进行输出。然而,SFS不得不扫描整个数据文件才能返回一个完整的轮廓。1.4最近邻查询方法NN是利用最近邻查询的结果来递归划分数据空间,通过查找与原点具有最小距离的点,分别求得轮廓。此方法的查询速度比前几种方法都快,具有渐进性,而且支持在线处理。但是,对于高维数据来说,该方法存在严重的空间重合问题。2高维空间下轮廓查询关键技术然而,随着考虑因素的增加,数据的空间维数和数据集也在