如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
您的论文得到两院院士关注软件时空文章编号:1008-0570(2007)11-3-0237-02基于本体的智能检索系统的研究ResearchinIntelligentSearchSystemBasedonOntology(南京工业大学)张柳松ZHANGLIUSONG摘要:由于传统的搜索引擎是基于关键词的检索,检索结果无论是在召回率还是在精确度上都不能令人满意,然而基于本体的智能检索系统是以概念语义为核心来实现信息检索,能改善传统的搜索引擎在语义理解方面的不足。关键词:智能检索;本体;概念语义中图分类号:TP391.3文献标识码:AAbstract:Manytraditionalsearchenginesarebasedonkeywords,theresultcannotbesatisfyingintheprecisionorintherecall.However,theintelligentsearchsystembasedonontologytakesthesemanticasthecoretocarryouttheinformationsearch,whichcanimprovetraditionalthesearchengineinthesemanticunderstanding.Keywords:Intelligentsearch,Ontology,semantic技1引言③系统和用户能进行某种程度的互操作,以满足用户查询信息的需求。进行查询时,如果户对查询结果不满意时,可以要术随着Internet的迅速发展,WWW已经成为世界上最大的求进行重新查询,直至获得用户满意的信息为止。信息库。如何有效的从中获取有用的信息,已成为困惑我们的④支持对检索结果的多种排序方式,如按时间排序和按与创一大问题。查询条件的相关程度排序。按相关程度排序是指通过某种相关现有信息搜索技术可分为类主动式搜索基于技3:,Push度计算方法,把最贴近用户需求的信息以较为显著的形式展新术的信息获取以及搜索引擎方式。上述3种检索机制在最终实现出来。现上都基于关键词的全文匹配或是基于主题分类。虽然Google搜索引擎在传统信息检索的基础上,增加了有关WWW文档的3智能检索系统的设计流程超链接分析,取得了一定的效果,但从本质上看,仍然属于关键3.1对领域本体的构建词检索的范畴并没有从根本上解决检索过程中语义信息缺乏,本体是由特定信息领域中的术语集合及术语之间的关的问题。此类检索无论从召回率还是精确度上都不能令系组成的,本体和本体之间的关系是由相关的领域专家建立人满意。的。本体可认为是语义丰富的元数据,它可获取存储数据的本文介绍一种基于本体的以概念语义为核心的智能检信息内容。在信息获取中,在本体和知识库之间建立某种映索技术。射关系,利用本体的特性使查找的信息内容更加清晰2智能检索系统介绍有条理。设计智能检索系统,首先要建立本体库。本体库是智能搜智能检索是对传统检索的改进,在其信息检索过程中,引索引擎的信息组织框架,在原始信息的收集、资源对象元数据入对查询对象的概念语义信息的处理,通过自动查询扩展和语的提取和信息检索都需要以领域本体为基本依据。义分析等处理操作,提高信息检索算法的查准率和查全率,改本体建立应该说可以分成自顶向下和自底向上两种,两者善了信息检索系统的性能。各有优势。但是似乎目前更多的做法是自顶向下的,就是先建作为一个智能检索引擎,应该具有以下区别于传统检索系顶层本体,再一步步扩展,直到能涵盖该领域为止。统的功能:在具体构建本体过程中,我们可以选择由美国Stanford大①具有一定的语义分析和推理、自动查询扩展等功能。能学开发的本体编辑器。它也是基于知识的编辑器,是用根据用户的查询条件进行相应的语义扩展和推理处理,以返回Protégé开发的一个开源项目,是我现在能下到的最新更多用户所关心的信息,提高系统的查全率和查准率。JavaProtégé3.2版本。②仅面向某个专业领域,以提供关于该领域全面的、准确在编辑器中,本体结构以树型的层次结构显示,用的专业信息。因为构建本体是比较繁重的工作,只可能涉及某Protégé户可以通过点击相应项来编辑或增加类、子类、属性、实例等本一个专业领域,这样才能尽可能的包括该领域所有的概念及其体元素,另外,用户可以不用考虑具体的本体描述语言,而在概相互之间的关系。念层次上设计领域本体模型。张柳松:硕士研究生本人使用Protégé构建的“计算机”的本体框架(部分)如《PLC技术应用200例》邮局订阅号:82-946360元/年-237-软件时空中文核心期刊《微计算机信息》(管控一