信息检索1.doc
上传人:yy****24 上传时间:2024-09-10 格式:DOC 页数:4 大小:20KB 金币:16 举报 版权申诉
预览加载中,请您耐心等待几秒...

信息检索1.doc

信息检索1.doc

预览

在线预览结束,喜欢就下载吧,查找使用更方便

16 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

关于网络信息检索的研究【摘要】目前制约网络信息检索技术发展的瓶颈是图像音频视频检索、汉语自动切分、搜索引擎缺陷等,本文分析了我国网络信息检索中存在的问题,针对这些问题提出了解决的办法及对策。【关键词】网络信息检索问题对策人类社会已进入信息时代,以科学技术为核心,计算机为载体,利用信息技术生产、加工和传播知识,进行财富的创造,成为这一时代的主流与特征。信息技术的发展,互联网的出现及其迅速发展,大大改变了人们的生活,人们进入了数字化的时代。电子商务、电子邮件、电子交易与电子文件等互联网产物的出现,给我们带来的不仅仅是进步与方便,问题也如影随形。1.当前网络信息检索存在的问题随着互联网的强势发展,网上庞大的数字化信息和人们获取信息能力之间的矛盾日益突出。以“超链”为基础的当前搜索引擎技术虽然在搜索速度、针对多种语言信息的扩展等方面有所改进,在以自然语言为查询语言方面也做了些探索,然而新世纪的网络检索同样面临着新的障碍,具体表现在:(1)网络信息泛滥,良莠不齐网上言论自由,出版自由在给因特网带来繁荣的同时,也导致了信息爆炸。网络上的信息资源不计其数,基本上涵盖了人类知识的各个方面,信息资源的类型又非常庞杂。由此带来了信息无序,无用信息参杂其间,垃圾信息、虚假信息、冗余过时信息以及政治反动信息、种族歧视信息增加了信息的不确定性和用户的不安全。(2)检索对象单一目前部分搜索引擎还不能支持对多媒体信息的检索。当跨入2l世纪后,由于计算机加工处理和存储能力的提高以及数据传输带宽的增加,对于数据量高速增长的视频、音频等多种媒体信息的统一检索已成为亟待解决的问题。(3)不能满足个性化需求网站信息雷同、垃圾信息增多,不能满足不同群体或用户个体的个性化需求。而且现有大部分信息检索系统采用关键词输入方式进行检索,对任何用户都是一种模式,使得用户无法准确地表述自己的需求。造成上述信息检索困难的原因实质在于搜索引擎对要检索的信息仅仅采用机械的词语匹配来实现,缺乏知识处理能力和理解能力。也就是说,搜索引擎无法处理用户看来是非常普通的常识性知识,更不能处理随用户不同而变化的个性化知识。总的说来,搜索引擎的智能化程度不够。(4)检索功能单一,缺乏灵活性目前许多搜索引擎的查询方法比较单一,一般只提供分类查询方式和关键词查询方式,不能从文献的多个方面对检索提问进行限制,只能就某一关键词或者概念进行笼统的检索。(5)网页覆盖率低作为搜索引擎必须占有相当大的信息量才能具有一定的查全率和实用性。目前还没有一种覆盖整个互联网信息资源的搜索引擎。国内外的研究表明,尽管网络搜索引擎发展迅速,规模越来越庞大,其覆盖范围却难尽如人意。无效链接和更新周期的限制,使得网络存在大量过时信息,想要进一步获取信息并非易事。不能满足个性化需求网站信息雷同、垃圾信息增多,不能满足不同群体或用户个体的个性化需求。而且现有大部分信息检索系统采用关键词输入方式进行检索,对任何用户都是一种模式,使得用户无法准确地表述自己的需求。造成上述信息检索困难的原因实质在于搜索引擎对要检索的信息仅仅采用机械的词语匹配来实现,缺乏知识处理能力和理解能力。也就是说,搜索引擎无法处理用户看来是非常普通的常识性知识,更不能处理随用户不同而变化的个性化知识。总的说来,搜索引擎的智能化程度不够。2.解决网络信息检索中问题之对策(1)机器智能化这是网络信息检索未来的主要发展方向智能检索是基于自然语言的检索形式。机器能够根据用户所提供的以自然语言表述的检索要求进行分析,而后形成检索策略进行搜索。(2)检索高效化检全率指搜索引擎提供的检索结果中相关信息文档数与网络信息中存在的相关信息文档之比。检准率是搜索引擎提供的检索结果与用户信息需求的匹配程度,也是检索结果中有效信息的文档数量与搜索引擎提供的全部文档之比。在检索信息特别是专业信息时利用关键词检索很困难,其命中记录数很多不易查准,如果进一步限定则命中记录又很容易漏检。解决这个矛盾可以利用相关的数据库,做到两者兼顾,相互制约,彼此约束。为了查全,先在一个限制较少的数据库中尽可能全地检索该主题;为了查准,在另一个数据库中用在上一个数据库中出现较多的内容进行检索,最后用相关检索词进行限定,从而得出准确的文献记录。从另一个角度看,网上检索必须以数据格式的标准化为前提,各检索系统应该具有规范控制,包括主题规范、名称规范,从而保证检索的查全率和查准率。(3)操作简单化未来家用电脑将朝着智能化、网络化、人性化和绿色环保方向发展,操作系统的用户友好性将不断增强,如微软和苹果公司都在致力于操作系统网络化研究,以便使其中的任一应用程序都能进行网络检索,更加“傻瓜化”方便用户及时准确地检索信息。(4)信息多媒体化多媒体信息系统超越了传统的数据库系统,网