如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
网络资源与信息检索2.1计算机检索基本原理概述2.1.1计算机检索概念2.1.2计算机检索发展2.2计算机检索基本原理2.2.1信息存储2.2.2信息检索2.3文献信息数据库2.3.1数据库的定义和类型2.3.2数据库的构成2.4计算机检索策略2.4.1检索策略构建2.4.2检索策略调整2.1计算机检索基本原理概述计算机检索的优缺点2.1.2计算机检索发展第一个阶段:脱机检索阶段(50年代至60年代)缺点:1.地理上的障碍(远、不便于检索结果的获取)2.时间上的迟滞(定期检索,不能及时获取)3.封闭式的检索(指检索策略一经输入系统就不能更改,更不能依据机检应答来修改检索式)第二个阶段:联机检索阶段三个时期:60年代开发试验;70年代末应用阶段;80年代以后进入信息—计算机—卫星通信三维一体的新阶段,即以信息文献不受地区、国家限制而真正实现全世界资源共享为目的的国际联机信息检索阶段。联机检索阶段优点:1.速度快效率高2.检索范围广泛全面3.检索途径多,方便灵活4.检索内容新,实时性强5.检索辅助功能完善缺点:1.检索的费用高2.检索系统及其文档如数据库收录、标引、特点较难了解熟悉3.检索技术和技巧不宜掌握著名的国际联机检索系统有美国的DIALOG系统、ORBIT系统、BRS系统以及MEDLARS系统,还有欧洲的ESA/IRS系统、英国的BLAESE系统等。这些系统很快发展成为国际性情报检索系统,数据库种类及其检索存储记录都在迅速增加,如:美国的Dialog系统,如今此联机检索系统仍然是世界上最有影响的联机检索系统。第三阶段:光盘检索阶段1983年,出现了一种新的存储器,CD-ROM光盘。光盘检索具有储量极大而体积微小,要求设备简单,可随地安装,使用方便、易于操作,检索费用低(不需要昂贵的联机检索通讯费用),因可随时修改检索策略而具有很高的查全率和查准率等优点。ChemicalAbstractsIndex光盘(1987-1991):由美国化学文摘社与美国剑桥光盘公司联合研制,收录1987-1991年《化学文摘》的全部内容。第四阶段:网络化检索阶段进入90年代,随着卫星通讯、公共数据通讯、光缆通讯技术以及信息高速公路事业在全世界的迅猛发展,计算机情报检索走向了全球大联网。网上资源具有具有信息的时效性、内容的广泛性、访问的快速性、搜索的网络性和资源的动态性五大特点,那么要及时、准确、有效地获取与自身需求相关的实用信息,对所有网络用户都非常具有挑战性。2.2计算机检索基本原理2.2.1信息存储文献标引人员对文献内容进行主题分析,即把文献包含的信息内容分析成若干能代表文献主题的概念,并用词表、分类表等规范化标识的情报检索语言对文献主题进行标引,按所选数据库结构的索引结构输入到计算机进行存储,同时把入选文献中的其他特征标识(标题、著者、文摘、原文出处等)也一起输入计算机,编制成一系列索引数据库,这便是信息的存储。信息存储的内容2.2.2信息检索1、检索者对检索课题进行主题分析、明确检索范围,形成能代表情报需求的若干主题概念。2、把这些主题概念转换成计算机信息检索语言,即用数据库检索工具书对各概念选词和进行逻辑组配,编制成检索提问式。3、用计算机检索系统功能在文献资料数据库中将信息需求主题概念和数据库内文献主题概念标识进行匹配,找到命中文献。计算机检索原理的示意图2.3文献信息数据库的基本概念类型:1.参考数据库:指引用户到另一信息源以获得原文或其他细节的一类数据库。(1)书目数据库(2)指南数据库:亦称指示性数据库。例如,各种机构名录数据库、人物传记数据库、产品数据库、软件数据库、研究开发项目数据库、基金数据库等,均属此类。2.源数据库(1)数值数据库:如各种统计数据库、财务数据库、科学技术数据库等。(2)文本-数值数据库:如某些公司信息库、产品市场报告数据库、读物数据库和物性数据库等。(3)全文数据库:指存储文献全文或其中主要部分的一种源数据库,简称全文库。(4)术语数据库:指专门存储名词术语信息一种源数据库,各种电子化辞典也包括在内。(5)图像数据库:主要应用于建筑、设计、广告、产品目录、图片或照片等资料类型的计算机存储与检索。2.3.2数据库的构成从使用观点来看,数据库主要由文档、记录、字段三个层次构成。1、文档若干个逻辑记录构成的信息集合称为文档。用户选择所需的联机系统数据库时,多数数据库以单一的文档编号出现。此时文档的概念和数据库相当。但有些数据库因规模庞大,被分成若干个文档。例如,在DAILOG系统中,CASearch数据库被分成308号(1967-1971),309号(1977-1981),311号(1982-19