计算机信息检索1.ppt
上传人:yy****24 上传时间:2024-09-10 格式:PPT 页数:53 大小:2.3MB 金币:16 举报 版权申诉
预览加载中,请您耐心等待几秒...

计算机信息检索1.ppt

计算机信息检索1.ppt

预览

免费试读已结束,剩余 43 页请下载文档后查看

16 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第三章计算机信息检索第一节计算机检索概论手工检索:手工检索的特点(和计算机检索相比较):优点:1.发展早,可检索的时间范围广2.所有内容都呈现在读者面前,容易对比并发现新的线索计算机检索的特点二、计算机检索系统:检索者,检索终端(PC机,同时也是输出端),网络(或通信电缆),数据库存储服务器三、计算机检索系统的类型光盘信息检索系统:数据存储在光盘(一种用激光记录和读取信息的盘片),通过检索软件,利用计算机和光盘驱动器进行检索。可形成光盘检索网络。网络化(internet)信息检索系统:同联机检索系统的主机和用户终端的主从关系不同,客户机和服务器是对等的关系四、计算机检索的发展五、计算机信息检索的方式计算机信息检索的方式检索课题在前面的课中讲过电子型信息资源,包括机读数据库(网络数据库、光盘数据库)和网络信息资源等。它们是计算机化信息检索系统的主要处理和查询对象。1、数据库的相关概念:2、文献数据库的结构文档1(file):一张表就是一个文档文章号字段:如在数据库中题名、作者、作者单位、期刊名、摘要、全文等等均是字段;一条记录由多个字段值组成;对计算机检索来说字段相当于检索入口。如:3、数据库类型:按存储数据的类型分:数值型、事实型、词典型、书目型、全文型按存储的介质分:光盘数据库:数据存储在计算机的光盘或光盘塔上,因而存储量有限,更新速度慢网络数据库:数据存储在服务器的硬盘上,存储量大,更新速度快按照国际上通用的分类方法:参考数据库(referencedatabase):如书目数据库、文摘数据库,获得的数据为reference源数据库(sourcedatabase):如全文数据库,数值型数据库,可直接获得原文资料或数据混合数据库(mixeddatabase):兼有以上二者主要包括以下4类成员:1、传统从事文献及其报道工作的学术团体与学术机构例如:美国化学文摘社CAS国际电子电气工程师协会IEEE美国生物科学情报社BIOSIS美国科学情报社ISI2、政府机构例如:美国技术情报服务处NTIS美国国家航空航天局NASA美国专利商标局USPTO3、私营公司例如:英国Derwent公司美国Knight-Ridder公司MeadDataContralOVID公司SilverPlatterInformation,Inc.4、传统新闻/出版机构例如:德国Springer出版社美国JoinWiley电子出版公司荷兰Elsevier科学出版社5.数据库文档的组织方法5.数据库文档的组织方法第二节计算机检索方法限制符:In(模糊限制)Heartinti(篇名)山西in地址(ad)=(精确限制)LA=Chinese(语种)PY=2009-2010(年限)常见的基本索引字段常见的辅助索引字段:二.布尔逻辑检索1.逻辑与:“AND”或“*”定义:逻辑与是一种用于交叉概念或限定关系的组配,检索结果必须同时满足逻辑算符前后所列的条件。作用:可缩小检索范围,提高查准率。要求:运用时,把出现频率低的检索词置于“与”的左端,可使否定答案尽早出现,节省机时。2、逻辑“或”:OR;or;+3、逻辑“非”:NOT;not;-如果一个检索式中包含若干逻辑关系,则其执行优先顺序为:NOT,AND,OR办法是将需先执行的部分放在括号内逻辑算符的不足三.位置算符检索常用的位置算符如SCI库中的位置算符为same,要求所连接的词必须同时在一个句子中或一个字段中。又如Dialog系统中(W)或()算符:词序不许颠倒,两词之间不许插词,只许空格或连字符号词组检索,SCI中为双引号例?Ssolar()energy检出solarenergy四.截词检索1、考虑同义词或近义词(使用布尔逻辑符or连接)2、选择较大检索范围的字段如摘要3、使用截词符4、使用上位词(如飞行器航天飞机载人航天飞机)缩小检索范围,提高查准率的方法:检索结果为“0”的现象检索结果非零的理由实例-查新对检索结果的要求检索结果的非“0”化处理方法检索结果的非“0”化处理方法以查新项目“新型框链结构除渣机”为例检索技巧检索技巧利用主题词表中的等级词检索技巧检索技巧检索技巧检索技巧小结