如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
信息资源的主题组织语言本节学习目标一、主题组织1.2主题语言主题是指信息对象所表达或反映的主要内容、问题或事物。按照信息所表达的中心问题数量的多少,主题可以分为单主题和多主题两种类型。主题词是用于描述、存储、检索信息主题的受控词汇,是主题表中能够表达一定意义的最基本词汇单元。主题词的选用主要依据三个方面:出现频率、引用频率和查找频率。主题词分为单元词、标题词、关键词和叙词。将主题词按一定方式、规则组织成的词汇表称为主题词表。主题语言的要素:1语词标识采用自然语言中的但经过控制的名词术语作为描述文献主题的标识。2字顺系统汉字字顺系统主要有音序和形序3主题检索工具根据主题语言原理编写的各种主题检索工具,如主题目录、主题索引、计算机中的主题词倒排档等。二、主题语言1单纯参照反映同义关系“见”、“见自”2相关参照具有等级或相关关系而又是正式使用的标题词之间的参照“参见”、“参见自”例:电脑(非正式)见电子计算机见(正式)电子计算机(正式)见自电脑见自(非正式)海洋学(上位)参见海洋地质学参见(下位)海洋地质学(下位)参见自海洋学参见自(上位)海关法(相关)参见关税法参见(相关)2.2单元词语言单元词是从文献里抽取出来的并经过控制处理的,能表达文献主题最小、最基本的在概念上不能再分解的,并能独立地描述文献所论及或涉及的事物——主题的词汇单位。单元词可以是一个单纯词,如“山”、“水”、“玻璃”、“马克思”等,也可以是一个合成词,如“文字”、“铁路”、“污染”、“强度”、“隔音”等。这些词的共同特点是概念上不可分。单元词只是构成“标题”的构件,它们本身绝大部分不是具体的标题,或者说只是一些不符合“直接地、精确地表达文献主题”这一基本要求的“标题词”。若干单元词的相互组合或组配,才能构成一个专指标识,精确表达文献主题或检索课题。例如:单元词法是一种后组式语言。标题法只能选择一种标题形式作为正式标题,而单元词法不存在词序问题,组成标题的每一个单元词都可以作为检索入口,并且利用对单元词的增加或减少可以进行扩检或缩检。单元词法主要采用字面组配,误检率较大。2.3叙词语言叙词语言是以受控的自然语言词汇作标识,主要以标识的概念组配来表达主题概念的一种后组式主题语言。我国又称为主题词语言。叙词法主要采用概念组配。叙词法特点:1直观性强直接以规范化了的自然语言——叙词作为标志符号2专指性强直接从论述和研究的具体对象和问题出发选词,采用叙词组配3适应性强随时加以增设修改4灵活性强采用后组式概念组配方法5多途径检索同一主题文献6查找迅速采用字顺排列方式7叙词表编制和建立了叙词语义关系的网络结构(叙词字顺索引的参照系统、叙词范畴分类系统、叙词等级系统、叙词词族图等),加强了叙词法的学科系统性和族性检索作用。字面组配与概念组配的区别2.4关键词语言关键词指在文献的标题、摘要或正文中出现的、对表达主题内容具有实质意义、能作为检索入口的、具有关键性描述作用的词汇。关键词语言是自然语言,直接取自文献的题名、文摘等,或者取自全文,除了一些冠词、介词、副词或连词外,凡在概念上有意义的词都可用做关键词。关键词索引的主要类型有普通关键词索引、题内关键词索引、题外关键词索引、词对式关键词索引、双重关键词索引等。实例:计算机在神经生物学与行为学中的应用题内关键词索引(Keywordincontextindex,KWIC)又称上下文关键词索引。关键词保留在文献题目内,关键词的上下文和词序都不变。在编制索引款目时,每个关键字按字顺轮流做检索标目,排在版面的固定位置,用黑体字表示为作为标目的关键词,上下文也随之移动位置。题外关键词索引(Keywordoutofcontextindex,KWOC)也称上下文索引,针对KWIC提出的改进形式。编制原理和单纯关键词索引基本相同,不同的是把文献中抽出的关键词轮流放在题目、号码前面。标题词是一种先组式语言,单元词、叙词、关键词是后组式语言。先组式语言:检索前检索词已被固定关系组配好,并编制在词表中。检索时,用户只能根据词表去查找信息,不能任意组配。具有较高的专指性,但灵活性差。后组式语言:检索前检索词在词表中未被组配,检索时用户可根据不同的检索需求对某些词任意组配。国内主题语言应用:汉语主题词表中国分类主题词表国外主题语言应用:医学标题表MeSH(medicalsubjectheadings)三、关键词法在网络信息组织中的广泛应用关键词法的应用最突出的当属搜索引擎!搜索引擎的检索功能主要有:简单关键词高级关键词布尔检索逻辑与、或、非(AND、OR、NOT)精确检索(词组检索)“”模糊检索关键词的同义词、近义词等截词检索“*”