重点:
主题检索有广义和狭义两种所指,在国外多采用其广义所指,我国则多取其狭义。
狭义的主题检索
是指用叙词、标题词、单元词、关键词等表达信息需求而进行的检索。它既不同于用分类号或依类目进行的分类检索,也区别于依被引文献进行的引文检索。 我们所说的主题检索是指这种狭义的主题检索。
主题检索的特点
标题法是最早的一种主题法,它的出现一般以克特于1876年出版的《词典式目录规则》为标志。
标题法是用规范化的自然语言语词作标题,直接表达文献主题概念,按照标题字顺排列,并用参照系统显示标题之间关系的 一种主题法。
标题法优缺点
■标题法具有主题法的共同优点:
■它的主要缺点:
单元词法又称元词法,它是以取自自然语言,经过规范化处理的单元 词作标识,通过单元词的字面组配来表达主题概念的一种主题法。
所谓单元词(Uniterm )是指用来表示文献主题的、最基本的、在概念上不能再分解 的词。
单元词法对标题法的改进主要就是用单元词以后组方式组配表达标题语言中的那些标题。
代表:穿孔卡系统
单元词法的优缺点
优点:
缺点:
在我国又称主题词法,它是以规范化的自然语言语词为叙词, 作为文献主题的标识,通过叙词的概念组配表达主题概念的一 种主题法。
所谓叙词(Descriptor)我国多称主题词,是取自自然语言,经过规范化处理的,以基本概念为基础的表达文献主题的词或词组。
叙词法的优缺点
■优点:
■缺点:
直接以文献中能够表达主题概念的关键词作标识的一种准主 题法。或者说,关键词法是由计算机或人工从文献中抽取关键词作标识,并按字顺排列,提供主题检索途径的方法。
■所谓关键词(Keyword)是出现在文献题名、文摘、正文中,能够表达文献主题,具有检索意义的语词。
■关键词法的主要特点:
叙词法是多种情报检索语言的原理和方法的综合,主要表现为:
在叙词语言采用的多种原理方法中,概念组配是最基 本的原理,它是决定叙词法特点和性能的根本因素。
概念组配
■操作系统接口——操作系统+软件接口
■典型安装——标准化+软件安装
■中国经济难题一一经济+问题+研究+中国
叙词概念的组配类型
■交叉组配
即同级词组配,通常是指两个或多个表达相同性质概念的叙词。例如,参与组配的叙词所表达的都是学科,都是设备,都是动物等。
■方面组配
在一个表示某一事物的叙词与表示事物方面(部分、属性、状态、过程、条件、关系等方面)的叙词之间进行的概 念限定的逻辑推演,结果可形成一个新概念。这 个新概念表示该事物的某一方面或某一特称。
方面组配的范围很广,使用也较自由,绝大多数的叙词组配是方面组配。
■联结组配
其作 用是表示两个或多个事物之间的联系,实际上是方面组配的一种特殊类型。它往往是表达不同事物的叙词 之间用表示它们之间关系的叙词联结起来。
■特称组配
是指用一个表示事物类称的属概念叙词与表达“种差”(即待表达种概念比参与组配的那个属概念多出某种特征)的叙词进行组配。
一般来说表示事物的序词与用来区分事物并表示事物的形状、形式、度量、材料等属性的序词之间的组配属于特称组配,至于表示事物与其所处空间、时间、所属的人物、民族所用的语言等序词的组配,当做特征组配比,当作方面组配更易于理解。
叙词组配的作用主要表现为:
■词类控制
可以作为叙词的主要是表示文献主题中涉及的事 物及事物特征的各学科领域名词术语,包括简单名词(单纯词和合成词)和名词性词组
少量的形容词、数词、副词
■词组控制
词组控制的准则应该是:若将词组分解后用于组配,会影响用户对其含义的正确理解或不符合用户的使用习惯,就不应将词组分解,而应选择词组作叙词,反之,就不应该选择词组作叙词(正式叙词)
■词形控制
叙词法的词形控制主要是指对同义不同形的词优选其中的一种形式作叙词(正式叙词),以避免信息分散而降低检全率,有利于字顺排列。
■同义词的控制
在词义相同而词形不同的语词之间,只能优选其中的 一个作叙词,其余的则可以作为非正式叙词(入口词)收入词表
准同义词的控制
准同义词,是指含义相近或不同,但在标引和检索时没必要予以区分,可以作为同义词处理的那些词。
叙词法的词义控制
主要是对多义词(同一词形表示的多个词义有相关性)、同形异义词(同一词形表示的多个词义之间不相关)和词义含糊而导致理解不一的词进行处理,使叙词的词义具有单一性和明确性。
■叙词词义控制主要采用以下措施:
■词间关系符号
■等同关系词汇控制
■等级关系词汇控制
等级关系
是指上位叙词和下位叙词之间的关系,亦称属分关系。叙词 等级关系是双向显示的。
汉语叙词表中,叙词之间的等级关系参照符号有:
叙词之间的等级关系,主要包括:
■相关关系词汇控制
相关关系的显示是双向的,所用的参照符号只有一个,在汉语叙词 表中用"C"表示相关关系。
相关关系的范围很广,灵活性很大,种类很多,很难严格界定。
字顺表是将众多叙词款目和非正式叙词款目按字顺排列的词汇表
叙词包括普通叙词和专有叙词两大类
■专有叙词的范围较广,如地区索引、人物索引、 机构索引、产品索引等。
■单独设立专有叙词表的目的主要有两个:
1. 压缩字顺表的篇幅,方便从字顺表查词;
2. 便于用户迅速查到所需的专有叙词,不必去词量较多的主表中查找。
轮排索引又称轮排表,是将叙词按其词素的字顺轮流排列到检索入口,使含有相同次数的词集中在一起的。
轮排索引的轮排方式有三种,一种是词外轮排; 二是词内轮排,三是倒置轮排。
■双语种对照索引
是将全部或大多数叙词和非正式叙词与其外语译名相对应,按外语译名字顺排列的索引。我国的叙词表多编制英汉对照索引。
■双语种对照索引的功能:
1. 提供从对照语言的语词字顺入手查词的途径;
2. 帮助查找对照语种文献。
■字顺索引
是将叙词(或包括非正式叙词)按字顺排列,而 不包含叙词款目中的其它项目的一种索引。
■字顺索引的功能:提高主表査词速度
■入口词表
是将非正式叙词按字顺排列,并指出其对应叙词 的索引。
■入口词表的功能:
1. 提高查词速度;
2. 减少选词错误
■范畴索引
是按叙词表全部叙词和非正式叙词所属学科或范畴编制的词汇分类索引。
■范畴索引的功能:
1. 便于从学科或专业角度查找叙词;
2. 用于组织分类主题目录(索引)式的检索工具
■词族索引
是将字顺表中具有等级关系的需 成词族,并按各词族的族首词与 引。
■词族索引的功能:
1. 提供从族首词出发,查找所需侖
2. 借助上位词,下位词和同位词,
3. 方便进行扩检和缩检
■分类表
是指实现分类主题一体化的词表中,与字顺表相配合的分类表,它不同于叙词分类索引。
■分类表的功能:
帮助从学科分类的角度查表选词
形象、直观但编制复杂
环形图、箭头关系图、树形结构图
叙词(主题词)款目的著录项目一般包括:
非正式叙词(又称非正式主題词)款目包括:
款目词的排列
一般按字顺排列
汉语叙词表:
西文叙词表:
■类目(范畴)的设置。一方面应以学科分类为基础,另一方面应该考虑词汇分类的需要。一级类目一般是较大的学科、专业领域,类目细分一般只到二级或三级。
■类目的组织。范畴索引的类目大多是按类目内容的逻辑联系加以组织,类似于等级分类体系,我国的叙词表均是如此。
■类目的标记符号。一般采用层累制
■各类下词的组织。范畴索引收入主表的全部叙词和非正式叙词,附表的词因本身具有明显的范畴划分性质,一般不再收入范畴索引。叙词和非正式叙词只放入每个类系的最下一级类,并在类下按字顺排列。
■收词限制。词族索引只收字顺表和附表中具有等级关系的叙词。 没有等级关系的叙词不收入,非正式叙词不收入。
■词族的确定。族首词应是外延较宽、内涵较浅并且有实际检索意义 的叙词。
■族内词的确定。各词族内的叙词先按等级关系分级排列,并且前置小圆点表示等级:族首词前不加小圆点,二级词前置一个小圆点,三级词前置两个小圆点,依此类推。
■词族的排列。每个词族依其族首词字顺排列,汉语词族索引一般按 族首词的汉语拼音排序。
■译名的范围
一般应收录全部叙词及非正式叙词的译名。但是,如果有些叙词难以找到合适的译名,也允许空缺。
■译名的单复数形式
对于一般科技名词,其英译名依英文习惯,可数名词用复数,不可数或集合名词用单数;对表示学科专业领域、工艺过程以及事 物的性质、状态、特性的词,—般用单数形式。
■译名与叙词的对应关系
两种语言的词或词组之间并不总是一一对应。
■译名的排列
双语种对照索引按译名的字顺排列。一般采用逐词字顺排列法。
■收词范围
轮排索引最好是将叙词表的全部叙词和非正式叙词都予以编排;轮排索引也可以只收词组叙词,不收单词素叙词和非正式叙词。
■轮排形式
轮排索引可以选择的轮排形式至少有三种:词内轮排、词外轮排、倒置轮排。其中,以词内轮排形式采用较多。
■款目包含因素
轮排索引的款目因素,除了被轮排的词之外,可以或多或少地包含这些因素:词在字顺表中的位置、范畴号、参照项、外文译名等。
叙词表又逐歩向功能增强.结构简明的方向发展。
具体表现为:
—般的编表程序为:
总体设计——>制定编制规范——>收集词汇——>整理词汇——>试标引
《信息组织(第三版)》,戴维民主编,高等教育出版社,2014年.
《信息组织(第四章)》PPT