资源编目与规范


浅析利用MARC格式进行网络资源编目


[摘要]探析了网络环境下MARC格式的结构、特点和编目的优势及实际应用。

[关键词]MARC格式元数据网络资源编目

[分类号]G254.36

  随着网络技术的发展及Internet的广泛应用,网络信息资源的动态性、分布性、多元性和无序性的特点,使网络资源的组织、整理、查找等问题日益突出,在此背景下元数据这一概念被提出。所谓“元数据”,就是关于数据的数据,是一种用来描述数字化信息资源,特别是描述网络信息资源的基本特征及相互关系的数据格式。其中MARC格式就是在图书情报界得到广泛认可的发展比较成熟的一种元数据。面对网络资源的冲击,图书馆员能否利用自身优势运用既有的模式及系统来组织整理网络资源,实现书目控制,已成为一个重要的研究课题。

1 MARC格式的结构与特点

  MARC是经过近50年的发展广泛用于图书馆描述、存储、交换、控制和检索的一套机读书目数据标准格式,其结构严谨,类目复杂,而且系统完善,具有严格的语义规则和完整的信息描述字段,能够精确完整地描述信息资源。MARC格式主要由3部分组成:头标区、目次区、数据区。头标区位于每条记录的开端,共有24个字符长度,提供此记录的必要参数;目次区是MARC记录中每个可变长字段的索引,由一系列固定长数据项目组成,包括每个可变长字段的字段标识符、字段长度和字段起始字符位置,每项12个字符位,在终端上不显示;数据区由多个可变长字段组成,每个字段间由字段分隔符隔开,是著录资料信息的具体体现。MARC格式的著录就是将图书馆的各种信息资源进行综合分析处理,提取主要的信息要素,按一定的规范格式组织起来,提供给人们检索,数据可利用能生成ISO-2709格式的各种软件来制作。为适应网络的发展,图书馆的MARC格式不断进行调整增补。一方面,增补新字段“307文献检索或获取时间”、“357文献传播控制”、“856电子信息检索手段”等,并对文献检索/下载所需时间、用户获取权限、文献传送最大/最小数据量、网络信息格式、文件大小、仿真终端等一一提供描述。另一方面,扩充原有字段的内涵,在“500一般附注”、“516计算机文档或数据类型注释”、“520摘要等注释”等字段中对网络信息的格式进行描述;在“538系统细节附注”字段中还在与信息源相链接时,对用户系统配置的要求进行了描述。特别是增加的856字段记载了主要记录被著录的数字对象或与之相关的其他电子资源的存储地址和存取方式,为可重复字段,包含有27个子字段,从而建立了从书目记录到全文、多媒体电子资源的链接,为网络资源或者说是数字资源的著录编目提供了广阔空间,开创了编目的新时代,也为读者检索提供了极大的便利条件。MARC格式编目的环境主要基于联机公共查询目录,而联机公共查询目录是广大读者最熟悉最常用的检索工具,它提供了对不同形式信息资源的公共检索,从单一的检索点,用户可以检索多重图书馆目录,并能够存取以不同物理形式存在于本地和世界范围内的信息资源。目前许多联机公共查询目录已经升级为具有网上公共检索目录的功能,就是说只要点击书目记录中的链接,就能直接连上网络资源,在网络技术上也为MARC格式揭示网络信息资源铺平了道路。同时,为了促进MARC格式在网络环境中得到进一步的应用,美国国会图书馆研究制定了MARCDTD(文献类型定义),使得基于国际标准ISO2709格式的数据能自动转换到基于ISO8879SGML格式上,适用于各类网络软件的浏览器。

2 MARC用于网络资源编目的优势

  鉴于目前网络资源数量庞大质量不一的特点,编目专家提出不同性质的网络信息资源应由不同的元数据进行描述,美国编目专家就此还提出了四种编目技术:①完整的编目(传统编目);②完整的都柏林核心;③简化的都柏林核心;④依靠未结构化的全文关键词检索。因此MARC格式不能适用所有的网络资源编目,同时网络环境下编制MARC格式数据还存在编目速度慢、经济成本高等问题,为此许多图书馆都采取限制著录对象和著录范围的方式,只将具有较高学术价值,题名、责任者等主要著录信息明确,网址稳定并具有永久保存价值的网络资源作为编目对象。据编目专家Dillon推测,在大量网页中(约10亿),有100万网页值得传统编目,编目数量仍是非常可观的。当前图书馆既要顾及传统印刷型馆藏资源,又得兼顾网络环境下的电子资源,因此立即要图书馆的编目人员抛开已往的作业方式,完全采用新的描述语言,所牵涉的问题会相当广泛。由于MARC格式是长期制定和控制良好的标准,具备成熟的结构,规范的标识,格式上的及时调整以及目前世界各国图书、情报、出版部门已建有的庞大的机读数据库,这些都是将MARC格式推广为通用标目模式的优势所在。具体优势表现为:

2.1 标准的通讯格式

  MARC格式是整个图书馆行业内的通行标准,其主要目的在于加强信息的交流,允许各类系统共享信息,允许一个系统替代另一个系统而仍能保证数据可以兼容。

2.2 适用于各种著录级别的简洁记录结构

  MARC提供了一种单一而简洁的记录结构,允许对信息进行不同级别的灵活著录。每条记录包括三个元素,可从最基本的书目资料如作者、书名、出版者的描述到最复杂的书目资料描述。

2.3 灵活的显示格式

  一旦MARC数据进入本地系统内,就可以根据不同的目的编写形成MARC记录的程序。在图书馆的OPAC中人们能够选择不同的格式显示同一条书目记录,同一条书目记录因为不同的目的,可呈现MARC格式的或者卡片式的书目记录等。

2.4 多种检索点

  所用的联机公共目录可以支持复杂检索,除可用关键词、作者、书名、标题检索,还可用资料的类型、语种、国家、出版日期做限制词。

2.5 完整书目的著录

  基本的书目资料包括作者、书名、版次、出版项、附注、摘要、标题、资源的电子位置,使用者可从这些著录中很精确地找到所要的资源。

2.6 整合各种资源到图书馆的目录

  随着Web-interfaced OPAC的发展,只要Internet上的资源被编目,使用者就可从OPAC中同时查到馆藏及Internet上的资源。同时在标准的规范下,数据可以进行交换,也促进联合编目的发展;而透过同一界面,读者可以从一个检索系统获得各种不同形式的资源,这是实现网络信息资源与传统信息资源一体化检索的最简单方法。

2.7 得到保证的公共检索

  当大众用户通过其他方式无法承担拥有和检索网络的费用时,他们可以利用图书馆获取Internet资源编目的公共存取。

2.8 扩充了图书馆馆藏

  在经费有限、馆藏资源需要补充的情形下,由图书馆员整理网络资源也是开发馆藏资源的重要方法。从将网络资源放到图书馆主页上转向放入书目数据库中,这也是图书馆观念的一大转变。图书馆馆藏不仅仅是现实馆藏,还包括购买了访问权的信息资源,如网上电子期刊、网络数据库等,网络信息资源编目将成为图书馆业务工作的新热点。

2.9 网络资源质量得到保证

  经过编目人员过滤、筛选的信息,具有可靠性、完全性和精确性,同时具有的书目描述、权威控制、主题分析等特点使网络信息资源得到深层次的揭示和严密的组织,尤其是在检索点的选取原则上,能确保其数据元素组成具有统一性,有利于资源交换。因此,MARC格式是一种质量很高的元数据格式。网络资源编目的探索与实践

  针对上述MARC结构的特点及编目优势,国内外图书馆已开展了以传统的MARC格式对一些重要网络资源进行编目的计划,比较有代表性的有:

3.1 OCLC已开始实施了一项“给因特网编目的InterCat”研究计划,通过应用USMARC格式和AACR2标准对网上信息资源进行编目,并已形成有关工作标准。InterCat的数据库已编有记录92000条,每条记录都提供了因特网存取信息,通过点击“Electroninc Access”即可链接到相应网络信息资源。利用这个方法图书馆可以将馆内OPAC系统与Internet上的电子资源相结合,读者可以WWW环境检索网上公共目录,同时以超文本方式浏览全文文件。OCLC计划的实施验证了MARC格式对因特网资源编目的必要性和可行性,同时也带动了世界范围内网络信息资源组织工作的推广与开展。

3.2 随着网络数据库的引进,电子资源已成为图书馆开展电子信息服务的重要基础。由于各个库收集的电子资源分布在不同的数据库,没有统一的分类体系和检索界面,为了有效地对数据库进行更好地揭示,国外许多图书馆已经将数据库中离散的电子资源整合到图书馆的书目数据中,并在书目记录中提供链接点,在图书馆OPAC中得以展现,向用户提供统一、全面、灵活、多途径的检索平台,极大地提高了电子资源的利用率。我国这方面工作虽然刚刚开始,但也迈出了可喜的一步。像西安交通大学将引进的5个外文数据库中6000种电子期刊全部进行了编目,实现了电子期刊在OPAC中与对应数据库链接,利用OPAC直接链接到电子书刊全文,无纸本的电子期刊也可在馆藏目录中同时查询。与图书馆馆藏的整合通常可通过数据的上传和下载实现。数据库与图书馆纸本馆藏链接整合,既便于读者在图书馆的各种馆藏资源中串联,弥补单一馆藏管理的不足,从而迅速有效地检索、获取所需文献信息,又便于图书馆充分有效地揭示与利用其纸本与电子馆藏。这种方法相当简单且构建成本低,非常适合一般图书馆使用。以这种方式提供的服务,原有的图书馆检索服务并不受影响,而且对图书馆来说拥有的资源大增,同时所提供的检索环境也大幅改善,用户能够更有针对性地利用网络资源。这种利用现有的图书馆技术和程序生成的数据记录,已成为图书馆组织网络信息资源的一种有效方式。

3.3 由于MARC格式规范,数据结构紧凑,同时用户能够通过书目链接建立信息对象与其相关的对象之间的关联,为人们提供了一种立即可以获得的工具,它将重要的相关的高质量的数字资源与图书馆目录以统一体的方式集成在一起,使用户能够综合利用各种与其相关的信息资源。如深圳大学图书馆通过856字段的著录,将书目记录与相关的文本数据、图像数据、声音数据、数字数据、应用程序、系统程序、字符数据等相链接,对馆藏数字化信息资源实行书目控制。读者通过任何一台上网的电脑,利用书目检索系统,就可以在线(或下载)阅读欣赏相关的全文、书评、文摘、音乐、影视、图表、字画等数字化信息。目录体系出现了立体化的改变,这种对数字化文献所进行的目录体系的改革可供借鉴。例如读者在馆藏书目中查询“红楼梦/(清)曹雪芹,(清)高鹗著;周书文点校”一书,从查询结果中不仅能了解到《红楼梦》详细的书目信息,而且能了解其相关资源信息,分别点击相关资源中的链接点,便可以在校园网上阅读《红楼梦》的网络版电子全文图书、欣赏电影插曲或电视剧等。由于多数数字化资源都有对应的纸本文献,而且在相当长的一段时间内两者将会并存下去,将数字文献与对应的纸本文献集中整合形成种类上相互联系、形式上相互补充的合理结构,有助于广大读者充分了解内容丰富、形式多样、层面深入的相关信息,这已成为提高馆藏利用率的重要途径。

  总之,现代图书馆的馆藏资源早已超越原有的馆藏范围,网上资源已成为图书馆开发利用的重要内容。MARC格式在未来的发展中仍有不可替代的作用,这也是图书馆界参与网络资源组织整理的重要举措。

参考文献:

1 Sha,Viann T.Cataloging Internet Resources:The Library Approach[J].The Electronic Library,19955

胡小菁.OPAC揭示网络信息资源探析[J].大学图书馆学报,20014

刘嘉.元数据导论.北京:华艺出版社,2002

赵小娟.深圳大学图书馆网络化之探索.广东图书馆学会2002年学术年会,2002

朱蓓.网络信息资源的编目模式[J].图书馆杂志,19993

樊晓红 女,大学本科毕业,馆员,发表论文多篇。

(收稿日期:2004-02-09;责编:张欣。)

你可能感兴趣的:(工作,数据库,网络,library,internet,出版)