1 什么是DOI
国际数字对象识别号基金会(International DOI Foundation)是成立于1998年的非营利组织,它是 DOI 系统的行政主体,目的在保障与 DOI 系统相关的知识产权,推广 DOI 的运用,并确保 DOI 系统的一切改进(如创造、维护、注册、解析与相关决策)能为全体注册者使用。DOI系统于2012年正式发布为ISO国际标准,成为全球通用的数字资源标识、链接标准。
数字对象识别号(Digital Object Identifier,简称DOI)是一套识别数字资源的机制,包括的对象有视频、报告或书籍等等。它既有一套为资源命名的机制,也有一套将识别号解析为具体地址的协议。发展 DOI 的动机在于补充URI之不足,因为一方面 URI 指涉的URL经常变动,另一方面,URI 表达的其实是资源所在地(即网址),而非数字资源本身的信息。DOI 能克服这两个问题。一个 DOI 识别号经过解析后,可以连至一个或更多的数据。但识别号本身与解析后导向的数据并不相干,也可能发生无法取得全部数据,只能得到相关出版品信息的情形。DOI 的解析协议见诸 RFC 3652,RFC 3651 描述命名机制,RFC 3650 描述的则是其架构。DOI 通过 Handle 系统解析识别号,但实际应用上大多是通过网站解析;例如连进网址 http://dx.doi.org/10.1007/s00223-003-0070-0 ,就能看到对应识别号 10.1007/s00223-003-0070-0 的论文信息或全文。
2 原理
2000年1月由12 家世界顶尖学术出版商联合成立了非营利组织———出版商国际链接协会(简称PILA),负责对CrossRef 进行管理并为成员出版商提供链接服务,提供的链接服务可以从论文的参考文献直接链接到被引用论文的摘要或全文。其原理是:当出版商在线生成了一个数字化对象时,由国际DOI 基金会(简称IDF)负责提供一个唯一的、永久的DOI ,它与该数字对象存放的具体位置无关。
3 DOI的形式:DOI 的编码方案(即美国标准ANSI/NISO Z39.84-2000)规定,一个DOI由两部分组成:前缀和后缀,中间用“/”分割。对前缀与后缀的字符长度没有任何限制,因此理论上,DOI 编码体系的容量是无限的。
DOI前缀由两部分组成,一个是目录代码,所有DOI 的目录都是“10.”,即所有DOI 代码都以“10.”开头。另一个是登记机构代码,任何想登记DOI 的组织或单位都可以向IDF 申请登记机构代码。登记机构代码的分配也是非常灵活的,如一个出版商可以为其所有的信息资源只申请一个前缀,也可以为其数字图书、音像制品各申请一个前缀。DOI 后缀是一个在特定前缀下唯一的后缀,由登记机构分配并确保其唯一性。后缀可以是任何字母数字码,其编码方案完全由登记机构自己来规定。后缀可以是一个机器码,或者是一个已有的规范码,如ISBN 号或ISSN 号。
举例明之,以下是一个典型的 DOI 识别号:10.1006/jmbi.1998.2354其中的「10.1006」是前缀,由国际数字对象识别号基金会确定。其中,「10」为DOI目前唯一的特定代码,用以将DOI与其他采用同样技术的系统区分开;「1006」是注册代理机构的代码,或出版社代码,用于区分不同的注册机构。后缀部分由资源发布者自行指定,用于区分一个单独的数字资料,具有唯一性;以书籍为例,它可能是国际标准书号。发布者可以选择以何单位进行注册,例如,一本书可以注册单一的 DOI,也可以依各章节分别注册,甚至独立注册其中的一个表格或图片。
4 注册代理机构
目前DOI有10个注册代理机构:
华艺数字(台湾) - 网站http://doi.airiti.com/
CNKI(中国知网) - 网站http://www.cnki.net/
CrossRef(美国) - 网站 (世界上最大的注册代理机构,只提供学术资料)https://www.crossref.org/DataCite (德国) - https://www.datacite.org/
Entertainment Identifier Registry EIDR (美国) - http://eidr.org/
mEDRA (欧洲) - http://publications.europa.eu/
OPOCE (Office des publications EU) (欧盟) - 网站http://publications.europa.eu/
R.R. Bowker(美国)http://www.bowker.com/index.php/component/content/article/1/5
中国科技信息研究所(2007年3月至2011年11月由下属公司万方数据代行职责) - 中文DOI http://www.doi.org.cn/portal/index.htmJapan Link Center(日本)
5 优点
唯一性:DOI标识符作为数字化对象的识别符,对所标识的数字对象而言,相当于人的身份证,具有唯一性。这种特性保证了在网络环境下对数字化对象的准确提取,有效地避免重复。
持久性:一个数字化对象的DOI标识符一经产生就永久不变,不随其所标识的数字化对象的版权所有者或存储地址等属性的变更而改变。
兼容性:DOI标识符的兼容性体现在DOI号码的后缀中可以包含任何已有的标识符,例如国际标准书号ISBN,国际标准刊号ISSN,国际标准文本代码ISTC,出版物件标识符PII等。
互操作性:DOI的处理系统可以与任何因特网上不同的计算机操作系统在处理同一数据时能保持一致,能与不同时期的技术系统兼容。
动态更新:DOI系统可对其元数据、应用和服务功能进行快速和简便的动态更新。
6 DOI用途
DOI的作用很多,总结起来大致有以下几个方面:
1. 有助于实现链接的本地化,可以把中文DOI系统作为本地化链接方案的一部分,通过提供指向馆藏;
2. 全文信息的永久性链接来增加已获得资源的可用性、丰富其在线书目及数据库资源;
3. 可以提供链接的扩展服务,图书馆会员可为学术研究、教育、个人的、非商业化的目的使用DOI;
4. 相应元数据;
5. 提供一个对不同文献数据库的通用管理入口;
6. 通过标准的方式将不同的数据库集成;
7. 享受高效率的单边链接协议;
8. 享受低成本的扩张,实现自有文献资源使用效益与覆盖范围的快速增长;
9. 享受标准化带来的方便,实现二次文献、文摘信息及集成信息等与一次文献的无缝集成;
10. 实现中西文文献的有效链接。
11. EndNote可以通过DOI信息导入PDF的详细信息。
对于科研人员,尤其是发表科研文献的研究人员,如果能很好的利用DOI,效率将大大地提高!数字对象唯一标识符(Digital Object Unique Identifier-DOI,DOI的主要目的是唯一标识网络环境下的各种信息资源实体(Entity),包括各种物理和数字资源,正如出版物贴上了条形码。DOI是从统一资源定位符(Uniform Resource Locator,URL)发展而来,被称为“下一代URL”。它与URL 的最大区别就是实现了对资源实体的永久性标识。科研人员可以在线找到基于DOI 的网络链接并点击该链接查找被引用论文。DOI已成为科技期刊的“标准配置”以及论文的“身份证”、“出生证”,全球已有 4 万余种科技期刊为论文注册 DOI,并使用 DOI 链接到论文。全球的数字出版行业通过DOI进行跨出版商、跨系统、跨语言的资源链接,DOI还提供了知识产权保护、引文规范、使用量、引用量计量、多重解析等多种增值服务。参考文献着录的国际标准(ISO 690)、国家标准(GB/T 7714)都推荐使用DOI标注引文,国外学、协会期刊规范、编排格式规范等均要求使用DOI标识期刊和论文、引文。
PMID(PubMed唯一标识码,PubMed Unique Identifier),是PubMed搜索引擎中收录的生命科学和医学等领域的文献编号。