DCC数字管护生命周期模型解读

实话说,对于Digital Curation笔者真心不知道应该怎么翻译。本文借用了钱毅老师的观点,姑且翻译成“数字管护”,详见《从保护到管护:对象变迁视角下的档案保管思想演变》(《档案学通讯》,2022年第2期)。关于“管护(Curation)”和“数字管护(Digital Curation)”,文中的定义如下:

管护:是对可信赖的研究数据进行维护并使其增值的系列活动。

数字管护:需要在对数字资源进行保存和管理的同时对其进行增值管理,实现知识增长。数字管护汲取了对数字资源真实性、完整性和长期保存的研究成果,其价值在于跨越整个数字信息生命周期,联合相关专业共同努力形成一个连贯的整体,将数字保存成果推向了更高层次的跨学科、跨领域复用和共享,超越了单纯的数字保存活动。

DCC数字管护生命周期模型解读_第1张图片 

DCC数字管护生命周期模型

看了上述定义,笔者的心里感觉很不是滋味,因为数字罗塞塔计划定位就是数字资源长期保存专家,结果现在出来一个“数字管护”,说是“长期保存”还不够,还需要对其进行增值管理,要超越“数字保存”!

当然,不爽归不爽,既然数字罗塞塔计划公众号致力于作为中立的第三方客观公正地表达自己对于档案信息化领域的看法和观点。它山之石可以攻玉,国外先进的理论模型也可以拿来为我所用。

2004 年,英国国家级综合数据管理机构DCC(Digital Curation Center,数字管护中心)成立。2005 年9月,第一届国际“Digital curation”会议在英国巴斯大学召开。2006 年,由DCC和英国爱丁堡大学联合主办的开放存取专业刊物《国际数字管护期刊》(International Journal of Digital Curation)问世,标志着“Data curation”成为图书馆学、档案学与e-Science的核心研究领域。今天要介绍的模型正是DCC于2007年提出的数字管护生命周期模型(Digital Curation Lifecycle Model)。

DCC数字管护生命周期模型解读_第2张图片

 

模型解读

DCC数字管护生命周期模型本质上来说是一种通用的数字资源管理工具,可以与相关标准结合,用于计划不同颗粒度的数字资源管护和保存活动,以确保数字资源全生命周期的连续性。DCC模型主要用于以下用途:作为数据生产者、数据管理员和数据利用者的培训工具;组织和规划保存机构的数字资源;帮助机构识别其数字资源存在的风险,并为其成功的管护制定管理策略。

数字资源就其本质而言,从产生的那一刻起就容易受到技术变革的影响。在其管理的不同阶段所进行的或被忽视的管护和保存活动,可以影响到在后续阶段读取它们的能力。DCC模型可以确保以正确的顺序识别和计划所有所需的阶段,并实施必要的操作。这可以确保对数字资源的真实性、可靠性、完整性和可用性的维护,实现数字资源长期安全保存并实现投资最大化。

DCC模型中的很多名词实际上引用了ISO15489《信息与文献 文件管理 第1部分:通则》和ISO 14721《空间数据和信息传输系统 开放档案信息系统(OAIS) 参考模型》中的提法,因此,笔者对照ISO15489和ISO 14721对其进行翻译如下图所示:

DCC数字管护生命周期模型解读_第3张图片

 

DCC模型各部分解读如下:

管护生命周期

DCC模型提供了一个图形化的高级概述,以成功地管护和保存所需的数据。该模型可用于计划一个组织或联盟内部的活动,以确保进行所有必要的阶段,每个阶段都以正确的顺序进行。该模型可以深入到细粒度的管理功能;定义角色和职责;并构建一个需要实现的标准和技术的框架。该模型可以帮助确定可能需要的额外步骤,或某些情况或规程不需要的行动,并确保过程和政策得到充分的文件记录。

数据(数字对象或数据库)

数据

任何二进制数字形式的信息,都是管护生命周期的中心。包括以下两个方面。

数字对象

简单的数字对象是离散的数字组件。例如:文本文件、图像或声音文件,以及它们的相关标识符和元数据。

复杂数字对象是离散的数字对象,由许多其他数字对象组成,比如网站。

数据库

存储在计算机系统中的记录或数据的结构化集合。

全生命周期活动

描述信息和表征信息

采用适当的标准分配管理性、描述性、技术性、结构性和保存性元数据,以确保对长期保存过程中对数字资源进行充分的描述和控制。收集和分配理解与呈现数字资源以及相关元数据所需的表征信息。

保存计划

保存计划贯穿数字资源的整个管护生命周期,包括对所有管护生命周期活动的管理和计划。

社区观察及参与

密切关注适当的社区活动,并积极参与社区中共享的标准、工具和适合软件的开发工作。

管护与保存 了解并实施管理和行政活动,以促进数字资源整个生命周期的管护和保存。

顺序操作

构思

构思和计划数据的创建,包括捕获方法和存储选项。

创建获取

创建环节包括管理性、描述性、结构性和技术性元数据,保存元数据也可以在创建环节被添加。

根据归档收集策略,从数据创建者、其他档案库、存储库或数据中心接收数据,并在需要时分配适当的元数据。

鉴定选择

评估数据,并有选择地进行长期管护和保存,遵循书面指导、政策或法律规定。

接收摄取

将数据传输到档案库、存储库、数据中心或其他保管人,遵循书面指导、政策或法律规定。

保存行动

采取行动确保有价值的数据得到长期保存。保存措施应确保数据在保持其完整性的同时,仍然保持真实性、可靠性和可用性。具体操作包括数据清理、验证、分配保存元数据、分配表征信息以及确保可接受的数据结构或文件格式。

数据存储

按照相关标准以安全的方式存储数据。

访问利用

确保指定的用户和授权用户每天都可以访问数据。这可能是以信息公开发布的形式出现的,也可能需要配置强大的访问控制和身份验证程序。

数据转换

从原始数据中创建新的数据,例如:通过迁移到一个不同的格式;通过选择或查询创建一个可能用于发布的结果集。

可选操作

处置

处理那些按照政策、指导或法律规定未被选择作为长期管护和保存的数据。通常这些数据可以传输到另一个档案库、存储库、数据中心或其他保管人。在某些情况下,数据会被销毁。由于法律原因,数据可能需要被安全销毁。

重新验证

将未通过验证程序的数据退回进行重新评估和选择。

迁移

将数据迁移到其他格式。这样做可能是为了符合存储环境的要求,或确保数据免遭软硬件设备淘汰的影响。

你可能感兴趣的:(鸿翼档案,鸿翼,数据库,java,大数据)