数据治理-文件内容管理

驱动因素

        文件和内容管理的驱动因素主要是法规遵从性要求、诉讼相应能力和电子取证能力和业务连续性要求;

目标和原则

 实现文件和内容管理最佳实践的目标,包括:

  1. 确保能够高速有效的采集和使用非结构化数据和信息;
  2. 确保结构化和非结构化数据之间的整合能力;
  3. 遵守法律义务并达到客户预期。

文件和内容管理遵循以下指导原则:

  1. 组织里的每个人都应该在保护组织的未来方面发挥作用;
  2. 档案和内容处理方面的专家应充分参与制度和规划的制定。

文件和档案的差异

        文件包含任务说明,对执行任务或功能的方式和时间的要求以及任务执行和决策的日志等的电子或纸质对象,文件可用于交流并分享信息和知识。程序、协议、方法和说明书都属于文件。

        只有部分文件才能称为档案。档案可用于证明所做的决定和所采取的行动是符合程序的;可作为组织业务活动和法规遵从性的证据。

     精心管理的档案具有如下特点:

  1. 内容:内容必须准确、完整和真实;
  2. 背景:关于档案的创建者,创建日期或与其他档案的描述性信息(元数据)应该在创建档案时收集、组织并维护;
  3. 及时性:档案应该在事件、行为或决定发生后立即创建;
  4. 永久性:一旦成为档案,则在档案的法定保存期内不能改变其内容;
  5. 结构:档案内容的外观和排版需要清晰,它们应被记录在正确的表格或模板上。内容应清晰易读,对属于的使用应始终保持如一。

数据管理的基本原则既适用于结构化数据也适用于非结构化数据;

无附加值的信息应该在组织的资产中移除并处理掉;

许多组织并没有优先删除无附加值的信息,因为:

  1. 制度不适用;
  2. 对某个人是无附加值信息,对另一个来说就是有价值的信息;
  3. 无法预见当前的无附加值实体和电子档案未来可能的需求;
  4. 对档案管理的不认可;
  5. 无法决定删除哪些档案;
  6. 做决定与移除实体和电子档案的感知成本;
  7. 电子空间很便宜,购买更多的空间比归档和移除过程更容易。

常用语言

        可扩展标记语言(XML)提供了一种表示结构化和非结构化数据和信息的语言;XML需要将数据结构转换为用于数据交换的文件结构。

        网络本体语言(OWL)是RDF的词汇表扩展,它是一种语义标记语言,用于网络上发布和共享OWL文件,适用于那些需要应用程序而不是人类来文件中的信息情形。RDF和OWL都是语义网标准。

        schema.org使用语义标记来给内容打标签,使语义搜索引擎更容易索引内容。

电子取证

        电子取证常见的KPI指标是成本降低,另一个KPI的指标对对比被动收集的方式,提前收集信息时提高的效率。

你可能感兴趣的:(数据治理)