浅析DWKI模型

1.模型部分(起源、结构)

随着科技的发展,信息技术越来越多的应用到我们的日常生活中,大数据和物联网技术的发展也让数据的传递变得更加便捷,知识时代也随之到来。作为知识时代的产物,DIKW模型被广泛应用到了信息科学、知识管理、图书情报学等学科,并已经取得了较好的研究成果。
DIKW模型也称为知识层次结构或知识金字塔,学者们普遍认为其雏形最早可追溯到艾略特所写的《岩石》,后来经由教育家哈蓝·克利夫兰和米兰·瑟兰尼及管理思想家Ackoff的衍生及推广,形成了DIKW金字塔的框架,如图1所示。这这期间,华裔地理学家段義孚于在金字塔的底端加了一个基座——数据层,对金字塔的建立功不可没。Ackoff在论文中至上而下的描述了金字塔:智慧位于顶层,从智慧开始,有理解、知识、信息,数据位于底部,其中每个类别都包括其下的类别。

整个模型将数据、信息、知识与智慧纳入金字塔型的层次体系,每一层都比下一层增加了更多的特质,所谓“内涵越大,外延越小”。我们可以通过原始的观察、测量等方法获得数据,对于数据之间关系的加工处理获得信息,信息的应用可以产生知识。而智慧,则是建立在如何使用知识的基础上对未来的影响。
在数据科学取得了长足发展的今天,DIKW模型对于理解原始数据如何转化为有用信息,进而转化为知识与智慧具有重要的意义。

2.目前对于模型的改进/争议

DIKW以“模型”、“金字塔”的形象出现,具有很强的知识性与抽象性;且计算机技术与数据库的发展也证明了DIKW具有很强的说服力和解释力。但跟其他理论一样,历经多年的发展,DIKW也一直遭受着各种质疑和挑战。这些质疑大致分为两种,一种是对其进行修改,如Freeze加入了时间的维度,类比DIKW提出了“分析金字塔”(AP);也有建议不再强调DIKW的智慧部分,并在信息和知识之间插入证据(evidence)的DIEK模型。以上虽然在原本的金字塔模型进行了修改,但本质上还是支持这种观点。还有另一类持批判态度,如亚利桑那大学的Frické认为金字塔在很多时候造成了中心逻辑错误。
中国也有学者认为DIKW模型存在缺陷。叶继元等提出,信息是本体论信息,被人们所认识的信息属于认识论信息,而数据也是通过声音、语言等媒介反应的认识论信息,但它仅是认识论信息的一种,因此数据是信息的子集,更准确地说是认识论信息的子集。而知识是系统化、有价值的信息,它是认识论信息的子集,而不是数据的子集,与数据是交叉关系。基于这个理论,他们给出了信息、数据、知识的逻辑关系的文氏图,如图所示。因此,他们认为金字塔并没有全面反映信息、数据、知识、智慧的逻辑关系、隶属关系及其交叉关系。

3.数据-知识-信息之间的关系

尽管对于DIKW模型有许多争议,但它仍然向我们展现了数据是如何一步步转化为信息、知识乃至智慧的方式。
数据的含义是“有根据的数字”,其主要来源于测量和计算后结果的记录,是用于表示客观事物的、未经加工的素材。在大数据时代,在信息技术的影响下产生的图像、视频等也被纳入了数据的概念。因此, 在当前大数据语境下, 数据的三大来源分别是:测量的结果、计算的结果以及对世界的记录。
对于信息来说,最早的研究来源于通信领域,多站在组织程度与有序程度的角度理解信息。而在管理学领域,作为“事实-数据-信息-知识-智能”这个“信息链”的中间环节,向上映射数据,向下承接知识,信息可以被看作已经经过处理的、具有逻辑关系的数据。数据是信息的表现形式和载体,而信息是数据的内涵和意义。
对于知识来说,有非常多的定义和解释:国际经济合作组织组编的《知识经济》中提出,知识就是知道了什么(Know-what)、知道为什么(Know-why)、知道是谁(Know-who)、知道怎么做(Know-how);Harris将知识定义为:知识是信息、文化脉络以及经验的组合;知识也被人看作是一种流动性质的综合体,其中包括结构化的经验、价值、以及经过文字化的信息。在DIKW模型中,我们把知识理解为:人们结合现有的知识体系,通过对相关信息的过滤、提炼和加工得到的有用资料。
谈到数据-知识-信息之间的关系,他们是密不可分的三个概念。我们通过对原始世界的测量得到数据,它是信息的原材料,但DIKW模型中的数据仅仅代表数据本身,不包含任何潜在的含义,当数据被赋予了时序等特殊条件,并通过某种方式进行了组织与处理,它就变成了信息;而信息与经验、理解力等相融合,提炼出了规律后,就上升成为知识。知识将数据与信息、信息与信息的具体应用之间建立了有意义的联系,体现了信息的本质,且知识基于推理和分析还可能产生新的知识。在当前大数据的情景下,数据经常被当作信息的代名词,大数据方法和技术的发展让数据的总量不断增加,使得数据在很多特定语境下的范畴要大于信息。但知识往往是依赖于对数据和信息的收集与整合,经过个人或组织的归纳推理、思维融合等过程,最后运用相关的融合方法与信息技术生成的。
从整体来看,知识演进的层次也可以是双向演进。有用的数据可以转化为信息,升级成知识,这是知识管理与分类的过程,使无序的信息变得分类有序;反之,随着信息的不断生产与传播途径的不断丰富,知识也可以随着人们的需要普及为信息,进而变为记录的数据。
不论DIKW模型的正确与否,它都为我们分析与运用信息与知识提供了方法与思路。

你可能感兴趣的:(人工智能,深度学习,计算机视觉)