计算机领域的 Ontologies:本体、本体论与本体模型

提要:计算机领域的 ontologies 按照传统译为“本体论”有所不妥。如果说“本体”一词可对应于其对象——基本概念,那么直接称这种基本概念化体系为“本体模型”是恰如其分的,而将流行的“本体”看作简称,也未尝不可。同时,疏离了哲学领域的本体论概念,这也是一个好处。

计算机领域的 ontology 是一个值得注意的重要概念。从各种计算机应用(尤其信息系统)开发,到与此关联的各个建模领域,包括从信息/数据建模、软件工程过程中的各种建模,到企业/业务建模(企业工程领域),它都可能会扮演不可或缺的基础性角色。

然而,和许多从西方引入的概念一样,ontology 也存在着中文术语选择的争议。对哲学领域的 Ontology 这就一直是学者争论的话题。计算机领域就更直接了当,许多的国内文献都简单地使用“本体”一词。表面上看,这是一种简化,但它是有理由的。

首先,作为哲学概念的 Ontology,是一个不可数的抽象名词。例如 Oxford Advanced American Dictionary 的定义如下:

ontology noun
1 [uncountable] a branch of philosophy that deals with the nature of existence

这不难理解:作为哲学的特定领域,它所指是一个独特的事物。所以,在一般表达中,它通常应当作为专有名词,首字母大写。上述词条同时给出了计算机领域的定义:

2 [countable] (computing) a list of concepts and categories in a subject area that shows the relationships between them

留意它变成了可数名词。也就是说,可能有许多不同的实例存在(例如,维基百科相应词条中就列举了大量已被创建出来的 ontologies 实例)。尽管对这个新概念有不同的定义,但在具体化这个角度上却是一致的,例如 Gruber (1993)的经典定义:

An ontology is an explicit specification of a conceptualization.

即:一个 Ontology 是一个概念化规范。注意这个界定的方式,是将 ontology 作为“一个”具体对象,这与哲学形而上学的 Ontology 可以说是天地之别(见这篇讨论)。这和我们平时说,一个(份)标准,或一个(份)协议是一样的。事实上,这正是计算机领域本体的基本特征,它是一种具体的,可执行的约定(即定义中所说的规范或规,specification),同时它的存储、维护、查询,通常都是基于计算机实现的,就像一个典型的数据库应用那样。对于中文,将这种含义和用法称为“论”、“学”或“术”都不恰当。而对于英语,这个问题一定程度上,由名词用法的变化解决了:(即,由不可数变为可数。在英文中,不少词汇都有可数与不可数不同用法,对应的含义有明确的区别),还有一些情况,则通过词性变化解决了,例如 ontological。大家普遍接受“本体”这个简称,可能与这个背景有关。但这又涉及到原本在哲学概念上就一直争论不定的“本体”一词的使用问题上。

黄映辉,李冠宇(2007)[1]对这个问题做了一个讨论。他们指出,“在中文的话语体系中,‘本体’就是指‘本来的状态及状况’”,对应最恰当的英文单词是 substance。它与 ontology 的词干(希腊语的 onta,英文的 being)的本意并不相同(这正是大家争论的焦点之一),但也是比较接近的,同时,这种用法基本上也既成事实。他们也承,“Ontology 是研究 Substance 的学问”,但指出,“Ontology 不能既是‘本体论’又是‘本体’”,计算机领域的 ontology 的本意应当译作“本体论模型”。

Ontologies 是一种模型,这符合笔者的观察与理解。实际上,许多文献明确地把它归为一种模型。另一方面,模型作为规范,也符合计算机领域对模型普遍接受的定义和用法。但黄映辉,李冠宇(2007)的建议仍然留了一个尾巴,就是“论”仍然保留其中,而在他们的讨论(及本文内容)中,都涉及了“论”不合适的理由。换言之,说 ontologies 是一种模型,正是指它是特定领域上的一个概念体系——基本概念模型,这个模型所表达(代表)的对象,是这个领域中的一些基本概念:人类理解的概念[2],而不是关于这些概念的某种“理论”或学说体系的模型。运用基于用法的模型定义,可以更明确地理解这里的差异:在计算机领域建立一个 ontology,正是要在约定的使用情形中,对特定范围中的列基本概念及其关系建立规范化(计算机化)表达,使得不同的计算机应用可以使用它们,达成所指在计算机应用实体与模型的三种空间基础上的一致,即达成所谓语义的一致性,互操作性。

如前所述,既然接受那些“基本的东西”(substance 或更明确地:基本概念)可称为“本体”——这基本符合目前这个领域多数人的直觉理解——那么对这些东西所做的建模(建立一个基本概念体系)就是“本体模型”(那个“论”就不存在于此)。另一方面说,因为“本体”大致相当于本体之中所包含的基本概念,或在某些情况下,指那些概念所指对象,将这个“基本概念体系”再称为本体,严格说就有所不妥,在完整的表达时,称为“本体体系”或“本体模型”就更清楚,笔者强烈建议后者。当然,从词语简化的角度,抛开本、体等的古汉语渊源,直接从现代汉语字、词的基本意识出发,把“本体”看作是“基本概念之体系”的简称也未尝不可——普遍接受的现实,恐怕也有这一层原因。

不管是否将“本体模型”作为 ontologies 的正式译名,在“本体”一词目前的沿用,和ontologies 的使用方面看,使用“本体模型”都是比较自然、明确的。即用“本体”对应于其处理的对象——基本概念(或其所指),所建立的概念表达体系,称为“本体模型”正是恰如其分。它与目前已经流行的“本体”也不矛盾,这可以被视为一种简称。笔者相信,在行文中采用这种用法,无需说明,基本不会带来概念理解上的困难,而点明模型概念,对其特殊意义在汉语中的表达是一种增强。例如,前述 Gruber 的定义就可表述为:“一个本体模型就是一个概念化规范。”又如,我们关于“一般事物建模及企业模型框架”的课题(见此文第五部分[3]),其实就是一个典型的本体模型课题。

最后,采用“本体模型”和“本体”,自然疏离了哲学领域的本体论概念,这也是一个好处。

————
[1] 黄映辉,李冠宇:Ontology 的实质是“本体论模型”,计算机工程与应用, 2007, 43(23)
[2] 放在计算机应用实体与模型的三种空间基础上讨论,就更清楚:如在上一篇讨论中指出,“计算机应用的本体论的创建过程,是将特定域上的概念空间实体映射到计算空间的建模过程。”从这里也可以明显看到,刻板地套用“本体论”这个译法,是很别扭的,用“本体模型”就很自然;而直接用“本体”,多少有些混淆概念体系(模型)和其中包含的概念的问题。
[3] 企业应用探索十五年之路线图, 企业工程论坛,2010-07-03. http://www.ee-forum.org/pub/ty/2010-07-p1544.html

原发:企业工程论坛,2012-02-18,
http://www.ee-forum.org/wp/pub/ty/2012-02-p3178.html
(调整补充了部分链接注释)

作者印:dcb442


相关阅读

  • 漫谈计算机领域的本体论(ontology)
  • 札记:本体及数据、信息、领域、企业建模与模型

你可能感兴趣的:(计算机领域的 Ontologies:本体、本体论与本体模型)