Protege4学习笔记(一)---本体定义及相关概念

1. 本体定义

        计算机科学信息科学领域,理论上,本体是指一种“形式化的,对于共享概念体系的明确而又详细的说明”[1]。本体提供的是一种共享词表,也就是特定领域之中那些存在着的对象类型或概念及其属性和相互关系[2];或者说,本体就是一种特殊类型的术语集,具有结构化的特点,且更加适合于在计算机系统之中使用;或者说,本体实际上就是对特定领域之中某套概念及其相互之间关系的形式化表达formal representation)(wiki百科)。

        本体用来表述领域知识。一个本体描述一个领域中的概念及概念之间的关系。

2. 本体描述方法

        最常用的是W3C的OWL(web ontology language)。OWL的主要components是Individuals、Properties和Classes,分别对应Protege中的Instances、Slots和Classes。

2.1 Individuals

        Individuals代表领域对象。OWL和Protege的一个重要区别是OWL不使用Unique Name Assumption(UNA)。也就是说,在OWL中,不同的名字可以指代相同的individual。例如,Queen Elizabeth、The Queen和Elizabeth Windsor可以指代同一个individual。因此,在OWL中,必须明确指出一个individual与哪些相同,与哪些不同。

2.2 Properties

        Properties是individuals之间的二元关系,将两个individuals连接(link)在一起。例如,hasChild属性将individual Peter和Matthew连接在一起,表示Peter hasChild Matthew。Properties有以下特点:

  •         Properties可以有逆关系,例如,hasOwner的逆关系是isOwnedBy。
  •         Properties可以只有一个取值,设置为functional。
  •         Properties可以是transitive或symmetric。

        Properties在Protege中叫做SLots,在描述逻辑中叫做roles,在UML中叫做relations,在GRAIL中叫做attributes。

2.3 Classes

        OWL中的Classes可以解释为包含individuals的sets(集合),可以用数学的方法精确地描述class中成员要满足的特性。例如,class Cat包含感兴趣的领域中的所有cats。

        Classes可以组织为superclass-subclass的层级结构,即taxonomy。子类(subclass)特化(are subsumed by)超类(superclass)。例如,Animal和Cat中,Animal是超类,Cat是子类,所以所有cats都是animals,及Cat中所有成员都是Animal中的成员。如果individual属于Cat,蕴含着它也属于Animal。OWL-DL的一个关键特性是可以通过推理器自动计算superclass和subclass关系。

        有时候,Concept也是指Class。

        在OWL中,classes通过指定里面的individual必须满足的条件建立。

3. 本体建立工具Protege

        Protege是Stanford大学开发的本体构建工具,有桌面版和web版。



参考文献

1. Tom Gruber (1993). "A translation approach to portable ontology specifications". In: Knowledge Acquisition. 5: 199-199.

2. Fredrik Arvidsson and Annika Flycht-Eriksson. Ontologies I. Retrieved 26 Nov 2008.

你可能感兴趣的:(语义网)