一、关于本体
1. 本体论语义学的特点:
本体论语义学与其他人工智能理论、自然语言加工系统相比有自己的一些鲜明特点。其一,它强调对意义的处理无需通过句法分析,至少主要不是通过句法分析。在它看来,机器对意义的接受、表征、加工、生成和输出,或者说,让机器的句法加工具有语义性或意向性,靠的主要不是原先的关键词匹配,句法转换,而依赖的是对人类智能的全方位模拟。其二,本体论语义学认识到了人类心理状态具有意向性、自然语言具有语义性依赖于复杂的因素,并在这种认识的基础上形成了研究意义的一种综合性方案。在具体的工程学实践中,它关注到了意义处理中的多方面因素,即不仅仅注意到了知识性因素,而且还重视潜藏在人类智能中的非知识因素,并通过特定的方式将它们“内化”到他们所建构的人工智能系统之中。第三,本体语义学非常重视本体论图式在人类心理状态意向性、自然语言语义性中的作用,并在将这一认识成果向工程技术领域转化,进而让自然语言加工系统获得这一语义生成的重要枢纽、机制方面做了大胆探索,取得了富有启发意义的初步成果。第四,本体论语义学的确有重要的实践意义和广阔的应用前景,最重要的应用价值是它能产生文本意义表征。因为它的语义处理系统可以借助静态知识资源对输入文本作出分析,借助加工器的动态能力将所储存的知识动态地提取出来,并运用于知识表征, 然后借助这些知识资源产生文本意义表征,并由特定输出设备完成在意义交流层次的人机对话。
2. 本体
本体是用来描述某个领域的知识的。描述了该领域内各个概念和概念间的关系。(使用本体是为了用它进行关于个体的推理)
3. 操作 :与或非
4. 概念
人们通过对客观世界中存在的对象进行观察和思考,经过思维的抽象,在思想中产生了“概念”。 概念是思维的产物,用来反映思维对象特有属性或本质属性。概念属于思维领域,为了交流,人们使用语词表达概念。语词只是概念的语言形式,同一个概念可以用不同的语词表达,同一个语词在不同的语境中表达不同的概念。因此,概念、语词和对象的关系是:概念是认知主体的认知结果,属于思想层面。语词是认识主体创造的用于表达概念。对象是客观存在。认知主体用概念来指代对象,并用语词来指称对象。
二、OWL学习
1. OWL介绍
OWL(Ontology Web Language)是一种本体语言,是W3C(World Wide Web Consortium),OWL让描述各种概念成为可能,还提供了很多功能。
2. 三类OWL
(1)OWL-lite: 从语法上来说,OWL-Lite是三个之中最简单的一个,当你的本体中类的层次结构很简单,并且只有简单的约束(constraint)时适合使用它来描述本体。例如,在需要把一个已存在的辞典(thesauri)移植到另一个差不多简单的概念层次时,OWL-Lite可以做得又快又好。
(2)OWL-DL: 和OWL-Lite相比,OWL-DL的表达能力要丰富许多,它的基础是描述逻辑(Description Logics,即DL的由来)。描述逻辑是一阶逻辑(First Order Logic)的一个可判定的变种(译注:不一定准确,原文decidable fragment),因此可以用来进行自动推理,计算机从而可以知道本体中的分类层次,以及本体中的各种概念是否一致。
(3)OWL-full: OWL-Full是OWL的三种子语言中表达能力最强的一个,适合在那些需要非常强的表达能力,而不用太关心可判定性(decidability)或是计算完全性的场合下使用。不过也正是由于表达能力太强这个原因,用OWL-Full表示的本体是不能进行自动推理的。
3.OWL本体的组成
(1)个体(individual) :个体代表领域中我们感兴趣的对象,OWL不使用唯一命名假设,即两个不同的名称可以对应一个个体(例如:“伊丽莎白女王”和“伊丽莎白温莎”是指同一个人)。在OWL中,必须明确表示个体之间是否相同,否则它们的关系是不明确的。
注:个体(individual)有时也被称作实例(Instance)。
(2)属性(Property) :属性是个体之间的二元关系。在描述逻辑中,它们就是角色(Role)的概念。
函数属性(Functional Property)——通过这个属性只能连接一个个体。hasBirthMother
反函数属性(Inverse Functional Property)——即这个属性的反属性是函数属性,也就是对于一个给定的个体,只有最多一个个体能通过该属性连接那个个体。isBirthMotherOf
传递属性(Transitive Property)——hasAncestor
对称属性(Symmetric Property)——hasSibling,如果一个属性是对称的那么它就不能是函数属性。
还可以将属性分为:
对象属性(Object Property)——连接两个个体。
数据类型属性(Datatype Property)——连接个体和XML Schema数据类型值或rdf literal,该属性不能为传递的,对称的,反函数的。
标注属性 (Annotation Property)——用来对类,属性,个体和本体添加信息(元数据)。OWL-DL对标注属性作出了如下限制:(1)标注属性的filler只能为,literal或URI或个体。(2)标注属性没有子属性,也不能为其它属性的子属性,而且不能使用domain和range。
(3)类(class) :表示一些个体的集合,它使用数学的方法描述出该类中成员必须具有的条件。
注:概念(concept)这个词有时被用来代替类,实际上,类是概念的一个具体表现。
4.OWL中本体的结构
(1)命名空间
在使用一组术语之前,需要精确地指出哪些具体的词汇表将会用到。一个典型的OWL本体以命名空间声明开始,这些命名空间写到<rdf:RDF 标签中。
属性值是不具有命名空间的,在OWL里可以写出它们的完整URI。完整的URI中可以利用实体定义来简略。
如:<!DOCTYPE rdf:RDF [
<!ENTITY vin "http://www.w3.org/TR/2004/REC-owl-guide-20040210/wine#" >
<!ENTITY food "http://www.w3.org/TR/2004/REC-owl-guide-20040210/food#" > ]>
在声明这些实体后,我们可以将“&vin;merlot”作为“http://www.w3.org/TR/2004/REC -owl-guide-20040210/wine#merlot”的简写。
(2)本体头部
在owl:Ontology标签中给出本体的声明。这些标签支持一些重要的常务工作比如注释、版本控制以及其他本体的嵌入等。
owl:Ontology元素是用来收集关于当前文档的OWL元数据的。
rdf:about属性为本体提供一个名称或引用。
rdfs:comment提供了显然必须的为本体添加注解的能力。
owl:priorVersion是一个为用于本体的版本控制系统提供相关信息(hook)的标准标签。本体的版本控制将在后面作进一步讨论。
owl:imports提供了一种嵌入机制。owl:imports接受一个用rdf:resource属性标识的参数。
(3)数据集成与隐私
不同的个体成员可能表示同一个体,owl:sameAs表达等价的能力。
5. 基本元素
5.1简单的个体和类
外延:我们称由属于某个类的个体所构成的集合为该类的外延(extension)。
本体:为了进行相关个体的推理。
5.1.1 简单的具名类
一个领域中最基本的概念对应各个分类层次树的根。
。。。。国际化资源标识符(IRI)。。。。。统一资源标识符(URI)。。。。
rdf:ID="Region" 被用于引入一个名称(作为定义的一部分)
在这一文档中,我们现在可以用#Region来引用Region类,例如 rdf:resource="#Region"
rdfs:subClassOf是用于类的基本分类构造符,次关系是可传递的
一个类的定义由两部分组成:引入或引用一个名称,以及一个限制表。
5.1.2 个体
<owl:Thing rdf:ID="CentralCoastRegion" />
<owl:Thing rdf:about="#CentralCoastRegion">
<rdf:type rdf:resource="#Region"/>
/*表示个体,type是一个rdf属性,用于关联一个个体和它所属的类*/
</owl:Thing>
或者使用
<Region rdf:ID="CentralCoastRegion" /> 语句来表示个体
** Web本体被设计成为分布式的,我们可以通过导入和补充已有的本体来创建衍生的本体。
5.1.3 使用方面的考虑
一个类仅是一个名称和一些描述某集合内个体的属性;而个体是该集合的成员。因此,类应自然地对应于与某论域中的事物的出现集合,而个体应对应于可被归入这些类的实际的实体。
子类:类的子集合
实例:表示一个单一的个体
一个本体的开发应坚定地由它的预定用途所驱动。这些问题也存在于OWL Full和OWL DL之间的一个重要区别。OWL Full允许将类(class)用作实例(instance),而OWL DL不允许。
5.2 简单属性
一个属性是一个二元关系,有两种类型的属性
数据类型属性(datatype properties):类实例与RDF文字或XML Schema数据类型间的关系。
对象属性(object properties):两个类的实例间的关系。
5.2.1 定义属性
<owl:ObjectProperty rdf:ID="madeFromGrape">
<rdfs:domain rdf:resource="#Wine"/> /*表示定义域*/
<rdfs:range rdf:resource="#WineGrape"/> /*表示值域*/
</owl:ObjectProperty>
在OWL中,一个值域可被用来推断一个类型
<owl:Thing rdf:ID="LindemansBin65Chardonnay">
<madeFromGrape rdf:resource="#ChardonnayGrape" />
</owl:Thing>
可以推断出,LindemansBin65Chardonnay为一种葡萄酒,因为其定义域为wine
可以定义子属性,属性是传递的,例如X为Y的子属性,如果具有属性X,则必然同时具有属性Y。
5.2.2 属性和数据类型
数据类型属性:将个体关联到数据(值域为:RDF文字或XML Schema数据类型)
<owl:Class rdf:ID="VintageYear" />
<owl:DatatypeProperty rdf:ID="yearValue">
<rdfs:domain rdf:resource="#VintageYear" />
<rdfs:range rdf:resource="&xsd;positiveInteger"/>
</owl:DatatypeProperty>
yearValue属性将VintageYears与一个整数值相关联。
5.2.3 个体的属性
<Region rdf:ID="SantaCruzMountainsRegion">
<locatedIn rdf:resource="#CaliforniaRegion" />
</Region>
<Winery rdf:ID="SantaCruzMountainVineyard" />
<CabernetSauvignon rdf:ID="SantaCruzMountainVineyardCabernetSauvignon" >
<locatedIn rdf:resource="#SantaCruzMountainsRegion"/>
<hasMaker rdf:resource="#SantaCruzMountainVineyard" />
</CabernetSauvignon>
5.3属性特性
5.3.1 传递属性: P(x,y),P(y,z) P(x,z)
5.3.2 对称属性: p(x,y)当且仅当P(y, x)【注意是同一个关系】
5.3.3 函数属性: P(x,y) 与P(x,z) 蕴含 y = z,即对应值的唯一性
5.3.4 逆属性 (inverseOf):P1(x,y) 当且仅当P2(y,x)【注意是不同关系】
5.3.5反函数属性 (InverseFunctional):P(y,x) 与 P(z,x) 蕴含 y = z;
InverseFunctional意味着属性的值域中的元素为定义域中的每个元素提供了一个唯一的标识。
5.4 属性限制
5.4.1 两个属性限制机制 ,allValuesFrom与 someValuesFrom是局部的(local),它们仅仅在包含它们的类的定义中起作用。
owl:allValuesFrom属性限制要求:对于每一个有指定属性实例的类实例,该属性的值必须是由owl:allValuesFrom从句指定的类的成员。
Wine的制造商必须是Winery。allValuesFrom限制仅仅应用在Wine的hasMaker 属性上。Cheese的制造商并不受这一局部限制的约束。(代码如下)
owl:someValuesFrom限制与之相似。
关系 含意
allValuesFrom 对于所有的葡萄酒,如果它们有制造商,那么所有的制造商都是酿酒厂。
someValuesFrom 对于所有的葡萄酒,它们中至少有一个的制造商是酿酒厂。
前者并不要求一种葡萄酒一定要有一个制造商。如果它确实有一个或多个制造商,那么这些制造商必须全部都是酿酒厂。后者要求至少有一个制造商是酿酒厂,但是可以存在不是酿酒厂的制造商。
5.4.2 基数限制
owl:cardinality:这一约束允许对一个关系中的元素数目作出精确的限制。
例如,我们可以将Vintage标识为恰好含有一个VintageYear的类。
值域限制在0和1的基数表达式(Cardinality expressions)是OWL Lite的一部分。这使得用户能够表示“至少一个”,“不超过一个”,和“恰好一个”这几种意思。OWL DL中还允许使用除0与1以外的正整数值。owl:maxCardinality能够用来指定一个上界。owl:minCardinality能够用来指定一个下界。使用二者的组合就能够将一个属性的基数限制为一个数值区间。
5.4.3 hasValue
hasValue 使得我们能够根据“特定的”属性值的存在来标识类。因此,一个个体只要至少有“一个”属性值等于hasValue的资源,这一个体就是该类的成员。
如果是Burgundy酒,那就都是干(dry)的酒。也即,它们的hasSugar属性必须至少有一个是值等于Dry(干的)。
【我的理解是,每个Burgundy都要有一个干的(Dry)属性,以此来标识该酒是干酒】