Where are semantics in semantic web

Title

Where are the Semantics in the Semantic Web?

Journal

AI Magzine

Year

2003

Author

M Uschold

Level

Introductory

Comment

是一篇 semantic的介绍性文章。

 

 

摘要

 

语义网最广为接受的特征 是 machine-usable content。在这种意义下,语义网在shopping agents方面已经成熟了,因为它可以自动的获取和利用Web信息,来寻找最便宜的机票等。但是语义在哪儿呢?其实大多数人认为语义网还是一个愿景,所以这种shopping agents不应该算作语义网的应用。为了利用Web内容,机器必须‘知道’在遇到它们时应该做什么,这就要求机器必须‘知道’它们的含义(即语义)。语义网最大的挑战 是如何让机器拥有这些知识,而这正是语义网最令人困惑的地方。

 

我们从描述“语义”的各种含义开始,不同的事物可以被认为具有不同种类的语义。我们介绍了一个语义连续统,它 的范围是从隐含语义( implicit semantics, 仅存在于使用者的大脑里)到规范语义 ( formal semantics, 能够 被机器处理)。我们列出了达到‘机器可用’这个目标的一些前提条件(或者说‘需求’), 并且考虑了许多问题,如硬编码,协定,语义规约的澄清和语义的公开声明。根据上述的需求和问题,以及我们的语义连续统,我们认为把 shopping agents看作退化的语义网是有益的,因为shopping agents工作在一个缺乏语义的网络中,它仅仅是依靠程序员把一些规则硬编码到软件中来实现它的功能。

 

我们注意到这种方式具有很多不足,这些不足为语义网如何发展提供了一些想法。 我们认为这个演化可以按照以下方式进行:

  (1) 语义区间移动:从隐含语义到规范语义

  (2) 减少以 hardwired方式提供网络内容的语义

  (3) 增加协议和标准的数量

  (4) 开发遇到不统一时具有语义映射和翻译的能力


1 引言

 

从不同的方面来看,Web的发展包括:

 

Locating Resources: 人们在网上寻找信息的方式从简单的文本信息和关键字搜索,演变到复杂的语义搜索和浏览。

Users: web资源从主要的消费者是人,到消费者是人和机器。

Web Tasks and Services: 从找信息,到处理信息。

 

而这些能力的基础是使web具有语义信息,这就提示我们从另一个角度看待web的发展:

Semantics: Web信息从包含少量语义信息,甚至无语义信息,到拥有一个富含语义信息的结构。

 

尽管”Semantic Web“这个词用的很广,但它没有一个广泛接受的定义,W3C语义网组织声称:

 

“The Semantic Web is a vision: the idea of having data on the Web defined and linked in a way that it can be
used by machines not just for display purposes, but for automation, integration and reuse of data across
various applications.[W3C 2001] ” [emphasis mine]

 

同样,Tim Berners-Lee预想:

 

”The Semantic Web is an extension of the current Web in which information is given well-defined meaning,
better enabling computers and people to work in cooperation.” [Berners-Lee et al 2001] [emphasis mine]


“[S]omething has semantics when it can be ‘processed and understood by a computer,’ such as how a bill can
be processed by a package such as Quicken.” [Trippe 2001]

 

虽然“Semantic Web”没有广泛接受的定义,但是,根据上面的描述,我们可以发现它们主要强调web能够:

  • machine-usable, and
  • associated with more meaning

但是,我们依然缺乏一个可以明确区分语义网和现存网络的特征。

 

因为RDF被W3C采用为语义网的语言,因此有人认为:如果一个应用程序利用了RDF,那么它就是语义网应用程序。这个断言使我们想起了这样一句话,即“如果一个程序是用Lisp或者Prolog语言编写的,那它就是AI”。

 

缺少语义网的明确定义不是阻止我们前进的原因,就像AI的发展历程一样,新的思想总有一段孵化期。

 

研究机构,工业参与者,软件开发商和W3C共同努力把语义网的愿景变为现实,它将是一个分层的,可扩展的,可组合的架构。其中一个主要的需求是,用语义元数据进行表达和推理,并且为信息资源提供语义标注信息。而语义框架的基础是本体,知识库,和具有推理、证明、语义查询能力的web代理。

 

语义网的主要目的是让机器能够理解信息资源,以更好地服务人类。根据Tim Berners-Lee的愿景,将来web代理将会无处不在,它们为我们执行大量的日常工作。web代理为了完成人们分配的工作,web代理之间必须交流,并且懂得彼此的含义;它们必须公布自己的功能,识别其他web代理的功能;它们还需要定位web上的信息资源,并把这些资源以一种有意义的方式进行组合,从而有效的执行任务。它们需要识别,解释,回应其他web代理的行为。

 

而解决上述问题的两个极端的办法是:

  1. 忽略该问题,假定所有代理采用相同的词汇,并具有相同的含义
  2. 形式化的语言描述的本体,公布各个代理的功能

 

2 文章结构

 

1 Introduction

 

2 Semantic: A many-splendored thing

2.1 A semantic continuum

2.1.1 Implicit Semantics

2.1.2 Informal Semantics

2.1.3 Formal Semantics for Human Processing

2.1.4 Formal Semantics for Machine Processing


3 Machine processible semantics

3.1 Issues and Assumptions

3.1.1 Language Heterogeneity

3.1.2 Incompatible Conceptualization

3.1.3 Term Heterogeneity and Different Modeling Styles

3.2 An Example

 

4 Why do Web Shopping Agents work?

4.1 Requirements for Machine Usable Content

4.1.1 Hardwiring

4.1.2 Agreements and Semantics and Semantics Specification

4.1.3 Publicly Declared Concepts

4.2 Web shopping agents work because...

 

5 Conclusion

 

3 总结和结论

 

关于什么是语义网以及它应该如何发展,目前有很多不同的观点。语义网中经常被提到的一个特征是machine usable Web content,而它的基础是机器必须“知道”如何识别它们所找的内容,并且“知道”如何处理它们,而这些“知识”的获得,需要机器访问web内容的语义信息,但是这是什么意思呢?访问web内容语义信息的方式是语义网中最令人困惑的地方。本文的主要目标就是去除这个困惑。

 

我们开始介绍了语义网,并且注意到了实现它时可能遇到的一些主要的挑战,其中最主要的问题可能就是web内容的异构性。我们讨论了“semantics”的一些含义,包括现实世界语义,公里语义和模型理论语义以及它们之间的关系,我们说过语义能否成功的关键是web应用程序能不能正确的确定web内容的语义信息。我们注意到很多具有语义信息的事物,如带有主观意识的术语和表达式、代理之间交流用的行为语言、和表示语言(RDF or DAML+OIL)

 

机器怎样访问web内容的语义信息呢?为了获得这个问题的本质,我们介绍了一个语义连续统,在各种情况中,语义必须硬编码到web应用软件中,另外需要注意到是在语义连续统中,最后一个语义,即Formal Semantics for Machine Processing,在这种情况下,我们可以减少硬编码的量并且动态的推断事物的语义,但这需要硬编码表示语言(这种语言是用来推理的)的语义信息。

 

我们给了一个简单的例子,这个例子采用了形式语义,机器可以推断术语fuel-pump(之前没有见过)的语义,这个例子可以利用现在的技术实现,但是我们做了一些假设,从而消除各种异构性(语言,术语,建模风格等)。这个例子重要的一点是,它的实现依赖于一个公开声明的术语语义信息,并且在各个软件代理和Web站点之间共享。我们也指出这种公开的声明不必是形式化的;Dublin Core 就是一个非形式化,且广发应用的公开声明的例子。

 


你可能感兴趣的:(Web,processing,语言,extension,styles,Semantic)