黄智生老师的专家点评。 (第1期@Semantic Web专题讨论) 究竟什么是Semantic Web?

应Admin的邀请, 让我为Semantic Web的第一个专题讨论“究竟什么是Semantic Web,它有什么标志特征?它能给我们带来什么?”作点评。这四个月以来, 大家在这个中国语义网论坛上对语义网的最基本问题展开热烈的讨论。到目前为止,共发帖55份,总点击数逼近8千。这对于一个纯学术的帖子来说,实属不易。我看到的是,大家在这个专题讨论中都能本着学术探讨的精神,畅所欲言,其乐融融,展现出良好的学术风气。

值得说明的是,我的下面的点评,不管是支持你的观点的还是反对你的观点的,都不是对大家的看法的一个结论性的判断。我希望以一个讨论参与者的身份平等地与大家进行讨论。首先我要感谢所有讨论的参与者,你们的所有看法或观点都是值得鼓励的,所以都是有价值的。

究竟什么是Semantic Web,它有什么标志特征?这是所有语义网研究者必然要思考的核心问题。
正如Admin所指出的那样, SW的核心思想可以分为两个方面:一个是semantics,一个是web。语义(semantics)指的是提供能被计算机“理解”的数据, 即它的逻辑分析与语义表示的维度。网(web)指的是那些语义数据不是孤立存在的,而是彼此互连,形成一个网状结构,即它的数据连接的维度。

所以,对于何为语义网,存在着下面四种不同的理解:

(1) semantic + web: 即语义网应是在现有的网络数据上加一点语义分析的内容,或者是在现有的语义数据上加一些网络描述的能力。在这方面, Leopard提得很好, 即“利用semantics的技术,重新构建web的基本体系结构(主要体现在URI和带语义标签的hyperlink),建立一个全新的web......至少在数据库方向,还是更看重semantic,希望通过建立表达能力更强的本体,为数据集成和管理提供一个新的解决方法"。

(2) semantic + Web: 这里的Web的第一个字母是大写的,即语义网应是更多的网络成分,相对少的语义表示和处理的部分。在这方面,baojie提得好,“语义网的核心精神,在我看无非是web数据的结构化和一定形式的推理。在当前的技术条件下,我觉得 tagging + 分类树 + 弱关系表(如RSS之类)是最可能大规模实现的”。


(3) Semantic + web: 即语义网应是更多的语义处理成分,相对少的网络处理部分。
(好像在这次讨论里,还没有人持这个观点?)

(4) Semantic + Web: 即语义网应是很多的语义处理成分,再加上很多的网络处理部分。
值得注意的是:很多的语义处理成分,包括推理技术,并不意味着要实现像人一样的高度智能化的系统。所以说, “语义网技术通过模拟人的思维方式来获得机器的理解力”的说法是一种对语义网的误解。实际上, 语义网的推理只是要获得间接数据(如从我在VU工作而且VU在阿姆斯特丹,就能推出我在阿姆斯特丹工作,再从阿姆斯特丹是荷兰的一个城市,就能推出我在荷兰工作等)。这里的智能化程度实际上是不高的,但又是非常需要的。从知识表示和推理技术上看,就是这样的推理要求也是有较高技术含量的。(想想看这里很可能涉及到非单调推理问题)。 ”Semantic Web想做的事情太多了,这也一定程度上阻碍了它自身的推广,也许Semantic Web这个大的目标终究难以实现“的说法也是对语义网本身的误解。

正是由于存在着这四种不同的理解,使得对语义网的看法众说纷纭,每个人都可以立足于自己的理解去批评别人的不同理解。当然,在这里,我觉得没有必要来规定哪种理解才是唯一正确的,或者是正统的。

推动语义网发展的最有说服力的,就是看它究竟能给人类社会带来什么。“实践是检验真理的唯一标准”。同样,“市场是检验技术的唯一标准”。这也许是以后语义网讨论专题中要关注的。

iamwym说得好, 他指出了sw的最大的好处之一在于信息集成,“对于开发者来说,应该是一个福音,特别是数据管理方面的开发。设想一下,所有的数据都有 semantic metadata,这样子查询和管理,扩展,都要比现在的关系数据模型要容易上不少,特别在实际应用当中,往往一个企业有来自于不同地方的数据,有五花八门的格式,如果都转换了放在数据库里,好几年可能用不到可是也不能删除,成本很高,用ontology注释一下,按需转换调用,可以降低不少成本”。这就是语义数据共享的好处。

"应用探索“提得好,“我同意计算机的理解能力实际上并非真正意义上的‘理解’。计算机实际上只是知道知识的结构,或者是组织知识规则。因此,本体/语义模型的研究开发者需要明白什么样的知识结构,或者组织知识的规则具有普世意义或者局限性,以及它们的适用性。”

你可能感兴趣的:(Web)