语义技术的适用域(送给对语义网技术困惑的自己和同样困惑人)

(最近因要完成在职研究生的毕业论文,从去年底开始一直在学习和探讨SemanticWeb与Ontology技术,但关于如何在实际和实践中运用一直找不到方向,花大量精力研究了两个方向,但最终苦于无头绪和效果不理想只能放弃,重新寻找突破口,困惑中。。。本文转自中国XML论坛http://semanticweb.org.cn/list.asp?boardid=2)


接触和使用语义技术这5,6年来,一个问题是始终围绕在我周围。一开始是我问别人,后来是别人问我,再后来是主动提醒别人:什么时候该使用语义技术?

担任这个版的版主已经4年半了吧,语义技术也已经走过了草创阶段,进入了一些领域的生产和实用。版上的问题主要是询问工具的使用,应用程序接口的使用,逻辑语法的求助,还有出错求助,作为版主,确实应该组织一些让版上有更多背景知识的内容,进行一些更有深度的讨论。这点因为工作繁忙,有心无力,只好保证经常上来看看有没有一些能回答的帖子了。


最近和语义网界不少朋友有过一些交流,自己也是从事这方面的工作。相对于3年前,我对语义网的悲观前景的判断有了一些新的认识。首先我不这么悲观了,但也是完全乐观不起来的。如果有人要说有一点web要变成semantic web,那我大多会笑笑走开。我觉得现阶段的提法一般是semantic technology,而不是semantic web,这个的不同之处,就是所要讲的适用域的第一点,语义技术一般适用于专业领域中的高度结构化数据。说了直白一点,现在已经进入生产的,就是一个生物医学,一个是军工,包括先进机械制造,最后是做网站后台,比如SNS和business intelliigence。所以第一点要劝告诸位同学的是,如果你们所探究的领域并不是已经被证明使用语义技术很有好处的,那千万别为了使用这个新技术而一定要去使用它。尽量多做一些搜索,做一些预研,投入时间一些能够有个大概的了解和预计,动手前大概知道自己能不能做出来……


经常有朋友来问的问题包括如何在ontology或rule中表示某一个数学关系,或者函数关系,如何建立一个领域本体,如何做语义服务的挖掘,如何连接数据库,如何和自然语言处理相联系,本体映射的工具和代码,PROTEGE的用法,等等等……所以第二点呢,如果一件事情,或者要做的某一个任务,能够用传统面向对象编程,脚本语言,统计工具,自然语言工具,数据库的解决方案能够完美快速解决的,就不要去使用本体了。前面帖子有同学问,4-7怎么在本体表示,我说你直接用java里面定义两个int变量就搞定了,要存在本体里面就是两个datatype而已。最有趣的是,有一次看到一个同学问怎么样去用本体表示一个软件设计的结构,那个�灏。�软件工程一揽子图表真是哭很大。


正确的学习和研究步骤就是有一个项目的时候,想一想,里面是不是存在很多关联的结构化数据,比如说用户信息,项目管理信息,企业内部结构,领域知识,文献资料等等,这样就值得去建立一个模块了。所以这第三点就是最好能够根据实际项目的要求在做项目计划的时候,考虑一下语义技术是不是有帮助,是否能带来更高效的开发,是不是有更好的用户体验。答案如果是没有多大帮助或者前景不明朗,那就坚决选择更加稳妥的方式去完成任务。


无论是学术届创新或者是工业界项目,遵循的基本道理都是进行合理的计划,选用优化的方式,达到预期的结果。任何违背这个规律的结果一般就是事倍功半,举步维艰。


关于web将来能不能变成semantic web,我觉得虽然需要一个相对漫长的过程,但最终web会变得更加的“智能化”――semantic的思想会慢慢融入到将来的web开发中,更多的知识会在web这个平台上发布,信息组织的更加有条理,更加适合于用户查找。至于那时候是否还会叫semantic web,已经不重要了,名字吗,总归只是表面。

Tim在今年的ted上有个时间不长的presentation,向在座的社会各界人士宣传自己在06年提出的Linked data思想(只字未提semantic或RDF)。按照tim的意思,十多年前,我呼吁大家把内容放到web上,现在来看做到了;现在我要呼吁大家把自己的数据也放到web上。英国政府对这个想法比较感兴趣,特别是前一阵暴露出来政府官员们随意claim自己的花费,更让他们认为有必要把一些数据公开化。


RDF和ontology是semantic technologies中2个主要的技术,正如楼上版主所说:“语义技术一般适用于专业领域中的高度结构化数据,比如生物医学”,我的体会一个原因是这些领域中的大部分词汇有清楚明确的含义,ontology定义起来相对容易一些。回归到一般的通用领域,定义一个庞大的或几个ontology恐怕难以做到。正是因为ontology定义和维护的困难,一些人对其丧失了信心,认为ontology太heavy了,会阻碍semantic技术的应用。所以现在又出现了一个对semantic web的分类:soft semantic web和hard semantic web――hard semantic web更像是传统的Semantic web的说法,而soft则是对现在web2.0和social network技术的一个“妥协”。


今年eswc上,fabio在晚餐致词上(本来应该是Jims,可惜没来,失去了瞻仰大牛的一次机会)说semantic web的冬天要来了,要大家回去做好准备。想想也是,一项技术发展了快10年了,应该要进入一个相对低潮一点的时期(再加上经济危机没经费),也许这就是楼主“乐观不起来的原因”:)


你可能感兴趣的:(语义网)