终于拿到了《网络空间大搜索技术白皮书》的纸书和电子版。这份《白皮书》在国家自然科学基金委的指导下,多位院士主持参与,由北京邮电大学、国防科技大学、复旦大学、中科院计算所、中国电子科技集团公司、清华大学、中科院信工所、哈尔滨工业大学等十余所高校、研究所及企业联合编写。很荣幸我们的团队能够成为其中的一份子。
为什么要推进网络空间大搜索的研究呢?
因为当前随着互联网、移动互联网、物联网等技术的迅猛发展,网络空间也不断拓展,由互联网扩展到了人、机、物互联的泛在网络空间。互联网应用模式从Web 1.0发展到了Web 2.0和Web 3.0互联网应用。数据也呈现爆炸性增长的趋势,极大地推动了全球大数据时代的到来。传统搜索引擎在推动互联网发展,加快互联网应用的普及过程中,起到了非常重要的促进作用。然而,随着网络空间极其有用的发展,使得传统的、面向关键字的搜索不能满足用户的搜索需求,搜索引擎必须进行完全创新性的、颠覆性的、革命性的变革,下一代搜索引擎—“大搜索”已呼之欲出。
针对上述需求,北京邮电大学方滨兴院士敏锐地捕捉到了新一代搜索引擎发展的契机,于2013年9月份率先提出了“面向泛在网络空间的智慧搜索”的概念,并与国家自然科学基金委员会多次交流沟通。于2014年1月在海口组织双清论坛预备会,召集国内外相关搜索领域的专家对下一代搜索引擎进行了研讨。在充分论证应用需求和技术成熟度的基础上,国家自然科学基金委员会于2014年10月召开了120期“网络空间智慧搜索基础研究”双清论坛,与会专家深刻意识到了网络空间智慧搜索发展的迫切性,并一致同意方院士提出的将“网络空间智慧搜索”称之为“大搜索”提议,并一致认为我国已经错过了互联网搜索引擎的先机,在面向泛在网络空间的大搜索引擎的研究上,要抓住机会,力争突破,为引领我国信息技术的进一步发展,占领IT技术的战略至高点,奠定坚实的基础。
在这份白皮书里,我们怎么定义的网络空间大搜索?
网络空间大搜索是指在面向泛在网络空间中的人、物体和信息,在正确理解用户意图基础上的,基于从网络空间大数据获取的知识,给出满足用户需求的智慧解答。
用户意图理解指的是针对用户意图输入的多模态特性及消除歧义的基础上,结合用户的上下文和语义知识,迅速、准确地理解和定位用户的真实意图。例如,搜索引擎会结合用户所在位置,在用户搜索“天涯海角”时,确定用户是想搜索成语、景点还是车站。
智慧解答是指基于泛在网络空间和Web 2.0/3.0应用中获取的大数据,通过发掘获取的知识,并基于对用户意图的理解,给出的一组有序的解决方案。例如用户搜索“马尔代夫旅游”的相关信息,传统搜索引擎只是返回相关网页;而大搜索会给出一组具体的问题解决方案:如豪华游、经济游、舒适游及旅游路线对比等在内的一系列具体的旅游方案,以供用户选择。
这份白皮书的主要内容有哪些?
这份白皮书首先追溯了大搜索的起源,从网络搜索空间的扩展、网络应用模式的发展及大数据时代的到来等角度探讨了大搜索发展的需求;其次,阐述了大搜索的内涵,包括大搜索的基本概念、特点和搜索引擎的系统架构;再次,分析了大搜索的前沿方向,将大搜索重点研究归纳为五个方面:泛在网空间数据获取、多源融合知识获取、用户搜索意图的理解与表示、智慧解答的在线匹配求解和大搜索的安全隐私保护;然后,围绕着大搜索在六个主要应用领域的研究及应用展开了讨论;最后,对大搜索的生态环境和前程进行了展望。
这里有白皮书的电子版,感兴趣的同学,可以去看看,对大家理解未来搜索引擎技术的发展和研究很有参考价值。