8月18日上午消息,2009年百度技术创新大会在中国大饭店举行,会议以“从你开始 创新世界”为主题,网易科技现场进行图文直播。以下是百度CTO李一男的演讲实录:
李一男:各位来宾上午好。接下来由我介绍百度在“框计算”平台的技术创新以及各种应用。“框计算”平台对于用户来说就是一个非常强大的平台,我们只需要向这个平台提交需求,然后就可以得到想要得到的结果。而实现这个“框计算”涉及到刚才谈到的语义分析、行为分析、人机交互、互联网应用、开放接口等技术架构。毫无疑问,“框计算”的应用越来越广泛,功能也变得越来越强大,百度在“框计算”方面所做的一些工作下面我简单做一些介绍。
“框计算”让搜索变的更加聪明和强大。反映在网页搜索上,这是一个很简单的案例,“今天几号”,这个需求经过搜索框提交以后,在框计算的架构里首先启动的是需求分析环节,搜索引擎的后台进行了复杂的语言处理,语义分析,得出用户需要的内容。然后我们通过资源采集,上下文分析,需求匹配等一系列手段把准确的信息匹配起来,并把最终结果反馈给用户,满足了用户的信息查询需求。
在这个搜索需求响应的过程中,作为搜索引擎需要尽可能吸纳更多的优质资源,这就依赖第三个技术架构进行。互联网和应用结果的开放性。人类世界有大量的信息还处在暗网之中,所谓暗网就是大量的信息并不为互联网探知,或者探知的时候并不为绝大多数人认识。如何更大程度发现更多的暗网,吸纳更多的优势资源是百度目前所面临的挑战和技术研发的重点,也正是百度阿拉丁计划启动的重点关键。
显然,面向庞大的暗网信息,仅仅依靠传统的信息抓取方式是远远不够的。因此,目前百度阿拉丁做的一项非常重要工作就是开放一系列的技术监控,并搭建了信息开放平台,www.open.baidu.com提供便捷的资源上传方式,大大提升了用户的搜索体验,也为上游内容提供方提供了更多的流量资源。我们相信未来会有更多的企业和个人通过我们的开放阿拉丁加入到点亮暗网的行列之中。
这是当用户查询“七夕”的信息,这是在线万年历。所有这些内容的提供者都是由第三方的机构来提供的,而这些信息以前是很难被搜索引擎所探知的。所以,当这一系列良好搜索体验就是由百度的开放阿拉丁和强大的“框计算”来实施的。
除了通过网页搜索来满足用户的需求以外,地图也是非常重要,它是用户生活和地理信息的重要来源。今天我在这里向大家隆重的宣布,经过大力的研发,人力和物力的投入,百度新研发的地图引擎开始起用。伴随着地图引擎的启用,我们在空间数据仓库的建设和挖掘、路线规范算法多个方面有了长足的进步并达到业界先进水平,这将使百度在响应用户地理位置相关需求的时候得到大幅度提升。这是在新一代地图的一些部分的功能介绍。下面我想通过一段视频简单给大家解释一下百度地图所带来的新的功能和特色。
看完地图以百度百科谈一下“框计算”和搜索引擎的发展,为满足人类知识需求,构筑人类指示体系做出的影响和贡献。
大家知道百度百科是一个在线的百科字典,赢得了广泛用户的认可,成为百度和中国网民共同构建的超级百科全书。在短短的三年零四个月的时间,百度百科的高质量词条和内容相当于16个辞海,并继续以几何速度在成长。要做到这一点,在百度百科的高速发展中,最重要的是如何确保内容的高质量,以及检索的高效率。在“框计算”的支撑下,综合机器学习和人工编辑的优势,在广大热心志愿者的积极参与下,构建了高质量的权威信息平台。
百度能够利用高效的词条识别技术和挖掘技术,构建完整高质量,同时是一个螺旋式上升的知识体系。可能刚开始水平还比较低,随着时间的推移,质量越来越强。这里有几个简单的例子,一个是“平江起义”通过机器自动识别进行词条挖掘,另外像“汶川”,用户点击汶川的时候有很多自动查阅实现自动高效的检索。
对于搜索引擎用户来说,他们希望能够随时随地的获取所需要的信息。对百度来说,这就意味着这一项新的挑战,如何将我们已经成熟的搜索引擎产品和服务再创新,无缝的扩展到手机、PDA等一系列无线终端上,让搜索真正的无处不在。
百度的无线搜索产品掌上百度是站在巨人的肩膀上发展的,而这个巨人就是我们发展了十年的网页搜索。在这个技术架构上再加上针对无线的终端适配,地址定位,代码转换等技术让搜索真正实现无处不在。
这是一个简单的案例,以“肯德基在哪里”,也是一句自然语言的话得出的结果。可以看到百度所做的是在我们的网页搜索,地图和我们的社区产品的基础上,有特别增加了针对无线搜索结果的技术优化。用手机搜索“肯德基在哪里”,百度不但会告诉你你周边的肯德基的位置,还会告诉你开车或者坐地铁怎么去,以及你要去的肯德基有没有优惠活动,甚至也不会忽略肯德基和KFC的匹配。未来这一功能还将继续得到提升。由于存在不同的厂商,不同的手机终端上通过百度的适配转码技术可以得到同样高质量的搜索体验。百度的TRANSCODER对呈现给用户的网页搜索结果进行压缩和优化,完全满足无线宽带速度的需求。
正如事先所提到百度主流的搜索产品已经全部在手机上实现,而其中包括贴吧、知道、空间等倍受用户喜爱的。无线贴吧成为最受欢迎的无线社区之一。
最后总结一下,功能强大的掌上百度将使更多人体会到搜索无处不在的便利和奇妙。
“框计算”不仅要解决面向用户的需求,也要面向企业提供更强大的商业搜索平台。我们自今年4月份发布的新的搜索营销推广平台—凤巢就是这样一款强化了“框计算”的产品,在满足用户商业搜索需求以及客户的营销推广需求方面,凤巢带来了非常显著的体验提升。支撑它的是百度在用户和客户需求分析,数据分析挖掘等一系列的技术创新。百度每天接受亿万网民的数十亿次请求,我们为满足这些请求所付出的努力也是我们进一步创新和前进的动力。我相信就像一个滚雪球的过程,百度的技术和产品创新的前进是无限的。谢谢大家。