搜索,大促场景下智能化演进之路

作者:仁基,元涵,仁重
本文选自:《尽在双11:阿里巴巴技术演进与超越》

近十年,人工智能在越来越多的领域走进和改变着我们的生活,而在互联网领域,人工智能则得到了更普遍和广泛的应用。作为淘宝平台的基石,搜索也一直在打造适合电商平台的人工智能体系,而每年双11大促都是验证智能化进程的试金石。伴随着一年又一年双11的考验,搜索智能化体系逐渐打造成型,已经成为平台稳定健康发展的核动力。

演进概述

阿里搜索技术体系目前基本形成了offline、nearline、online三层体系,分工协作,保证电商平台既能适应日常平稳流量下稳定有效的个性化搜索及推荐,也能够满足电商平台对促销活动的技术支持,实现在短时高并发流量下的平台收益最大化。搜索的智能化元素注入新一代电商搜索引擎的各个环节,通过批量日志下的offline离线建模,到nearline下增量数据的实时建模,解决了大促环境下的数据转移机器学习(Data Shift MachineLearning)能力,基本实现了搜索体系从原来单纯依靠机器学习模型做高效预测进行流量投放,到从不确定性交互环境中探索目标的在线学习、预测和决策能力进化。

2014年,我们首先实现了特征数据的全面实时化,将实时数据引入搜索的召回和排序中。2015年,我们在探索智能化的道路上迈出了第一步,引入排序因子在线学习机制,以及基于多臂机学习的排序策略决策模型。2016年在线学习和决策能力进一步升级,实现了排序因子的在线深度学习,和基于强化学习的排序策略决策模型,使得搜索的智能化进化至新的高度。

演进的背景

运用机器学习技术来提升搜索/推荐平台的流量投放效率是目前各大互联网公司的主流技术路线,并仍然随着计算力和数据的规模增长,持续地优化和深入。这里主要集中阐述阿里搜索体系的实时化演进之路,是什么驱动我们推动搜索的智能化体系从离线建模、在线预测向在线学习和决策方向演进呢?概括来说,主要有以下三点。

首先,众所周知,淘宝搜索具有很强的动态性,宝贝的循环搁置,新卖家加入,卖家新商品的推出,价格的调整,标题的更新,旧商品的下架,换季商品的促销,宝贝图片的更新,销量的变化,卖家等级的提升,等等,都需要搜索引擎在第一时间捕捉到,并在最终的排序环节,把这些变化及时地融入匹配和排序,带来结果的动态调整。

其次,从2013年起,淘宝搜索就进入千人千面的个性化时代,搜索框背后的查询逻辑,已经从基于原始Query演变为“Query+用户上下文+地域+时间”,搜索不仅仅是一个简单的根据输入而返回内容的不聪明的“机器”,而是一个能够自动理解、甚至提前猜测用户意图,并能将这种意图准确地体现在返回结果中的聪明系统,这个系统在面对不同的用户输

你可能感兴趣的:(搜索,强化学习,深度学习)