本文中,笔者以各个领域头部产品为例,对互联网常见的业务形态中的推荐应用进行分析。推荐策略的制定即为解决场景下的各种推荐需求制定解决方案,因此本文将从每个场景下用户、物品和上下文的特性入手,组织和整理推荐策略情景下需要重点解决的问题。
目录
资讯内容平台推荐——以今日头条为例
电商二手交易平台推荐——以闲鱼为例
O2O外卖平台推荐——以饿了么为例
资讯内容平台推荐——以今日头条为例
1. 平台特性和推荐场景
内容的形式和类目多样:今日头条是一个综合内容平台,图文、视频、UGC小视频、问答、微头条,每种物品类型有自己的特征,同时各个类型下的内容又分属多个类目、多个层级的频道。在推荐时,一方面需要考虑如何提取不同内容类型的特征做好推荐,另一方面也需要做好不同类型内容的混排和频控策略。例如,问答卡片推荐的目标不仅是吸引点击和阅读,还要吸引用户生产内容。因此,问答卡片的推荐需要点击回答率、答案数量等特征,并与用户的长期、重度兴趣相联系。此外,问答卡片的展示比例、位置等都要根据用户的行为特征和内容特征进行个性化,如对产出型的用户增加低回答内容的展示、对阅读型用户增加高质量问答的展示,等等。
资讯平台的价值塑造:作为资讯内容平台,今日头条需要出于内容生态和社会责任的考量,打压低俗内容、标题党、低质内容,进行重要新闻的置顶、加权、强插等,以及对时效性低、重复内容进行降权,人工干预策略必不可少。如此才能够在个性化推送的同时,维护资讯平台核心的信息价值。
推荐场景:今日头条的使用场景主要包括日常上班途中、空闲时间在首页和兴趣频道浏览个性化资讯;有特定阅读目的时在频道页、搜索浏览目标主题资讯;阅读完感兴趣的资讯后在app闲逛。新用户、偶尔唤醒的沉睡用户则往往是期待或预判了产品的价值,然后主要通过主页个性化feed进行感知,因此相对于个性化推荐更需求高质量新热资讯。
2. 特征构建
为了适应平台特性和推荐场景的多样化,今日头条在特征构建上有如下特色:
语义标签类特征:今日头条将其分为分类特征、概念特征、实体特征三类。分类特征要尽可能覆盖所有内容;实体特征要求精准,能明确区分究竟指代哪一个人或物,但不要求覆盖全面;概念特征则负责解决比较精确又属于抽象概念的语义。构建语义标签体系,主要是基于今日头条作为一个内容平台,内容体量庞大、类型丰富,需要对内容赋予粒度不同的标签,以满足各种推荐场景和推荐解释的需要。
文本相似度特征:今日头条建立了细化的文本相似度特征体系,从相似文章的主题、行文、主体等内容进行相似度计算。今日头条用户反馈的最大问题之一就是推荐内容重复,但用户对重复的定义却不尽相同,因此需要根据用户特征从多个维度衡量文本的相似度。例如,有人觉得新闻主体人物维度的重复就是重复,而对于恨不得把所有偶像文章都看一遍的粉丝而言,可能要行文内容的重复才叫重复。
3. 策略制定
今日头条的策略设计,同样要适应平台特征和推荐场景:
过滤噪声:资讯平台上,为了赚取点击,充斥着大量的标题党。对于用户来说,点击标题党内容将造成期望与现实的落差,极大地损害用户对产品的价值判断和使用体验。因此,对诸如标题党一类的噪声进行过滤对今日头条十分重要。过滤策略如:过滤点击后停留时间短、文本识别出标题党特征的内容,以及对多发标题党文章的账号进行过滤和降权。
热点惩罚:资讯平台和许多内容量、用户量大的平台一样,在用户和物品的数据上呈现长尾分布。因此,会出现少部分被大量用户产生行为的热门文章,影响用户个性化偏好的识别,进而影响推荐的准确性。因此,需要对热门文章上的用户行为做降权处理。
时间衰减:用户、内容的特征都是随着时间变化的。特别是对于资讯平台的用户和内容来说,用户的口味相对广泛、跟随热点,内容更新频率快、热度变化快,因此,对于用户和内容来说,新近的行为更能够反映此时的特征,策略应当有所偏向。
惩罚展现:用户的负反馈往往以隐性方式呈现,需要捕捉。对于资讯内容平台来说,用户的不感兴趣往往通过展示不点击来体现。因此,需要对未被点击的展示内容相关特征进行降权。在制定具体策略时,为了使负反馈识别更加准确,要结合场景的上下文预先判断未点击内容的展示数量、集中程度等。
参考文献:《今日头条算法原理》原文链接
电商二手交易平台推荐——以闲鱼为例
1. 平台特性和推荐场景
商品时效性强、个性化强:闲鱼作为一个二手商品交易平台,站内的商品主要来自个人卖家,形成了商品的孤品属性,库存量往往非常有限,一旦被卖掉就会被下架,因此闲鱼商品的时效性极强,生命周期短,对数据的实时性要求高。此外,闲鱼上的许多商品出自个人卖家,类目丰富多样,且商品信息缺乏结构化、规范化的信息,现有的电商商品标签特征体系很难涵盖完全。
商品价值的主观性:二手商品的新旧程度、功能损耗、价值描述等,都是卖家根据自己的主观意愿对商品进行鉴定,很难客观和规范的衡量产品的价值。而对于买家,商品的价值同样是主观的。因此,二手商品的价格特征相对于普通电商商品更能够反应买家和卖家个性化的偏好。
推荐场景:闲鱼商品的推荐场景以首页的推荐流为主,此外还有各种小池子推荐、商品相关推荐等。由于二手商品的多样、庞杂等和较高的时效性,闲鱼商品往往需要小池子推荐,以特定的商品类目、购物场景等进行划分,以整合商品信息、增加长尾曝光,提高商品分发的效率。
2. 特征构建
二手商品标签体系构建:二手商品的信息结构化程度低,因此需要大量结构化工作的投入。目前,闲鱼通过在商品发布的各个环节都提供了同款关联的入口,通过同款信息的匹配和映射实现商品信息的结构化,如对发布时的信息和图片进行相似度检测、图像识别、引导用户关联等,并利用已有的电商数据体系。对于非标品,则可以从用户需求倒推,通过搜索推荐等导购场景反向分析可以拿到当前买家关心的品类和属性,从而补齐缺失数据。
3. 策略制定
小商品池推荐:如前文所述,闲鱼平台商品具有多样、个性、非标准化,因此为帮助用户更好的交易,减少在交易过程中的信息不对称,增加商品的曝光,需要根据人工规则预先筛选出一部分商品再进行推荐,在闲鱼中以频道导购的形式展示给用户。小商品池具有实时性,要求商品可以实时的流入、流出小商品池,从而为用户提供最新的优质商品;此外也具有更强的多样性,不同于普通的频道分类导购聚合同一类目的商品,二手商品小池子的聚合更适合购物场景、购物群体下多品类商品的聚合,因此,对于不同品类商品的筛选、占比和排布需要策略设计。
实时商品推荐:闲鱼平台上,二手商品的流入、流出十分频繁,新增商品需要实时更新数据,更需要在行为数据较少的情况下进行实时推荐。因此,可以对新发布商品在小池子中进行一定时间内的提权,以增加曝光促进教育,以及收集更多数据进行更精准的推荐。
参考文献:《推荐算法在闲鱼小商品池的探索与实践》,原文链接
O2O外卖平台推荐——以饿了么为例
1. 平台特性和推荐场景
用户、物品多样:饿了么推荐平台作为流量分发的中枢,连接着用户(流量)、商家(供给)和平台本身。对于用户主要是提供良好的决策体验,并优化整个链路的体验;对于商家侧则要带来精准的流量和订单的提升,并提升商家的曝光效率,帮助商家在平台上成长;对于平台而言,核心是提供流量变现、交易价值以及建设好健康的流量生态,服务于平台的长期目标。饿了么的核心流量分发入口是搜索推荐,场景覆盖90%以上的用户。这些流量的来源平台多样,有饿了么、支付宝、手淘、小程序/H5等,且去向类目丰富,除了美食还有商超、鲜花、生鲜、医药等。
区域分异,情况复杂:外卖业务的流量成点状区域分布,每个区域的城市发展阶段、商户分布特征、外卖消费特征、流量分布不同。因此需要对流量进行人工调控,以为结合地区特征制定差异化的策略。
时间敏感:外卖用户时间敏感,尤其是用餐高峰期。外卖业务的流程与传统电商相比,核心区别点在于商家出餐和及时配送过程。下单后的出餐与配送时间是用户体验的重要要素。因此,除了根据用户对于商家的喜好以及转化衡量推荐质量,还需要考虑配送时长,以发现用户体验层面的问题。
峰值效应与资源约束:高峰时段是普通时段的几十倍,给工程带来挑战的同时,高峰期用户行为分布变化较快,也对快速捕捉用户行为提出了较高的要求。同时,餐厅、骑手、运营资源都在固定时间比较有限,如何在多重约束的情况下综合优化用户体验也是挑战。
3. 策略制定
市场机制:目的是效率最大化。推荐算法的目标可以拆解为分配流量、内容供给、促进转化和实现交易。其中,推荐对提高转化效率起关键作用,可进一步将推荐解决方案拆解为点击、转化、客单价、单笔收益、决策效率、就餐体验、等待时间等模型的构建和组合,以实现优化目标。而优化目标的制定也根据产品特性和实际的测量效果有所调整和偏重,经历转化率、访购率、毛GMV、净GMV、净GMV+UE的变化。
调控手段:目的是效率最大化基础上的流量再分配。如果单纯以最大化单日GMV为目标,会存在流量分布的马太效应以及新店成长问题。而调控手段则主要解决长期平台生态问题,包括多个方面的平衡,如:用户对商家、商品的偏好以及总体满意度方面的平衡;当天立即下单转化的需求和对用户兴趣探索成本的平衡;自然流量效率和商家在平台成长或赋能线下商家间的平衡;平台短期收益和长期生态间的平衡;不同业务线间流量平衡、短期平台广告收入与平台转化间的平衡,等等。此外,基于算法模型产生的数据层面的最佳结果,并不一定符合人的认知。例如,基于ctr预估的逻辑会展示更多用户已经点击和购买的商户,不易满足探索尝鲜型用户的需求,不利于拓展推荐结果的多样性。
因此,可以从以下方面进行人工的调控手段:
商户类型打散和强插。为防止同类商户扎堆,人为设置同类型商户连续出现的最大值,并强插非相关商户和食物以拓展兴趣。
商户质量重排。为保证前排推荐商户的质量,对应影响质量的关键因素,例如食物数量、分值进行低质降权和沉底。
重排力度和优先级设置。不同区域商户特征差异大,对于连锁店聚集的地域,如公司办公区域周边,加强商户名称、类型的打散;不同重排策略的先后顺序和优先级也会影响到重排结果,越靠后的重排策略优先级越高。
参考文献:《饿了么推荐系统:从0到1》原文链接
《外卖推荐算法中有哪些机制与手段?》原文链接
To be continued...
本人对行业和业务理解有限,欢迎大家评论、私信提出意见建议~