Optimized Cost per Click in Taobao Display Advertising-oCPC 店商广告投放经典论文


欢迎转载,请注明出处:http://blog.csdn.net/stund/article/details/73611755

0、背景简介

之前了解oCPC概念是从今日头条流传出来的,之后各种寻找终于找到大淘宝的一篇原创性的论文。点个赞!下面正式开始。

文章提出了Optimized Cost per Click(oCPC)方式去优化站内广告投放效果-自动动态调整广告对流量的竞价bid,控制roi的同时提高gmv。具体场景是淘宝这种能拿到最终转化数据的平台的广告投放工作。在移动端的列表页广告与banner广告场景中展开。

整理文章中的缩写:

  • pay per click (PPC) 

  • gross merchandise volume (GMV)

  • cost per mille (CPM) 

  • cost per click (CPC) 

  • Real-time bidding (RTB) 


1、Introduction 

淘宝广告平台的特征:

* 打通用户从浏览到付款的闭环。

* 广告主多数是中小型商家,相比品牌效应更关注收入的提升。因而增加gross merchandise volume (GMV) 对这些商家有益。

* 投放广告需要满足媒体的要求。以GMV为例分析一下:首先,不影响用户体验,需要在商业收入和用户体验之间达到双赢的状态。其次,广告主大多是淘宝平台的商家,其广告费多数来自于其收入的某个固定比例。所以,增加GMV能影响广告主增加广告投入,有利于广告平台的长远发展。


相对于CPS时广告主承担更小的损失风险却忽略了点击的价值,导致 worse traffic liquidating efficiency. 而CPM则是广告主方承担了较大的损失风险,综合来看CPC是淘宝平台广告比较有效的运作方式。 Facebook[9] 在之前的文献中有提出类似的oCPM:广告主按点击出价而按展现量计费适合SNS网络。

淘宝广告平台系统流程:A, matching stage匹配过程,从大量广告中粗选出一些广告。B,Real-Time Prediction(RTP) 预测精选广告集的pCTR。C,基于bid*pctr排序。

传统广告投放系统中,只能指定特点用户群体与广告位上的叫初粒度的竞价bid。缺点是:A,不同质量的流量没有在出价中体现出差异。B,对应的eCPM追求的是短期的商业利益,而不能优化GMV等长期收益因子。

OCPC: 对每次广告请求都动态设置bid 为与该流量的质量相匹配,综合优化了用户体验、广告主的诉求、淘宝平台方的收入;同时保持使用eCPM的排序机制不变。

2、System Architecture 

介绍了淘宝广告业务的工程架构与对应的数据流动方式。先上架构图:

各个子模块的简要介绍:

  • Front Server: 大前端对接一次广告请求
  • Merger Server: 中心Hub。 内部的Strategy Layer进行oCPC优化流量,广告去重,广告计费。
  • Matching Server: 提取用户信息标签集合,用于广告主的用户定向需求。
  • Search Node Server: 生成所有相关的广告Ads与其出价bids。
  • Real-time Prediction Server(RTP): 基于Mixture of logistic regerssion, MLR预测pCTR与pCVR。
  • Data Note Server: 用Smart Creative Service(SCS)进一步优化。

3、OPTIMIZED COST PER CLICK 

下面开始讨论oCPC算法。

本文约定广告主的需求是:ROI 与 增加高质量的流量。GMV则视作广告平台的生态指数。通过调整广告主的bids优化GMV与广告平台的收益(eCPM)。

3.1 Optimization Scope 

ROI 约束:

针对淘宝平台主要是中小商家,重视营销效果的需求;平台方主要采取保持它们的广告的ROI持平或增加,优化它们的GMV的方法。

名词说明:

  • 广告活动的集合记为A, 每个广告活动记为a,广告主对应的出价为ba。oCPC通过调整其得到优化后的出价b*a 而得到预先约定的优化目标。
  • 用户对广告a 的预测的成单价(predicted pay-per-buy, PPB)记为va.  
  • 一个用户u 在一段时间的总点击数记为 n
  • 用户u 对其点击过的广告a 的成单概率记为p(c|u, a), 一次点击的期望roi=p(c|u,a) * v/ ba . 
  • 假设广告a 在给定受众群体与位置时的出价ba是常量,则广告a 在所有投放流量上的期望 ROI为: 

  • 上式中,约定v 对每个广告a 是固定的(is inherent),期望值E 对每次广告拍卖时是固定的(is stationary)。
  • 期望值Eu的计算方式:用pCVR模型对过去一段时间的广告(点击)数据进行预测,去掉Top&Buttom的10%的cvr数据后取其均值进行估计。

Bid Optimization Boundary 

基于3.1中的讨论可以对bid 与优化后的bid* 设置一些约束条件, 比如: 

bid*a  / bida  <= p(c|u,a) / Eu (p(c|u,a) 时,既能保证最终的 ROI 不会降低。

【讨论】:从这个式子里面可以看到,如果本次的流量的转化大于历史均值,那么提高出价,反之,则降低出价。由于该公式是通过每次优化后当前pcvr较高才提高出价,所以对该广告主会引入更高转化率的流量,长期累计后Eu的值也增加,从而会导致bid*/bid 趋近于1 (上限值)。

一些bid 优化的原则:

  • 在保持ROI约束(不增)时,增加bid 的值,从而提高广告主获得有价值的展示流量的机会。(说明:即 p(c|u,a)/ Eu >=1 ,对应约束条件中的 bid*a  / bida >=1 )
  • 在低价值(即p(c|u,a)/ Eu <1 )流量上减小bid 的值,为广告主节约成本。
  • 考虑到安全和商业环境因素,将波动的上下限设置一个阈值 ra =40%。

优化原始出价bid 后的出价上下限为:

如果广告主关闭优化bid的功能,则上下限都为广告主的原始出价bida 。

3.2 Ranking

提出一种新颖的方法优化bid,达到在综合考虑各方需求并保持用eCPM 排序的情况下,达到最佳综合指数的效益( composite index )。

给定广告k,在eCPM 排序机制下优化bid的目标函数为:

说明:

  • f( * ) 是bida 的单调递增函数。两个计算函数的例子:  
  • f1(k, bk)=pctr∗pcvr∗vk,  即提高GMV。

    f2(k, bk)=pctrk ∗pcvr∗vk + α∗pctrk ∗bk ,综合提高GMV 和 广告收入。

  • 上式的约束条件1: argmax pctr * b 表示保证按eCPM排序时保持在第一位。
  • 约束条件2:控制优化后的bid在3.1中约定的上下限区间里。
  • 约定pctrk ∗bk 的边界为 l(S*k)=pctrk ∗ l(b*k),u(S*k)=pctrk ∗ u(b*k)。

排序求得最优的bid'a 实现 f(k, b) 的最大化:只需要将广告按f(*) 降序排序,选择对应的 u(Sk )  >= 所有其他广告的l(Si )  的广告k (保证满足上式中的两个约束条件),作为结果广告展示并将其出价bk  置为 u(bk )  ,然后调整其他广告的bid值使得广告k 具有最大的eCPM 值。

算法流图:

说明:

  • 第3行即先对广告集合进行排序。
  • 第4-5行即挑选出一个广告k 
  • 第8-11 行即对应更新剩下的广告的bid和eCPM的上限,保证前面被选出的广告k 有最大的eCPM
  • 第13-15 行即将所有广告的优化后bid 设置为其上限eCPM对应的出价。

效果:解耦了最后一步的排序和 广告流量目标,一方面,广告仍然通过最大话eCPM的方式排序;另一方面,广告平台可以根据不同的目标函数f(*) 选择不同的广告。

3.3 Algorithm Details 

校准:

历史经验发现,在oCPC之前得到的预测值cvr存在某些固定的偏差,因而需要对预测值先进行校正,再用来计算oCPC。

在对应的真实CVR值较大是,RTP模块的模型预测的pCVR值会被估计为一个更大的值。我们将广告按其pCVR升序划分为20组,对比不同组的预测pCVR与真实cvr的比值,会越到较大值的pCVR所在组时比值越大。

校准预测的pCVR的方式:

其中,tc 即阈值点,tc=0.012。

【讨论】:因为p(*)<1故log(p) <0,将p(*) 的值缩小,达到缩小pCVR与真实CVR的gap(pCVR > 真实CVR)的效果。

完整的oCPC 算法流程图:

说明:

  • 第1-4 行进行预测值校准 与 上下界计算。
  • 之后进行排序。
  • 最终返回优化后的bid(个人理解:计费与广告的真实排序不是按本文中的rank()来的)

4. MODEL ESTIMATION 

In CVR prediction, the results of click quality model are used as input(提升明显)。

对比pCVR - 真实CVR 曲线 和  pCTR - 真实CTR 曲线来看,前者出现在最大pCVR组的真实CVR下降的转折,而pCTR则与真实CTR的趋势一致。

文献【6】表明,有些时候线下跑出的AUC更好的模型,上线后效果可能不好。AUC指标并不区分不同用户与广告位。本文中提出一种新的Group AUC(GAUC): 

  • 1,按用户和广告展示为将测试数据分为若干组。
  • 2,在某个组内计算对应的AUC,对应全部为正or负例的分组从数据集中去掉。
  • 3,将各组的AUC 加权平均得到GAUC。 权重W(u,p) 于各组的曝光 或 点击次数相关。

监控CVR 和 CTR模型过去一周的线上数据AUC 和GAUC,每天的值都比较平稳。说明满足oCPC 实验的高度可靠性的要求。

5. EXPERIMENTAL RESULTS 

5.1 Offline Simulation 

线下模拟采用模型的预测概率来代替正式的点击率 或转化率。

设计了4组实验: 

  • Strategy 0 (Str 0), 线上策略。
  • Strategy 1 (Str 1), 一种简单的点击率优化策略,优化后的bid' 的计算公式:
  • Strategy 2 (Str 2), 本文提出的OCPC策略,上式中的max f(k, b') 的计算公式:
  • (补充说明:考虑了整个广告队列的转化情况,是提升ROI效果的重要原因
  • Strategy 3 (Str 3), 直接按 pctr ∗ pcvr ∗ bid 排序,而不做bid的优化。
  • 其中,Str 1 与Str 2 的参数w 采用交叉验证取值为2 和 6.
  • Str 1 聚焦于优化广告主的ROI而不保证对RPM的效果。 Str 3 通过按pctr*pcvr*bid 排序提高GPM,同事拉低的RPM(因为pay per click 与CTR下降)。只有Str 2 同事在GPM、ROI、RPM之间取得效果。

Offline simulation results indicate that larger ra can bring better performance. 

the increment of RPM is less than that of GPM, which results in a higher ROI lift when the adjustment range is large. 

分 campaigns 分析:

取广告消费TOP10 的活动分析,其中有8个的ROI有提升。其中有7个活动的GMV增加而PV降低-即他们放弃了部分相对它们而言的低质量流量。


5.2 Online Results 

目前淘宝的列表页广告每天有9+KW(@201608)。

Advertisers’ interests (indicated by ROI), platform’s revenue (indicated by RPM) and overall GPM achieve a tripartite win-win situation. 

In all campaigns with more than 5 conversions in a week, 67% campaigns get GPM and ROI improvement at the same time. And 24% campaigns are in the so called quantity and quality ex- change situation: their PV increment is larger than the ROI drop.  

 more than half impressions belong to group 5, the middle group which includes records with b= ba. It’s a reasonable observation, because the bid optimization upper bound for those low quality traffics is set to  ba according to Eq5. 

不同的广告品类由其内部固有的ROI和CVR区间。

分析不同品类的占比变化: PV占比方面,the traffic shifting is not too obvious, with all the variations are within ±10% 。17% categories (with 62% PVs) get GPM and ROI improvement 。

在淘宝双十一前,商家比较关心用户将其商品放入购物篮的数据。本文使用OCPC实验不同的f(*) 在双十一前夕的表现。公式如下:

效果:OCPC策略将  ASR has been improved 15.6%  

同时也在Banner CPC广告中实验了OCPC,公式如下:

其中,w=6,ra =0.4, 

在f(*)中去掉了va, because there are store campaigns in which PPBs of different items vary a lot. 

效果也提升明显。

 


你可能感兴趣的:(DM,ML,广告投放)