ocpc系列 (二)ocpc智能出价PID控制中不同偏差函数特性对比

在《ocpc系列 |(一)智能出价PID控制中的偏差与响应函数设计》中,我们介绍了比率形式的偏差和差分形式的偏差,以及几种响应函数。
这一篇文章将详细讲讲不同的偏差函数和响应函数的特性,具体使用的时候可能遇到的问题以及解决方案。

一.比率偏差

比率偏差:

(一) 采样调节

比例形式的偏差与差分形式最重要的一点不同在于其值是否在每个时间片都存在。我们知道,以real_cpa为自变量,这个函数的图形是个反比函数,定义域为(0,+无穷),值域为(-1,+无穷)。
同时我们也知道,在pid控制算法中,偏差都是离散化到每个时间片去进行计算的。假设我们的采样时间为1h,是不是每个小时都有real_cpa呢?不一定。
若我们定义在激活为0的时刻,real_cpa等于0,那在计算cpa_ratio_delta的时候,分母为0没有意义。

这个时候可以用采样调节法来进行调节。
一般情况下,自动调节过程是连续进行的,这种方式可以随时获得对象参数,随时采用手段进行调节,具有很大的及时性。但在某些情况下确并不适用,甚至导致调节失败。

而采样调节是一种周期性的断续调节,主要应用在被调节对象的状态和调节手段在时间上严重不同步的情况下。采样调节依据的不是即时测量的结果,而是在施加调节手段后采取被调节对象参数稳定后的数据,并以此作为依据进行比较、运算、调节。这时的数据采集,可以是通过连续测量判断被调节对象参数已经稳定后进行采集,也可以根据经验或计算在上一个调节过程结束后直接间隔一段时间后采集。所以整个调节过程呈现为一种周期性的断续调节。

比如说如果当前时间片没有激活,那当前时间片不进行计算,数据全累计入下一个采样周期,以此类推直到产生激活。
然而,单纯的这种更改计算周期的做法,可能造成所以广告主有可能故意不回传激活。所以还要配合上罚项,来做一个风控。比如跑了多少钱或者多少个cpa仍然没有激活,就卡死这个计划。

(二) 极端情况

比例形式的偏差还会遇到一种bad case,通常是real_cpa很小造成e的值很大,然后因为这个偏差是非对称的函数,在累计误差的时候就拉不回来了。

造成real_cpa很小的情况,原因是因为每个时间片的real_cpa=时间片内消耗/时间片内激活数。恰好某些时间片消耗很少,但确实产生了激活,就会造成这种极端情况。
比如某个时间片只有1元消耗,却恰好产生1个激活,广告主的given_cpa为100,那么那个时间片的e=100/1 - 1=99。由e的值域>-1知,这种情况下想把累计误差拉回到0,至少得99个时间片。其实不管是1个激活,还是1块钱的消耗,都是不置信的,但是在比例偏差里,这种问题确实存在。

解决方法大致有以下几种:

  1. 有效偏差法:当位置型PID算式的控制输出超过限制范围时,控制量只能取边界值。有效偏差法的实质是将相当于边界控制量的偏差值作为有效偏差值进行积分。
  2. 积分分离法:积分分离法的基本思想是在偏差大时不进行积分,仅当偏差的绝对值小于一预定的门限值ε时才进行积分累积。这样既防止了偏差大时有过大的控制量,也避免了过积分现象。
  3. 积分限幅法:基本思想是当积分项输出达到输出限幅值时,即停止积分项的计算,这时积分项的输出取上一时刻的积分值。

二.差分偏差

差分形式的偏差:

差分形式的偏差相对比例形式来说,有几个比较好的性质。首先它的误差累计是对称的,其次它的值在任意时刻都有意义。所以它不需要采样调节,也不会遇到上述极端情况。

但是因为是成本绝对值控制,要特别注意控制单位。如果我们以元作为单位,那么假设某一时间片它的e为100,也就是比预期少花了100元。此时只考虑比例控制的情况,响应函数选指数函数,则有

假设kp=1,那么k=e^100,是一个很大的数,不符合实际控制需求。所以差分形式的偏差需要额外注意控制单位,一般为x百元或者x千元。

另外差分偏差对成本绝对值的控制也更加敏感。举个例子,比如说同样的计划,真实消耗10W,广告主要求成本9W。

如果采用比率偏差,那它的整体的偏差是9/10-1=-0.1,看着偏差很小,实际上我们感知的时候超10%的成本也还行。

但是在差分偏差中,假设以百为单位,总偏差就是(90000-100000)/100=-100,基本上你就投放不出去了。

差分偏差也可以视具体情况搭配有效偏差法,积分分离法,积分限幅法来进行控制。

这两种偏差形式在广告场景中均有应用,可根据具体场景和控制目标来进行选取。

下一篇文章,我将给大家介绍下ocpc一阶段的机制迭代。

精彩预告:

第一篇:ocpc智能出价PID控制中的偏差与响应函数

第二篇:智能出价PID控制中不同偏差函数特性对比

第三篇:ocpc一阶段机制

第四篇:ocpc行业模型详解

第五篇:延迟模型在ocpc中的应用

第六篇:ctr校准与cvr校准

第七篇:ocpc自动扩量技术

第八篇:如何从0开始建立ocpc业务

第九篇:ocpc中的深度转化模式

第十篇:ocpc智能出价离线仿真模块

第十一篇:评价ocpc效果的指标

第十二篇:ocpc中的赔付机制

……

你可能感兴趣的:(ocpc系列 (二)ocpc智能出价PID控制中不同偏差函数特性对比)