推荐系统遇上深度学习(六十七)-计算广告中的COEC简介

最近工作中接触比较多的是COEC(Click on Expected Click),本篇文章就来简单介绍一下其概念。

在《计算广告》一书中,已对其概念做出了介绍,感兴趣的同学也可以进行参考。

当给你两个广告,广告A的点击率是0.3,广告B的点击率是0.2,那能说明广告A的质量好于广告B么?单从点击率来看,确实是这样的,但假设我再告诉你曝光数据:

哇,可以看到广告A和广告B都曝光了10次,广告A的曝光位置一般比较靠前,广告B的曝光位置一般比较靠后。我们都知道,广告排在越靠前,点击率一般较高,而越靠后,点击率一般都比较低。你是否开始怀疑前面的结论是否准确了呢?此时我在告诉你每个位置的点击率数据:

这个期望点击率,我们在后面再来介绍如何得到。有了这个点击率的数据,我们就可以计算广告A和广告B的期望点击次数:sum(每个位置的曝光 * 每个位置的期望点击率):

可以看到,广告A的期望点击次数是5.1次,广告B的期望点击次数是2.85次,但是广告A实际点击了3次,广告B实际点击了2次。那么我们是不是可以拿实际点击数和期望点击数的比值来更准确的判断广告质量的好坏呢?是的,实际点击数除以期望点击数,便是本文要介绍的COEC:

通过COEC的计算,我们看到,其实是广告B的质量更加好。

讲到这里,其实你应该能够大致明白COEC是怎么回事了,它更能够准确表示某个广告的实际点击率水平,能够一定程度上消除位置和其他因素的偏差对于点击率的影响。

最后再讲一点每个位置期望点击率的计算,这里简单讲三种方法:
1、最简单的一种方法就是直接统计每个位置上的点击率,但这么做并不十分恰当,一个影响最大的因素就是广告质量。在推荐系统中,排在后面的广告本身的质量一般比前面的差,广告质量的差距会导致后面位置的期望点击率偏低。

2、第二种方法是搞一个小流量实验组,对广告进行随机排序,这样一段时间后,再统计每个位置的点击率。这样做的话广告质量的影响基本消除了,缺点就是不够个性化。

3、第三种方法就是训练一个模型了,基于用户和上下文特征去预测每个位置的点击率pbias(u,c)。具体训练的方法这里就不再介绍了。

好了,你们弄懂COEC是怎么回事了么?

你可能感兴趣的:(推荐系统遇上深度学习(六十七)-计算广告中的COEC简介)