第三章开始进入本书的第二部分:在线广告产品逻辑。首先对在线广告的产品形式及发展历程进行简单介绍:
在线广告的发展历程分为4个阶段:
(1)合约广告产品:由线下广告发展而来,分为CPT和CPM广告,主要服务于后续效果不好直接衡量的品牌类广告主。由于存在量的约束,只能针对人口属性等规模较大的数据,无法精准定向。
(2)竞价广告产品:最重要形式是搜索广告,为对搜索关键词的竞价。竞价广告产生的根本原因是为了变现关键词、精细用户标签等高价值规模小的数据,放弃量的保证做到精准定向。
(3)程序化交易广告产品:即实时竞价的交易形式,可以使需求方灵活划分和选择受众,主要推动力是广告主数据(第一方数据)和第三方数据的使用(竞价广告只能使用媒体方的数据)。由于机器之间程序化的决策成为程序化交易广告产品。
(4)原生广告产品:让广告和内容以原生的方式共存。
商业产品即面向商业客户而非一般用户的产品,其目标为明确的商业目标,而非单纯的用户体验。典型代表是在线广告。关键点:
(1)要特别关注产品中的策略部分。如竞价中的机制设计、受众定向的标签体系等。
(2)要特别关注数据,让运营和产品优化形成闭环。这里的数据一是指商业目标(受益),二是指用户行为数据。
(3)用户产品追求便捷性的设计原则依然重要。
作为广告算法工程师,重点应该在广告投放、交易、策略、数据等方面,对于广告系统对需求方或供给方的接口无需过多了解,因此本节略过。
在线广告前期与线下广告相似,媒体与广告主交易,然后按CPT结算广告,对技术依赖小。以CPM计费的广告则将售卖对象从“广告位”变成了“广告位+人群”,催生了受众定向技术。然而在合约广告中,需求方技术没有发展,因为广告投放全由供给方负责。
在线广告最早方式,无法按受众投放。在某些场景下有可取之处:在强曝光属性的广告位进行独占式投放;竞品排他,实现高溢价。
广告位合约的两个变化:
(1)同一个广告根据受众投放不同的产品
(2)按广告位的轮播售卖,即依次展示不同广告
从展示量合约开始,大部分广告的核心就是受众,受众定向在各种竞价广告中也尤其重要。
市场上比较流行的定向方式:
(1)地域定向:由于很多广告主的业务有区域特性,因此地域定向所有在线广告系统必须支持。它虽然效果有限但不可或缺,比如只在某个区域经营的广告主不能在区域以外投放广告。
(2)人口属性定向:主要包括年龄、性别、受教育程度、收入水平等,与兴趣标签的不同之处在于可以监测,即使用采样加调研的方法判断一次人口属性定向的受众中正确比例是多少,因此在CPM广告中为广告主接受程度高。它效果未必突出,但由于在传统广告中大量使用,因此为品牌广告主熟悉。在没有特别数据来源(实名,购买记录)的情况下获取准确的人口属性并不容易,可以使用已有标签的人群构建分类器对人口属性进行标注,但是由于这样的标签也是通过行为数据得到的,在效果类的广告中必要性不大。
(3)上下文定向:根据网页或应用的内容进行匹配,可以粗略描述用户当前的任务,对提高广告的关注度非常重要。它的好处是覆盖率高,在任何情况下都可以即使推测用户兴趣。
(4)行为定向:根据用户的历史行为了解用户兴趣。它是对一系列上下文融合的过程,奠定了在线广告数据驱动的特性。
(5)精确位置定向:借助移动设备获取精确的地理位置,使得区域性很强的小广告主(餐饮、美容)可以投放精准定位的广告。
(6)重定向:对某个广告主(的网站)过去的访客投放广告,精度最高效果最好,但是覆盖量由广告主用户量和媒体的重合比例确定,因此比较小。
(7)新客推荐定向:找到与广告主用户行为上相似的潜在客户投放广告,目的是达到比通用的兴趣标签更好的效果。
(8)动态定价:两个例子,一是团购利用价格工具降低用户在决策阶段的门槛,二是在广告上直接显示打折降价。
(9)场景定向:利用移动设备的信息判断当前场景(健身、吃饭、开会等),借此精确投放广告。
我们需要标签体系来将用户映射到一个或多个标签上,而标签体系的规划对广告运营影响非常大。它有两种组织方式:(1)层次标签体系,上下层标签是包含关系,为根据需求方的逻辑指定(即对人群进行分类);(2)兴趣标签,不存在包含关系,可以非常精确。
选择哪种体系大多是商业上的决策:(1)标签作为广告的直接标的,需要被广告主理解及方便广告主选择,特别在CPM广告中划分不能过细(量的约束);(2)标签作为投放系统中间变量,可完全按效果驱动来划分标签(如CTR),没有必要进行层次的约束。
本节重点探讨效果驱动下标签体系的设计:
(1)汽车行业:汽车行业用户决策逻辑清晰,首先是价格不可能超过预算也不太可能低于预算较多,其次是车型,孩子多的倾向七座车而单身者倾向跑车。在这些之后才是品牌的挑选。
(2)游戏行业:由于人们对艺术的喜爱不好把握,因此不能直接用游戏的类型作为标签(玩家不可能只玩一种游戏)。这就需要对游戏场景深入研究,分析玩家的决策过程。
(3)电商行业:网购过程的决策比较奇妙,如女生看上了H&M的裙子,她可能是喜欢H&M,可能是要买裙子,也可能是看上了这裙子的特殊造型。因此电商的过程基本是不分类,而是“单品+个性化推荐”。
互联网主流的品牌广告投放方式仍然是CPM结算的展示量合约。在这过程中,媒体希望进行数据变现,广告主可以定向采买流量,但是由于有不确定因素,因此加入量的保证。展示量合约虽然售卖的是人群,但是并没有摆脱广告位,因为不同的广告位曝光度差别很大,所以CPM也会大幅变动。
(1)售前指导:尽可能准确预测流量,低估会导致资源售卖不足,高估会导致量的保证无法完成。
(2)在线流量分配:当同时满足多个合约要求的时候如何决策分配给哪个合约,依赖流量预估的效果。
(3)出价指导:在竞价广告中没有量的保证,广告主需要根据自己的预计出价估计获得多少流量。
在广告中流量预测问题可以描述为估计函数 t ( u , b ) t(u,b) t(u,b) ,u为人群标签,b为出价。在展示量合约中由于没有竞价,可以看成 b → ∞ b\rightarrow\infty b→∞的情况。
主动地影响流量,比如门户网站子频道的流量严重依赖于首页的链接,因此可以链接更多地引导到广告需求大的频道。
由于各个合约的人群大量重叠,因此如何分配保证满足各个合约是很重要的。在线分配需要根据历史数据(流量种类和数量)和某种策略,离线得到一个分配方案,线上按此执行。但是标签数量增加时,该方案的难度就会非常大(节点流量过小难以预测),因此展示量合约在人群标签精确时无法有效运作。
略。
在搜索广告和展示广告中出现了竞价的交易模式,其本质是去除量的约束,采用“价高者得”的策略投放广告。它顺应了广告精细化的发展(定向),同时使各种无法以合约售卖的剩余流量找到了变现渠道。
搜索广告在竞价广告中处于旗舰地位,一些在计算广告中非常核心的产品策略和技术方案都来源于此,因此是需要着重理解的对象。同时在竞价的逻辑下,展示广告领域产生了广告网络这种批量采购剩余流量再售卖给广告主的形式,对广告市场的流通性有很大帮助。
搜索广告的特点是广告主就关键词的广告展示机会展开拍卖式竞争,并根据竞争结果依次占据若干展示位置。它与展示量合约的不同之处在于:不存在量的保证,需要广告主自行调整;没有价格的约定,每个广告主可以随时调整出价。
搜索广告是以查询词(竞价关键词)为售卖对象的CPC结算广告。如图所示,PC搜索广告的展示区域分为北区东区和南区,竞价时候只有北区东区参与竞价,排序为从北区第一个位置拍到东区最后一个位置。南区广告是照搬北区或东区前几条。其基本形式是与自然结果一致的文字链。而在移动搜索广告中,则没有东区。
搜索广告的特点:
(1)eCPM远高于一般展示广告。
(2)受众标签为上下文的搜索查询,定向非常精确,而根据用户历史得到的兴趣标签则不太重要,因此eCPM由 r ( a , u , c ) r(a,u,c) r(a,u,c)退化成了 r ( a , c ) r(a,c) r(a,c)。
(3)展示结果与自然结果非常接近。
(4)从搜索广告发展起来的竞价交易模式已经发展为互联网广告最主流的交易模式。
搜索广告的3个探索趋势:
1.超越文字链的创意
(1)在广告链接上增加更多有表现力的信息点如②。这种方式与行业基本无关,因此可以广泛采用。
(2)直接展示结构化广告内容摘要,甚至一些可在直接访问的功能,如①。这种方式需要分行业设计方案,因此规模化程度有限。
2.弱相关广告形式
即在东区增加一些相关性稍低的内容。
(1)③是常见的带有品牌意味的广告。
(2)④同类推荐功能,可以接触潜在客户。
3.原生化探索
搜索广告的决策过程分为查询扩展、检索、排序、放置和定价。其中排序的依据eCPM可以表示为 r ( a , c ) = μ ( a , c ) ∗ b i d C P C ( a ) r(a,c)=\mu(a,c)*bid_{CPC}(a) r(a,c)=μ(a,c)∗bidCPC(a), / m u /mu /mu为点击率, b i d C P C ( a ) bid_{CPC}(a) bidCPC(a)为广告主的出价。
1.查询扩展
即为广告主拓展相关查询词,扩大匹配流量。常见方法有:
(1)精准匹配。将用户的查询词分词,如“英语培训”分为{英语,培训}词集,当与广告主的词集完全一致时触发,如“英语培训”和“培训英语”。
(2)短语匹配。用户的词集包含广告主词集时触发,如“英语培训暑假班、英语的培训”,但“英语歌曲、电脑培训”则不会被触发。一般较准确。
(3)广泛匹配。查询词与广告主的关键词高度相关时触发,如“外语学习班、四级证书”。由于相关性由数据挖掘算法获得,精准性会打折扣。
(4)否定匹配。广告主明确指出哪些词不能被匹配。
2.广告放置
广告候选排序后需要确定北区和东区的广告条数,称为广告放置。主要考虑的是进入北区的条件。北区是黄金的广告位置,与收入直接相关,但北区广告会影响用户体验。因此在关注收入指标时,也要关注北区广告数量和质量。北区平均广告条数成为NFP(North Foot Print),在考察新算法的RPM(千次展示收益)时,如果NFP显著变化,则PRM的变化也没有太大意义。
广告进入北区的关键因素是:广告相关度是否足够;广告RPM是否足够。这是为了保证用户体验和高效利用展示位置。同时北区广告还需要考虑用户的偏好,对于那些习惯性跳过广告的用户应当减少广告条数,而对于不太会分辨的用户可以尽量使用北区的位置。
略
竞价广告是根据广告主的eCPM来决定谁可以得到展示广告位的。如图,假设有S个广告位,根据经验价值排名s=1,2,…,S(即s的值越小价值越高,点击率越高)。有一组广告a=1,2,…,A出价,每个广告出价 b a b_a ba,系统将前S个高出价广告依次放置在S个广告位上,称为“位置拍卖”。当某个广告a被放置在s时,eCPM为 r a s = μ a ν s r_{as}=\mu_a\nu_s ras=μaνs, μ \mu μ为点击率,假设仅与s有关, ν \nu ν为点击价值,假设仅与a有关。
为了控制广告质量和保持出售单价,往往要设置一个拍卖最低价格,称为“市场保留价”(MRP)。一般竞争较充分的时候MRP可以设得较高。MRP的设置有两种方法:对整个竞价市场采用同样MRP;对不同标的物(如搜索关键词)设置不同MRP。在搜索广告中,虽然北区和东区使用同一竞价队列,为了北区更好地变现,它的MRP会更高一点。
定价问题探讨的是如何对最后某个位置的广告主收取合适的费用。按照一般的想法,应该是根据广告主自己的出价收取费用即可,然而并不是如此。假如在一次竞价中有两个广告主甲和乙,甲出价1元,乙出价2元,乙赢得竞价,并按照2元收取。由于不断产生的广告展示机会,广告主可以调整出价,乙会不断降低出价,直到发现低于1.01就无法赢得竞价,就会固定价格为1.01。如果有第三个广告主丙加入,它也会在不断调整之后固定出价为1.02。但是如果采取另一种定价策略,即只收取下一名(甲的)出价作为(乙的)费用(1元),这样乙就没有动力调低出价。同样丙加入并赢得竞价之后,所收取的费用为2元。这种策略可以为市场创造更高收益和稳定性。
从市场来看,我们研究的是稳定状态下的收益,即系统处于纳什均衡状态,每个广告主都获得了最符合自己利益的位置:
μ s ( ν s − q s ) ≥ μ t ( ν s − q t ) , ∀ t > s μ s ( ν s − q s ) ≥ μ t ( ν s − q t − 1 ) , ∀ t < s \mu_s(\nu_s-q_s)\ge\mu_t(\nu_s-q_t),\forall t>s \\\mu_s(\nu_s-q_s)\ge\mu_t(\nu_s-q_{t-1}),\forall tμs(νs−qs)≥μt(νs−qt),∀t>sμs(νs−qs)≥μt(νs−qt−1),∀t<s
这里 v s v_s vs指排在s位置上的广告的点击价值而非s位置带来的价值; q s q_s qs指向s位置的广告收取的费用。之前说过s是根据价值排序的,t>s表示t是比s排名要后的广告位,而t μ t ( ν s − q t ) \mu_t(\nu_s-q_t) μt(νs−qt)的意思是假设s位置上的广告放到了t位置上,s广告的点击价值减去t位置的定价再乘以t的点击率得到最后收益。这均衡状态的意义是对于s来说,当前位置的收益比其他位置的收益都要高。当然我认为书里的这条公式似乎错了?第二条的t-1应该直接用t就好。
在这公式中,市场可调整的只有 q s q_s qs,即定价策略。最常见的是广义第二高价(GSP),还有一种是Vickrey-Clarke-Groves(VGG)。
1.广义第二高价(GSP)
广义第二高价即对每一个广告主收取下一位广告主的出价作为定价。它并不是社会福利最优机制,但是实现简单容易解释,是主流定价策略。
在CPC结算广告中,排序是针对eCPM的,因此定价公式为:
q s = μ s + 1 b s + 1 / μ s + Δ q_s=\mu_{s+1}b_{s+1}/\mu_s+\Delta qs=μs+1bs+1/μs+Δ
公式理解:在CPC广告中,点击价值v用出价b来估计,即 e C P M = r s = μ s ν s = μ s b s eCPM=r_s=\mu_s\nu_s=\mu_sb_s eCPM=rs=μsνs=μsbs。s为按照价值从小到大排序,即 μ s b s > μ s + 1 b s + 1 \mu_sb_s>\mu_{s+1}b_{s+1} μsbs>μs+1bs+1。按照广义第二高价,使用 μ s + 1 b s + 1 \mu_{s+1}b_{s+1} μs+1bs+1作为eCPM,算得在此情况下的定价为 μ s + 1 b s + 1 / μ s \mu_{s+1}b_{s+1}/\mu_s μs+1bs+1/μs。 Δ \Delta Δ为结算货币的最小单位如1美分。这公式的意义是:s位置的广告主出价为 q s q_s qs时,能够保证赢得此位置得竞价,即eCPM保证比s+1位要高一点点。
2.VGG
基本思想是对于赢得某个位置得广告主,所付出得成本应该等于他占据这个位置给其他广告主带来得价值损害:
q s = ∑ t > s ( μ t − 1 − μ t ) ν t q_s=\sum_{t>s}(\mu_{t-1}-\mu_t)\nu_t qs=t>s∑(μt−1−μt)νt
这条公式很容易理解,当s广告主不存在时,所有t位置得广告都会到t-1位置上,因此s给其他下面的广告主带来得点击率损失是 μ t − 1 − μ t \mu_{t-1}-\mu_t μt−1−μt,再乘以点击价值得到收益损失。VGG是社会福利最优得定价方式,平台得收入不如GSP。但是由于VGG难以向广告主解释清楚,不是一种主流得定价方式。
在竞价的机制中,CPC计算广告的eCPM会进行一些微调:
r = μ k ∗ b i d C P C r=\mu^k*bid_{CPC} r=μk∗bidCPC
其中k为大于0的实数。随着k的增大,点击率的影响变大,即对价格进行挤压,k称为挤压因子。它可以根据市场情况主动影响市场的发展。如果市场存在出价高但是品质不高的广告主,可以通过提高k来强调质量;如果发现市场竞价激烈程度不够,可以降低k来鼓励竞争,短期使营收上升。
GSP和VGG关注的是社会福利最优,而关注平台收入时,理论最优收入机制为Myerson拍卖。假设广告a的点击收益 v a v_a va为随机变量,概率密度函数 f a f_a fa,概率分布函数 F a F_a Fa,出价为 b a b_a ba,假设不考虑点击率,则:
(1)将出价映射为 b a ′ = b a − [ 1 − F a ( b a ) ] / f a ( b a ) b'_a=b_a-[1-F_a(b_a)]/f_a(b_a) ba′=ba−[1−Fa(ba)]/fa(ba)。
(2)以0作为MRP对 b a ′ b'_a ba′进行过滤。
(3)以 b a ′ b'_a ba′进行第二高价定价,转换回真实出价来收费
这条公式其实存在有一个完整复杂的数学推导过程,我并没有深入去研究,有兴趣的可以上网查找资料。如果是直观上的理解,假设 f a f_a fa为正太分布,则在概率最大点时( b a b_a ba为对称轴,也是收益的期望值),所有分布的 F a ( b a ) F_a(b_a) Fa(ba)都为1/2,而 f a ( b a ) f_a(b_a) fa(ba)随着 b a b_a ba的增大而减小(可以理解为正态分布更扁了,最高点更低了,因为分布一定从x轴上的0开始)。因此,对于期望收益越大的广告主,出价映射过程的惩罚项就越大。
Myerson拍卖很难向广告主解释,因此很少直接使用。我在网上找了一个GSP,VGG和Myerson的对比图,大家可以看一下。
这一小节主要是展示挤压因子k的效果,比较简单就略过了。
广告网络的功能为批量聚合各媒体的剩余流量,以流量切割的方式售卖给广告主。
竞价广告网络的特点:
(1)不作量的保证,而是仅根据eCPM来决定每次的分配。
(2)按照人群售卖(即精准受众划分),淡化媒体和广告位的概念。
(3)由于无须满足广告主品牌独占的要求,可以提高市场流通性。
(4)一般采用广告主先充值的方式。
广告网络的主流是CPC结算,这是因为广告主无法评估广告位的曝光价值,因而只能通过点击率来评估,而且由于广告网络聚合了多个媒体的流量,接触到同一个用户的丰富行为,因而更容易估计点击率。
1.广告检索
广告网络的检索与搜索广告的词集不一样,它的输入是受众通过标签提取出来的embedding,而更多的标签得到的embedding用来检索的效果也就越好。
2.广告排序
同样是根据eCPM进行排序,关键点在于对点击率CTR的预测。
略。
竞价网络对需求方的技术也提出了要求。主要分为两个问题:如何挑选合适的人群;如何对各个人群进行合适的出价。但是由于我做算法的身份以后应该是在广告平台或者媒体负责广告投放,因此这一节我就略过了。
可类比与计划经济与市场经济。合约广告具有量的保证,而竞价广告完全由市场竞价来完成。
合约广告的采买方式对广告主缺乏透明性,很难进行优化。而竞价广告点击单价由广告主决定的交易逻辑使得广告合同由量的保证变成了成本的保证,并产生了3个发展趋势:
(1)可以使用非常精细的受众定向
(2)中小广告主参与竞价,大大扩展市场规模。
(3)数据的价值得以体现,市场开始以数据为核心。