互联网广告行业知识

入职互联网广告行业已经两月有余了,结合自己的工作经历和网上的一些科普做一下总结。

一、定义

《当代广告学》一书中对广告的定义是:广告是由已确定的出资人通过各种媒介进行的有关产品(商品、服务和观点)的,通常是有偿的、有组织的、综合的、劝服性的非人员的信息传播活动。对于互联网广告,《计算广告》一书中总结:一切付费的信息、产品或服务的传播渠道,都是互联网广告。网络上总结出一张自广告而下的基本关系图,如下:

互联网广告行业知识_第1张图片

二、互联网广告

互联网广告,是狭义上的计算广告,也被称为在线广告或网络广告。互联网广告就是通过网络广告平台在网络上投放广告。利用广告上的广告横幅、文本链接、多媒体的方法,在互联网刊登或发布广告,通过网络传递到互联网用户的一种高科技运作方式。

与传统的四大传播媒体(报纸、杂志、电视、广播)广告及备受关注的户外广告相比,互联网具有独天得厚的优势,是实施现代营销媒体战略的重要一部分。

那么,在线广告和离线广告到底有什么区别?事实上,除了传播媒介不同之外,本质上在线广告与离线广告是没有区别的。只是随着信息技术的迅猛发展,对于很多离线广告做不了或者很难做的一些事情,在线广告都能较为轻松的完成,比如受众分析和实时竞价。因此,在线广告是离线广告的一种进化演变。

举个栗子,假设你开开了一家服装厂,如果你在报纸杂志上刊登了你的服装品牌,并且放上了若干主打服装产品,甚至你还选择了在体育专栏放上运动服装广告,在招聘专栏放上西装广告。诚然,你服装厂的销量因此会上涨不少。

但这存在几个问题:首先,你需要熟悉报纸杂志的各种专栏内容,在合适的专栏选择合适的投放产品(比如篮球专栏不能放足球服,库存是否充足等),这样人力成本偏高;其次,你大概永远无法获取读者的相关信息,这将导致相当多的阅读量对于你的广告而言其实是没有价值的,使得无用流量偏高;再次,对于广告价格而言,你其实并没有自主发言权,因此价格往往偏高,无法合理出价。

人力成本偏高、无用流量偏高以及无法合理出价,这三大难题是传统媒体很难解决甚至是无法解决的。然而对于在线广告,通过程序化的操作,这一切将变得非常简单。

这个针对需求方的“程序化的操作”,就是DSP(Demand Side Platform,需求方平台)。相应的供给方则有SSP(Supply-Side Platform,供应方平台),这两以后会慢慢讲到。下面分别讲一讲上面提到的三大难题。

1. 人力成本,在线广告通过打标签的机制进行内容分类。比如腾讯体育NBA频道会提供“体育&篮球&NBA”之类的标签,中关村手机频道则会提供“电子产品&手机”之类的标签。然后程序化判断“数据库记录库存是否充足,推广服装是否匹配对应标签”之后便可投放广告。当然,这么来说明仅仅为了解释在线广告如何降低人力成本,而实际逻辑远比这复杂,以后再细讲。

2. 流量划分,在线广告会收集用户的浏览访问记录即cookie,cookie俗称浏览器缓存。通过分析用户的访问行为提取兴趣类别,进而划分用户群体。比如其是否经常逛服装店,是否经常看球赛,是否经常买零食等等。然后通过不同的兴趣划分精准投放广告,这能极大降低无用流量,提升广告的转化率。该情形我相信经常上网的大家应该都深有体会。

3. 出价,在线广告通过收集同类别不同广告主的出价,结合内容质量和产品相关性决定广告权的最终归属。很多时候这个过程是实时进行的,而实时的这个过程被称为RTB(Real Time Bidding,实时竞价)。由此观之,在线广告能帮助你基于当前市场的行情出价,你并不需要担心自己的出价是否过高。

拿菜市场来举个栗子来描述一下DSP、SSP、RTB三者之间的关系:

假设有一个金主爸爸承包了一个菜市场,然后他将摊位卖给各个小承包商即摊主。金主爸爸相当于媒体,这里的媒体就是指那些能够提供流量的APP或者网站,比如今日头条、抖音等。摊主相当于广告主。摊位相当于广告位。菜就相当于广告内容。顾客就相当于浏览这些媒体的用户。金主爸爸卖卖广告位有两种卖法:一般好一点的摊位是直接谈好价格直接卖的;还有一些比较次的就通过竞价的方式卖,价高者得之。当金主爸爸不想亲自操劳摊位买卖的事时,SSP应运而生,它能帮助金主爸爸买卖摊位并监控各个摊位的营利情况等;同样,摊位众多,摊主也不知道该买哪些摊位,于是DSP应运而生,他帮助摊主选好能够更好增加盈利的摊位。

程序化广告的关系图如下:

互联网广告行业知识_第2张图片

三、竞价

在程序化交易过程中,广告主的出价一定程度上决定了广告位的使用权。那么,这个竞价策略有哪些?竞价逻辑又是如何?

竞价是一种拍卖形式。拍卖的历史悠久,有公开增价拍卖、公开减价拍卖、价格密封拍卖等。衍变到互联网广告竞价则出现了GFP(Generalized First Price,广义第一高阶)、GSP(Generalized Second Price,广义第二高阶)和VCG(Vickrey-Clarke-Groves,多位置最优策略)这三种竞价方式。下面我将依次讲解这几种竞价方式。

广义第一高阶 规定价高者得,且需要按照自己的报价支付。这样会存在什么问题呢?首先,竞价将会以最小竞价单位递增,假设最小竞价单位是0.01元,那么每一次只需要增加1毛钱就能竞价成功,直到超出预算;其次,当某个广告主竞价成功后(此时已超出去他所有人的预算),自然而然会想到自己没必要再出这么高的价,因此会调低自己的出价,因此又会迎来新一轮的竞价,如下图所示,这将导致广告位收益不稳定等问题。

互联网广告行业知识_第3张图片

广义第二高阶 规定价高者得,但只需按照第二报价支付。相比于GFP,GSP能让竞价成功的广告主失去调低出价的动力,因为无论是否调低出价,自己的真实出价都不会改变,除非竞价失败,这是其一;其二,GSP还能让未竞价成功的广告主失去以最小竞价单位递增出价的动力,因为这种出价策略很难赢得竞价。因此,GSP被称为单位置最优竞价策略。由于GSP的这种优势,现在几乎所有的互联网竞价广告都采用这种方式。

多位置最优策略 这是一种理想的竞价方式,基本思想是:对于赢得某个位置的广告主,其成本应该等于其占据这个位置给其他参与者带来的损害之和。这种方式让每一个广告主都获得了自己最理想的位置,其成本也是最少的。但是,VCG虽然是最好的竞价方式,却并不是主流的竞价方式。其一,这种方式逻辑复杂,很难向广告主解释清楚;其二,这种“价值损害”是否被正确计算也无法验证。

为了控制广告质量,竞价和拍卖一样也有一个起拍价,称为市场保留价,广告主的出价只有高于市场保留价才能获得竞价机会。此外,还有一个价格挤压因子,让广告位最终归属权按照广告主的出价乘以该广告点击率的k次方的值决定,k是一个正实数。当出现出价高但品质不高的广告主,可以调高k值来强调广告质量;而当发现市场竞价激烈程度不够时,又可调低k值来鼓励竞争,以此维持广告竞价市场的良性发展。

四、计费

竞价中的计费载体多种多样,比较常见的有时间、曝光、点击、下单、登录等,而不同的计费载体又对应着不同的计费模式。随着媒体性质的不同和广告质量的差异,计费模式也不同。下面分别讲讲几个常见的计费模式及其应用场景。

按时间计费的叫做CPT(cost per time),常见的时间计费模式为按天计费CPD(cost per day)。这种方法类似于传统方式,由于其长期占据一个位置宣传,因此能充分发挥橱窗效应,非常适合需要高曝光的品牌类广告。但这种计费方式一般只用于合约广告而非竞价广告,缺点是无法实现个性化推广。

按展示量计费的叫做CPM(cost per mille)。这种方式是广告主与媒体方约定好的千次展现计费标准,与CPD不同的地方还在于其能实现个性化的推广,主流应用场景是视频类广告。

按点击计费的叫做CPC(cost per click)。这种方式出现在以效果为导向的互联网广告中,主要应用场景为搜索类广告。

按销售订单数计费的叫做CPS(cost per sale)。这种方式只按最后的实际收益来计算,是一种几乎无风险的计费模式。主要应用场景为垂类广告和导购类网站。

按转化行为数计费的叫做CPA(cost per action)。这种转化行为通常包括下载、注册、登录等。主要应用场景为APP推广类广告。不过CPA和CPS一样,虽然充分考虑了广告主利益,却忽略了网站的利益,因此遭到了越来越多站长的抵制。

除开CPT,其他四种计费模式均适用于竞价广告。此外,还牵涉三个比较重要的概念:eCPM(预计千次展示收益)、CTR(Click Through Rate,点击率)和CVR(Conversion Rate,转化率)。点击率是指点击次数与展现次数的比率,而转化率是指成单量与到达商品页面次数的比率。其中eCPM = CTR × 点击价值,这个点击价值通常指的就是广告主的出价。CVR通常用来衡量广告质量。

五、个性化推荐

受众定向,顾名思义就是把广告打给对的人看,实现个性化推荐。而要想知道当前用户适合何种广告,就必须知己知彼,也就是掌握该用户的信息。信息量越足,精准投放的概率就越高。这需要通过一种标签机制来实现,不同的广告内容通过匹配相应的标签,实现个性化推荐。此外,标签机制简单明了,程序化处理也很方便。

从供给方角度看,受众定向标签有两种:用户标签和上下文标签,它们分别描述的是一种的离线特征和实时特征。这两种特征的侧重点不同,代表的意义也不一样。

用户标签 用来刻画用户历史的整体行为特征,通过分析用户的历史行为提取。由于太过久远的历史数据对描述用户兴趣的实际贡献度很小,因此一般通过滑动时间窗口外加时间衰减因子来强调时间线的新鲜度。用户标签的提取方法有关键词提取法、有监督的主题模型等。

上下文标签 用来刻画用户当前的访问行为特征,通过分析用户当前访问的页面信息提取标签。上下文标签所涉及的数据量较小,计算成本较低,在用户标签缺乏的情况下,还能帮助缓解冷启动问题。上下文标签的提取涉及文本的主题挖掘,主要有LSA模型、PLSI模型、LDA模型等。

当然,用户标签和上下文标签有可能相同,两者相辅相成,但这两种标签并非在所有场景下都能一起发挥作用。比如在搜索广告中,由于用户意图与搜索关键词强相关,通常不考虑用户标签,而是重点考虑其搜索内容的上下文标签;在一般的ADX广告中,则通常不关心上下文标签,而是着重考虑用户标签。

六、作弊与反作弊      

通常,非正常流量分为两种:其一,某些科研目的或者个人行为产生的一些无恶意的、机器产生的流量,其本身访问并非代表用户的真实上网意愿,因此不应该加入广告计费,这部分流量就是爬虫流量。其二,由于互联网广告有很多相关利益方,这些利益方为了达到某种商业目的,可能制造出各种具有欺骗性的展现或者点击行为,这部分流量则是作弊流量。

反作弊既要抵御作弊流量,也要能检测出爬虫流量。由于作弊流量比爬虫流量更复杂,种类更多,因此本文主要来讲讲作弊流量。作弊流量主要有以下三种情况。

用户重复展现和点击。竞争对手或者利益相关方通过短时间内制造大量重复点击或页面展现请求,迅速消耗某些广告主的预算,从而达到降低其广告效果的非正常竞争目的。这种作弊主要通过对IP或cookie的访问量设定一个合理的上限来抵御。

媒体作弊。媒体通过将广告展示和点击代码放在非约定的位置上(如嵌入主页刷新的js代码),或将广告位点击区域与网页内容区域重叠等方式骗取大量额外的展现与点击以获取广告利润。检测这种作弊的方式有场景复现等。

流量劫持。所谓流量劫持,就是在无权投放广告的位置上强行投放或者改变广告样式甚至是广告的内容。比较常见的流量劫持形式有:恶意弹窗、样式替换、搜索来源重定向和落地页劫持。可通过辨识媒体与相应的广告计划匹配的方式,判断是否产生流量劫持。

注:此篇文章大部分转自对半独白的博客

你可能感兴趣的:(总结)