作为一个系列的开头,当然是要先吐一下槽。我一年半之前进入了导师的实验室,也走进了深度学习的门。学好基础的东西之后,导师说,来做AI医学这个好发论文。导师发话,那我当然是义无反顾地就去做了。所以说虽然我们实验室是做CV的,但是我也没有真正意义上地做过CV,最多对图卷积熟悉一点。
AI医学做到现在,发现确实成果容易出,论文容易发,毕竟做的人也还不是算多。但是前段时间从MICCAI2019回来以后,我便陷入了忧虑之中:这AI医学的工作也太难找了!虽然说现在有一些做AI医疗的公司,可是到落地还有不少距离,毕竟谁想让AI来帮自己看病呢233。于是我就萌生了作一个二手准备的想法。
当然传统艺能不能丢,我还是想做算法的。经过了和师兄们的长谈,我在CV、NLP、搜索、广告、推荐中挑了一个最有钱的 就业形势最好的计算广告来作为我的新方向。不过推荐也是可以的,毕竟和广告还是有一定重合度,也可以去了解一下,现在还是先学计算广告为主。听从知乎大神的建议我弄了一本刘鹏老师的《计算广告》作为入门教材,开这个系列也是为了监督自己的学习,毕竟是一个全新的方向,船新的版本。有兴趣深入学习的同学尽量找原书去看,就不要看我这个了hhh。
这一章基本以了解为主吧,跟计算完全没有关系,仅仅是让我们熟悉一下在线广告。
现在互联网产品主要以免费模式服务用户,在这个过程中获得了三项资产:流量、数据和影响力。这三项资产还是很好理解的,其中数据是用户使用过程留下的个人信息。而这三项资产,可以通过在线广告体系进行变现。
在计算广告中,大数据的特点:
(1)行为数据。使用的数据是活动中产生的非必须记录的数据,与传统数据处理的交易数据不一样(数据量大,一致性要求低)。
(2)全量加工。数据经过采样之后效果明显下降(个性化效果差),因此要进行全部数据的计算。
(3)自动化应用。决策(投放什么广告)完全由系统决定。
定义;两个主动参与方:需求方和供给方。需求方:广告主、代理商。供给方:媒体。还有一个被动参与方是受众。三方的利益博弈是是广告活动的主线。
目前网络广告市场高速发展,传统广告渠道不太行。
就是我们日常接触的广告类型,好像没有做笔记的必要。
广告发展脉络:固定位置合约–>受众定向–>竞价交易–>实时竞价交易
固定位置合约:在网页上固定位置展示横幅广告,按时长收费。缺点在于没有个性化。
受众定向:根据受众不同(打开页面者属性不同)投放不同广告,按展示量结算。缺点在于只考虑投放精确性,忽略可能卖的更贵的流量
竞价交易:引出广告主的出价作为参考因素,按照收益最高原则决策。缺点是无法保证广告主要求的投放量。
实时竞价交易:根据实时情况,广告主根据需求方平台(DSP)估计当前展示的期望价值,再借此进行出价。
本章讲的是计算广告的基础概念。
这里讲的是传统广告理论中广告从展示到产生效果的6个阶段,好像也没有什么做笔记的必要。
(1)技术和计算导向:这个没必要解释了吧。
(2)效果的可衡量性:通过点击率衡量广告的效果。
(3)创意和投放方式的标准化:举例有视频广告的VAST标准和实时竞价的OpenRTB标准。
(4)媒体概念的多样化:这个不好总结,看书吧。
(5)数据驱动的投放决策:在线广告系统就是一个大数据处理平台,通过用户数据等各种数据进行决策。
计算广告的核心挑战是一个最优化问题:
m a x a 1 , . . . , T ∑ i = 1 T r ( a i , u i , c i ) − q ( a i , u i , c i ) s . t . ∑ i = 1 T d ( a i , u i , c i ) ≤ D k , ∀ k \mathop{max}\limits_{a_1,...,T}\sum^T_{i=1}{r(a_i,u_i,c_i)-q(a_i,u_i,c_i)}\\s.t.\sum^T_{i=1}d(a_i,u_i,c_i)\le D_k,\forall k a1,...,Tmaxi=1∑Tr(ai,ui,ci)−q(ai,ui,ci)s.t.i=1∑Td(ai,ui,ci)≤Dk,∀k
r与q是总收入和总成本函数,i表示从第1次到第T次之间的某一次广告展示,a、u、c分别指advertisement、user、context(上下文),d为广告主k提出的约束如成本。一般来说处DSP以外成本为对应常数或正比与收入,因此公式中可以去掉成本。
计算广告最重要的指标是eCPM:千次展示收益。
e C P M = r ( a , u , c ) = μ ( a , u , c ) ν ( a , u , c ) eCPM=r(a,u,c)=\mu(a,u,c)\nu(a,u,c) eCPM=r(a,u,c)=μ(a,u,c)ν(a,u,c)
u为点击率(CTR),v为点击价值
市场上几种主要的广告计费模式:CPT(cost per time)、CPM(cost per mile)、CPC(cost per click)、CPS(cost per sale)、oCPM(optimized CPM)。详细的我就不写了,书后面的附录可以一一对应查词。
好像也没有做笔记的必要呢。
其实前面两章讲的东西不多,基本属于背景和基础概念介绍,所以讲得也比较简单比较泛,后面的章节应该会继续深入。