2019腾讯广告算法大赛

参赛规模

第三届腾讯广告算法大赛复赛于5月24日正式鸣锣开赛。本赛季共有来自1,000+所国内外院校和2,200+家企业事业单位的10,571人报名,学生占比70%;6,011人实名认证,认证率57%;初赛参与人数1,851,队伍数1,361。经过初赛阶段的较量,200支表现优异的队伍从1362支参赛团队中脱颖而出,参与到复赛阶段的PK。
腾讯广告算法大赛

2019腾讯广告算法大赛_第1张图片

心路历程

第一次参加机器学习数据分析算法大赛,完全没有任何经验,从初赛到复赛一路摸索过来,这个比赛对新手还是很不友好的,初赛baseline都是自己构建,完全没有人share,相比Kaggle开源共享的思想,新手可以很快上手,建议新手直接参加kaggle,本次比赛共分为初赛和复赛,初赛分为A、B榜,2019年4月18日 ~ 5月23日,大概一个多月,时间挺长的,AB阶段的训练集相同,测试集不同,结束时,最终成绩排行榜将以初赛B阶段各参赛队伍的历史最好成绩进行排名,成绩排名前20%(最多不超过200支,以大赛官网解释为准)的队伍进入复赛。我们初赛成绩为Rank 189, 刚好苟进复赛,实为不易,以为进了复赛,只需换一下测试集,没想到题目都换了,数据集也换了,又要重新构建训练集,复赛 2019年5月24日 ~ 6月14日,大约20天左右,时间紧迫,我们大概花了一周时间左右,重新构建了训练集,勉强可以跑一个结果,提交上去了,接下来就是特征工程以及模型融合了,时间比较紧迫,特征工程做的很粗糙,模型参数也没有来得及细调,更没有时间去尝试更多的model,不过最终成绩也不赖,复赛Rank 77 、Score:85.2559 和冠军 87.9683,差距也就2.71,作为一个比赛新手,成绩已经很满意了。
2019腾讯广告算法大赛_第2张图片
2019腾讯广告算法大赛_第3张图片
下面进入正题,分享一下我的历时两个月的竞赛心得:

大赛介绍

作为国内领先的大数据营销平台,全新升级的腾讯广告,以更强大的全景连接、更全链的数字智慧、更友好的人本体验等三大核心能力,构建品牌与用户的智慧连接,助力广告主高效实现商业增长。而复杂的社交场景,多样的广告形态,以及庞大的人群数据,给实现这一目标带来了不小的挑战。为攻克这些挑战,腾讯广告也在不断地寻找更为优秀的数据挖掘方式和机器学习算法。

本次算法大赛的题目是源于腾讯广告业务中一个面向广告主服务的真实业务产品 ——广告曝光预估。广告曝光预估的目的是在广告主创建新广告和修改广告设置时,为广告主提供未来的广告曝光效果参考。通过这个预估参考,广告主能避免盲目的优化尝试,有效缩短广告的优化周期,降低试错成本, 使广告效果尽快达到广告主的预期范围。比赛中使用的数据经过脱敏处理,通过本次大赛,我们旨在挑选出更为优秀的曝光预估算法以及遴选出杰出的社交广告算法达人。

赛题说明:

腾讯效果广告采用的是GSP(Generalized Second-Price)竞价机制,广告的实际曝光取决于广告的流量覆盖大小和在竞争广告中的相对竞争力水平。其中广告的流量覆盖取决于广告的人群定向(匹配对应特征的用户数量)、广告素材尺寸(匹配的广告位)以及投放时段、预算等设置项。而影响广告竞争力的主要有出价、广告质量等因素(如pctr/pcvr等), 以及对用户体验的控制策略。 通常来说, 基本竞争力可以用ecpm = 1000 * cpc_bid * pctr = 1000 * cpa_bid * pctr * pcvr (cpc, cpa分别代表按点击付费模式和按转化付费模式)。综上,前者决定广告能参与竞争的次数以及竞争对象,后者决定在每次竞争中的胜出概率。二者最终决定广告每天的曝光量。

本次竞赛将提供历史n天的曝光广告的数据(特定流量上采样), 包括对应每次曝光的流量特征(用户属性和广告位等时空信息)以及曝光广告的设置和竞争力分数;测试集是新的一批广告设置(有完全新的广告id, 也有老的广告id修改了设置), 要求预估这批广告的日曝光 。(出于业务数据安全保证的考虑,所有数据均为脱敏处理后的数据。)

1 赛题理解
本次赛题
https://github.com/bettenW/Tencent2019_Finals_Rank1st
https://www.cnblogs.com/xianbin7/p/11076009.html
https://www.zhihu.com/people/nie-zhao-chang/posts
https://blog.csdn.net/JayChang27/article/details/96571729
https://www.zhihu.com/people/wang-he-13-93/activities
https://zhuanlan.zhihu.com/p/73062485
https://blog.csdn.net/u012151283/article/details/85250776
https://www.cnblogs.com/pinard/p/9093890.html
未完待续

你可能感兴趣的:(AI数据分析算法大赛)