题目表述
本次比赛以阿里电商广告为研究对象,提供了淘宝平台的海量真实交易数据,参赛选手通过人工智能技术构建预测模型预估用户的购买意向,即给定广告点击相关的用户(user)、广告商品(ad)、检索词(query)、上下文内容(context)、商店(shop)等信息的条件下预测广告产生购买行为的概率(pCVR),形式化定义为:pCVR=P(conversion=1 | query, user, ad, context, shop)。
结合淘宝平台的业务场景和不同的流量特点,我们定义了以下两类挑战:
(1)日常的转化率预估
(2)特殊日期的转化率预估
评估标准
通过logarithmic loss(记为logloss)评估模型效果(越小越好), 公式如下:
其中N表示测试集样本数量,yi表示测试集中第i个样本的真实标签,pi表示第i个样本的预估转化率。
赛题数据
天池赛题入口
简介
本刊将实时跟踪参加比赛的进展,数据集理解、数据集清洗、特征提取等。。。。敬请期待
目录
部分数据可视化
数据初步清洗