国际数据挖掘顶会 KDD 2019 研究方向亚军论文《Optimizing Impression Counts for Outdoor Advertising》解读

KDD简介

第 25 届 ACM SIGKDD 知识发现和数据挖掘会议(KDD)已于今年 8 月 4 日在美国阿拉斯加州安克雷奇开幕。今年的大会奖项分为研究方向和应用数据科学方向。在今天公布的最佳论文中,康奈尔大学的《Network Density of States》获得了研究类最佳论文奖;而应用数据科学方向的最佳论文为《Actions Speak Louder than Goals: Valuing Player Actions in Soccer》,这是一篇有关足球技术分析方面的研究,来自比利时天主教鲁汶大学以及体育分析公司 SciSports。

为了提升论文接收的质量,KDD 2019 首次采用了双盲审查制度,本次大会也对研究的可复现性提出了新的要求,强调其为「论文审核过程中的一个重要因素」,只有包含两页可复现性内容附录的文章才有可能被评为 KDD 最佳论文。

KDD 对论文接收非常严格,每年的接收率均未超过 20%。本届大会在应用数据科学方向共收到大约 700 篇论文,其中 45 篇 oral 论文,约 100 篇被接收为 poster 论文;研究方向共收到约 1200 篇投稿,其中约 110 篇 oral 论文,60 篇 poster 论文,接收率仅为 14%。

研究方向亚军论文

  • 论文:Optimizing Impression Counts for Outdoor Advertising

  • 作者:Yipeng Zhang、Yuchen Li、Zhifeng Bao、Songsong Mo、Ping Zhang(皇家墨尔本理工大学、新加坡管理大学、武汉大学、华为)

  • 链接:http://delivery.acm.org/10.1145/3340000/3330829/p1205-zhang.pdf

自 2017 年以来,户外广告市场规模每年增长 3%-4%,预计到 2021 年将达到 330 亿美元。其中 74% 的增长来自广告牌。广告牌的主要受众是沿途的行人。超过 80% 的司机在开车时会注意到广告牌。由于定位设备的普及,现在已经积累了大量的行人出行轨迹。那么,如何利用这些数据提升广告影响就成了研究者关心的问题。

在现实场景中,广告牌的数量和预算是固定的,因此研究人员提出通过提高户外广告的印象计数(ICOA)来提升广告效果,以此提高广告主的投资回报率。

给定一个广告牌数据库 U,其中每个广告牌都有一个位置和一个非均匀成本,一个轨迹数据库 T 和一个预算 B,它的目标是找到一组在预算范围内影响最大的广告牌。

要解决这一问题,研究人员人员必须克服两大挑战:

  1. 同一广告牌出现多少次能达到最佳效果(既给行人留下深刻印象又不浪费预算);

  2. 第二个挑战是逻辑函数的性质。基于 logistic 函数的影响模型是非子模块的,这意味着简单的贪婪方法不能解决 ICOA 问题。更糟糕的是,不同广告牌的成本不统一,使得优化问题更加复杂。研究者表明,在任意常数因子下,逼近 ICOA 是 NP-hard 问题。

对于第一个问题,此前有研究表明,在一定范围内,广告牌出现的次数越多,给路人留下的印象越深刻,但超出这一范围之后效果会越来越差。

对于第二个问题,研究者提出了一种基于切线计算子模函数的算法来估计影响的上界。他们引入了一个带有θ-termination 条件的分支定界框架,实现 θ/2 × (1 − 1/e) 近似比。然而,当|U|很大时,这个框架非常耗时。因此,研究者利用渐进剪枝上限估计方法对其进行进一步优化,实现 θ/2 × (1 − 1/e − ϵ) 近似比例并显著降低了运行时间。他们在真实的广告牌和轨迹数据集上进行了实验,结果表明,该方法的有效性比基线高出 95%。此外,优化方法比原框架快两个数量级左右。

 

本内容为学习笔记,参考网上资源,如机器之心

你可能感兴趣的:(顶级人工智能资讯)