广告平台中用户画像和标注噪声处理的实践

概要
在目前流行的互联网广告系统中,用户画像地位很重要,应用也很广泛。但在独立的第三方广告服务系统中,由于用户特征和标注集合的缺失,常规机器学习方法大多数情况下难以发挥应有的效用。根据FreeWheel的实践,基于NLP技术抽象用户观看记录,构建用户特征,并通过Bayesian概率框架和Label Noisy技术生成可信的标注集合,最终取得了较好的线上实践效果。本主题演讲会介绍一种经过行业实践的用户画像算法,并详解标注噪音和数据清洗技术在实际应用中的效果。

个人简介

童有军,现任FreeWheel主任工程师,负责广告服务平台的用户画像、广告预估和流量预测等算法的研究和应用工作。关注机器学习算法与大数据方法在互联网广告领域的发展和应用。曾先后供职于百度网页搜索部,和即刻搜索的搜索质量部。

QCon是由InfoQ主办的全球顶级技术盛会,每年在伦敦、北京、东京、纽约、圣保罗、上海、旧金山召开。自2007年3月份首次举办以来,已经有超万名高级技术人员参加过QCon大会。QCon内容源于实践并面向社区,演讲嘉宾依据热点话题,面向5年以上的技术团队负责人、架构师、工程总监、高级开发人员分享技术创新和最佳实践。

你可能感兴趣的:(广告平台中用户画像和标注噪声处理的实践)