作为国内大数据领域的顶级大会,2016中国大数据技术大会将于2016年12月8日-10日在北京新云南皇冠假日酒店隆重举办。中国大数据技术大会从2008年至今已近十年,超过一万名大数据开发者参与其中,完整地见证了中国大数据技术与应用的变革,忠实地描绘了大数据领域内的技术热点,沉淀了无数极具价值的行业实战经验,历经九届的中国大数据技术大会由于其专业性、技术性,已经成为国内外大数据领域的顶级盛会,也因此受到大数据开发者的强烈关注。
本次大会是由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中国科学院计算技术研究所和CSDN共同协办。聚焦行业最佳实践,数据与应用的深度融合,关注热门技术在行业中的最佳实践和深度应用。除Keynote以外,主办方还精心策划了16场+专题技术和行业论坛,100多场技术演讲,累计邀请超过130位技术专家担任演讲嘉宾。预计数千名大数据行业精英、技术专家及意见领袖将齐聚2016中国大数据技术大会,分享最新技术与实践的洞察与经验,共商大数据时代发展之计。
其中,推荐系统分论坛将于12月10日下午开启,你将有机会与六位讲者就以下议题进行探讨:《一点资讯大规模实时点击反馈平台设计与实践》、《深度学习在自然语言处理中的应用》、《领域知识驱动的个性化推荐方法》、《360聚效广告大数据平台实践》、《基于图算法的跨设备受众识别》、《百度大规模推荐系统实践》,并同与会专家近距离交流。
以下为讲者及议题介绍:
议题名称:一点资讯大规模实时点击反馈平台设计与实践
演讲人介绍:
田超,目前在一点资讯任职大数据中心技术总监,负责基础架构及大数据平台相关工作。硕士毕业于中国科学院计算技术研究所,曾任雅虎北京研发中心工程师、同步盘CTO、高德软件高级技术经理等职,有比较丰富的大数据领域相关经验,熟悉分布式存储、流式计算、个性化推荐及搜索相关技术。
议题介绍:
实时获取和发现海量用户精准兴趣是一点资讯兴趣引擎的核心能力之一, 在本次演讲中,田超将介绍一点资讯兴趣引擎背后的技术,一点资讯大规模实时点击反馈平台——Neo的设计与实践,以及设计过程中面临的问题和挑战。该平台作为基础设施,是支撑包括实时用户画像、实时数据分析、大规模在线学习、实时广告统计等业务的基础平台。
议题名称:深度学习在自然语言处理中的应用
演讲人介绍:
李成华,韩国国立全北大学数据挖掘与机器学习方向博士,加拿大圣西维尔大学和加拿大约克大学博士后。美国麻省理工学院媒体实验室(MIT media lab)访问科学家(Marvin Minskey 研究组,图灵奖获得者)。曾任海信集团国家重点实验室数据挖掘技术专家,负责海信集团硬件智能化创新与数据挖掘的研发。现任京东深度神经网络(深度学习)实验室首席科学家。负责和推动深度学习技术在京东各产品上的应用。李成华博士在机器学习特别是神经网络和数据挖掘方面有数十年的研究和工作经验。在世界高级期刊Expert System with Applications、Information Processing and Management、Neurocomputing等发表论文30余篇,专利数十篇。
议题介绍:
深度学习是近年来机器学习领域发展最为迅速的领域。严格来说,深度学习并不是一种全新的机器学习方法,而是基于深层神经网络 (Deep Neural Network, DNN)的学习方法的别称。这里的深层神经网络和传统的多层神经网络描述的几乎是完全相同的概念。深度学习之所以在沉寂多年之后重新得到学术界的高度关注,是因为其在一系列人工智能的重要任务中所取得的突破性成果。随着语音和图像处理领域的突破性进展,深度学习在自然语言处理领域也越来越受到重视,并逐渐应用于自然语言处理的各种任务中。尽管深度学习已经在语音和图像处理中取得重大进展,然而语言与语音、图像不同,是特殊的人工符号系统。将深度学习应用于自然语言处理需要进行更多的研究和探索:针对特殊任务的词汇表达的学习以及词汇之间关系的探索越来越受到重视;处理自然语言的结构化输出需要更为复杂的神经网络;复杂神经网络又对高效和并行化的训练算法提出了新的要求。我们相信,随着可用的训练数据越来越多,系统的计算能力会越来越强,在自然语言处理领域,深度学习也会更有用武之地。
议题名称:领域知识驱动的个性化推荐方法
演讲人介绍:
陈恩红,中国科学技术大学计算机学院教授、博士生导师,国家杰出青年基金获得者,安徽省“特支计划”创新领军人才。现任中国科学技术大学计算机学院副院长、语音及语言信息处理国家工程实验室副主任,中国计算机学会大数据专家委员会副主任,安徽省计算机学会理事长。曾担任2015年中国计算机大会(CNCC 2015)等全国会议的程序委员会主席,以及IEEE Transactions on SMCA、WWW Journal等国际学术期刊编委。在包括TKDE、TMC、TKDD、KDD、IJCAI、AAAI等在内的数据挖掘领域国际顶级期刊、会议上发表论文100余篇,曾获KDD 2008最佳应用论文奖、ICDM 2011最佳研究论文奖、SDM2015最佳论文提名、2012年教育部自然科学二等奖。其培养的博士生获得中国计算机学会优秀博士论文奖、中科院优秀博士论文奖、中国人工智能学会优秀博士论文奖、中科院院长特别奖等众多荣誉。
议题介绍:
大数据时代的来临带来了信息过载的挑战,使得用户难以从海量资讯中快速、准确地获取所需信息。因此,旨在实现用户精准建模,进而实现个性化智能服务的推荐技术,成为当下大数据研究的应时之需。然而,随着大数据向金融、教育等诸多领域的拓展,用户行为与认知、情境等新兴要素相互耦合,传统推荐技术已逐渐难以有效应对。如何有效理解并表征领域知识,使其驱动大数据推荐技术向着更加完善、智能的方向发展,是领域大数据分析与挖掘的首要问题。本报告将首先介绍领域大数据给推荐问题带来的新挑战和传统技术的局限性,然后结合金融、教育、移动商务与社交网络四个典型领域,介绍我们在领域知识驱动的个性化推荐方法问题上的相关工作和实践。
议题名称:360聚效广告大数据平台实践
演讲人介绍:
朱广彬,北京交通大学硕士,2014年加入聚效广告。聚效并入360后,朱广彬负责商业化事业部基础数据架构相关工作。关注大数据底层架构相关技术,致力于大数据处理技术在计算广告的应用,对Hadoop/Hive/HBase/Spark/Kafka等有深入的认识和实践经验。
议题介绍:
计算广告是近几年非常火热的一个话题,也是大数据应用重度使用的领域。其目标是在合适的时间、合适的地点为广告主找到合适的受众并投放合适的广告创意,在广告主、媒体、受众的整个生态中达到三方共赢的目的。
聚效广告在广告大数据处理方面积累了丰富的经验,在合并入360后,数据平台面临着很多挑战。
本次分享主要介绍360聚效广告大数据处理平台在实践过程中的演进与实践经验,包括在应对数据量从几十亿到近200亿的快速增长过程中数据平台的应对措施,以及如何提高实时性和投放准确性的算法实践。
议题名称:基于图算法的跨设备受众识别
演讲人介绍:
刘喆(Zhe Liu)2013年加入AdMaster,现任架构师。主要负责数据处理的全流程技术支持, 高性能和高可用的分布式架构设计, DSL 语言抽象, Hadoop/HBase/Storm/Spark等大数据平台优化。2010年硕士毕业后, 刘喆就职于百度, 负责当时全球规模最大的 Hadoop 平台的运维开发工作. 2011年底加入人民搜索, 任代理运维总监。近 7 年的大学生活和近 5 年的工作经历中, 刘喆一直追求简单直接,关注于数据挖掘/大数据/DSL/系统架构等方向, 对分布式计算/分布式架构和程序语言情有独钟, 曾多次被51CTO/Spark 峰会/into100峰会等邀请为嘉宾分享Hadoop/Spark/开源软件等相关经验。
议题介绍:
本次演讲就”一个网民多个设备”这个基本现状, 分析了”跨设备识别”的原因及技术难点。基于这个需求, 给出了 AdMaster 自己的解决方案, 阐述了方案的基本思想, 论证了方案的可行性和可靠性。同时, 给出了可以用于解决问题的几种策略: 基于 IP 的事件统计分析/基于地点的样本迪卡尔积模型/基于AdMaster BlueAir 的数据清洗/基于人类极限分析的噪声去除等等, 对比分析了它们的效果, 以及各种策略的组合运用。对于AdMaster 的组合方案, 给出了我们自己的工程化方案, 列举了遇到的一些困难, 比如 Spark GraphX 的效率问题, 我们自己设计的基于高效 KV 存储的图切分算法等等. 顺便给出一些有意思的结论和副产品, 跟大家分享这些结论的现实意义。
议题名称:百度大规模推荐系统实践
演讲人介绍:
秦铎浩,百度基础架构部机器学习高级研发工程师, 关注大规模机器学习、推荐系统以及优化算法等领域。2012年底加入百度,一直从事机器学习相关工作,为BML项目核心研发人员。目前致力于百度内部机器学习平台大规模机器学习算法的研发,对内支持百度多个业务的实际应用,对业务效果产生较大提升。
议题介绍:
BML是百度基础架构部09年开始自主研发的大规模机器学习平台,百度内部有非常多的系统都在使用其中的推荐算法,为业务效果带来了非常大的提升。在推荐系统的构建过程中,针对海量数据的推荐系统的训练是非常困难的。演讲中介绍了常用的推荐算法使用以及背景, 涉及的核心技术难点与解决方法,以及下一代推荐系统的未来发展趋势。
130+位讲师,16大分论坛,中国科学院院士陈润生,美国伊利诺伊大学香槟分校(UIUC)计算机系教授翟成祥,驭势科技联合创始人、CEO吴甘沙、上交所前总工程师白硕等专家将亲临2016中国大数据技术大会。票价折扣即将结束,预购从速。