WSDM2015概览

Neil Zhu,ID Not_GOD,University AI 创始人 & Chief Scientist,致力于推进世界人工智能化进程。制定并实施 UAI 中长期增长战略和目标,带领团队快速成长为人工智能领域最专业的力量。
作为行业领导者,他和UAI一起在2014年创建了TASA(中国最早的人工智能社团), DL Center(深度学习知识中心全球价值网络),AI growth(行业智库培训)等,为中国的人工智能人才建设输送了大量的血液和养分。此外,他还参与或者举办过各类国际性的人工智能峰会和活动,产生了巨大的影响力,书写了60万字的人工智能精品技术内容,生产翻译了全球第一本深度学习入门书《神经网络与深度学习》,生产的内容被大量的专业垂直公众号和媒体转载与连载。曾经受邀为国内顶尖大学制定人工智能学习规划和教授人工智能前沿课程,均受学生和老师好评。

我愣是跟完了整个WSDM2015会议。由于这次会议聚焦在搜索和数据挖掘,跟我现在的工作相当地接近。所以整个过程也是我各种想法的激发和完善的阶段。

冬季课程的报告涉及了深度学习在自然语言处理中的应用、自然语言处理、社交网络分析和大规模机器学习。

我比较熟悉的是话题模型、word2vec、community detection和基本的机器学习技术。所以在听报告的过程中,关于这个方向的我会尝试与真实的场景发生关联。事实上,这些尝试我在之前的工作中已经或多或少的应用了。然而这次报告中关于社会网络分析的部分有一种新的建模方式,尽管可能通过概率模型来建模community已经早就出现,但是这么正式和严格的定义还是令我感到惊喜。(后来查证之后,还有若干的定义方式,以后有机会将这些系统地整理一遍,看看其中是不是可以找到一些本质上关联的特性)

关于word2vec的应用,我们可以尝试应用word2vec在用户和文档上,将他们映射到一个潜在的语义空间上。这样可以直接进行相关的计算。

WSDM主会的tutorial部分,我选择了听了其中的两个topic。因为目前我们的场景不会产生过大的数据,主要是业务逻辑的设计,所以选择了动态信息检索和实时竞价这两个。分别由Georgetown大学和UCL的教授和博士生讲述。
随后每天的Keynote都是学术界和业界的领军团队给出的,第一天是UC Berkley的Franklin,主要是在介绍spark。第二天是Facebook的Lada Adamic,给了关于社交网络中得信息周期报告,这个报告多是统计实验的结果。第三天则是Cornell的教授讲解了Learn from user interaction。其中最后一个technique的taste最强,给出了模型,以及计算的框架。

实际上让人最激动的是Stanford的年轻教授Jure,他以类机关枪的语速讲了如何从图论或者网络科学的角度对推荐系统的研究,并且给出了一个实际的产品Pinterest。主要的思路就是构建出一个产品之间的社交网络(product graph)。

有未来感的报告来自google的研究员Kuma,后来的最佳paper就是这篇。Inverting a Steady-State。

星期五的workshop,我全程follow深度学习在NLP和搜索中的应用。
又听了一遍Jianfeng Gao博士关于DSSM的介绍。令我想起winter school上,他详细讲解公式推导的场景。还留了一条题。我还没有去算。
然后是来自NYU-shanghai的Zheng Zhang教授,其报告启发性很强,除了technique的讲述,还有个人对machine intelligence的思考。
下午是华为诺亚方舟实验室的关于Convnet的介绍。还有复旦学者关于他们对深度学习在NLP中的应用的报告。

大脑的容量有限,肯定放不下这么多的东西,所以就尽可能地把这些信息整理了一下。这几天下来,感觉是把大脑撑了撑,还是可以的。接下来,就是把这些想法和实际场景结合,给出一些产品功能的突破。

后记:
之前学过game theory的一点皮毛,所以常常会从game的角度来看这些问题。由于game theory的通用性,基本上还都是可以说清楚的。现在又有学者尝试将机器学习和game theory结合,这一点我觉得很靠谱。可以设计出更好的机制,让一个game中的players都能达到某种程度的满意。

你可能感兴趣的:(WSDM2015概览)