预见未来: 微软亚洲研究院看下一个二十年

 

预见未来: 微软亚洲研究院看下一个二十年_第1张图片

(上图为微软全球资深副总裁、微软亚太研发集团主席、微软亚洲研究院院长洪小文)

2018年11月8日,微软亚洲研究院迎来了二十周年庆典。1998年11月,微软亚洲研究院正式在北京成立,是微软设在美国本土以外规模最大的研究机构。20年来,微软亚洲研究院已发展成为具有世界影响力的计算机基础及应用研究机构。目前,微软亚洲研究院拥有200多名研究人员,以及超过300名访问学者和实习生,主要聚焦于自然用户界面、智能多媒体、大数据与知识挖掘、人工智能、云和边缘计算、计算机科学基础等六大研究领域。

截至2018年11月,微软亚洲研究院已在国际顶级学术会议和期刊上公开发表5,000余篇论文,其中有50多篇荣获“最佳论文”奖,最近公布的人工智能领域顶级学术大会AAAI 2019论文入选名单中有27篇来自微软亚洲研究院。此外,诸多全球性的科技突破也来自微软亚洲研究院:2015年微软亚洲研究院开发的计算机视觉系统在ImageNet挑战赛中首次超越了人类物体识别分类的能力;2018年在由斯坦福大学发起的SQuAD文本理解挑战赛榜单上,微软亚洲研究院的R-NET和NL-NET模型分别在两个维度上率先超越了人类分数;2018年3月,由微软亚洲研究院与微软雷德蒙研究院共同研发的机器翻译系统,在通用新闻报道测试集newstest2017的中-英测试集上首次达到了可以与人工翻译媲美的水平。

而在不断突破科研边界的时候,微软亚洲研究院也在深刻影响微软的产品体系。从微软智能云Azure、Office 365到微软小冰、必应(Bing)搜索、再到Xbox以及HoloLens,可以说微软几乎每一款产品都有微软亚洲研究院的烙印,微软亚洲研究院还通过自身的技术积累和科研创新孵化了很多广受欢迎的应用和技术平台。而从微软亚洲研究院走出来的人才,几乎撑起了中国科技产业的创新领军队伍,包括李开复、张亚勤、王坚、马维英、芮勇、李世鹏、王海峰等在ICT、互联网和投资领域都是顶尖级领军科技人才。

微软亚洲研究院还孵化出了多个工程院,包括微软中国云计算与人工智能事业部和微软(亚洲)互联网工程院,不仅推动了微软产品的开发与落地,还进一步完善了微软在中国和亚太地区的研发布局,促进了微软亚太研发集团的成立。2018年9月,微软亚洲研究院宣布在上海成立微软亚洲研究院-上海,同时宣布与上海市徐汇区人民政府以及上海仪电(集团)有限公司合作建立微软-仪电人工智能创新院。

过去二十年,微软亚洲研究院已经做出了卓越的成就。未来二十年,微软亚洲研究院怎么看?微软亚洲研究院成立20周年之际,微软亚洲研究院各领域的资深专家在机器学习、计算机视觉、系统研究、数据智能、个性化推荐系统、自然语言处理、计算机图形学等十余个人工智能核心技术方向发表了文章,解读了对未来十年到二十年技术趋势的观点。本文节选了已经发表了六篇,与读者分享微软亚洲研究院的“预见未来”。

好的系统“大象无形”

在整个计算科研和产品创新体系中,计算机系统是最基础、最根本也是最重要的领域。计算机系统研究涉及的方面非常宽广,即包括软件层面的操作系统、数据库系统、编译系统行装,也包括硬件层面的CPU指令集、内存、存储系统、服务器和数据中心结构等。

微软亚洲研究院认为,“大音希声,大象无形”是“好系统”的体现。“无形”就意味着现代计算系统设计要能够自然而然地陪伴着大众,但却也让大众能够“视而不见”,这就像无处不在的加油站或电源接口,这些设施屏蔽了复杂的城市供油和供电线路。

在可见的未来,系统研究仍将把“无形”作为重要设计理念,让应用开发者和大众无需面对底层系统的复杂性。未来的技术趋势是一个现实世界和虚拟世界边界消失的过程,也可以简单地说是“虚拟和现实世界的融合”。而这些变化背后需要大量的各型可嵌入可连接的传感器和执行装置、智能化的数据分析和服务以及混合现实和浸入式体验设备的支持。

在云计算系统架构方面,现在一个显然的技术趋势就是如何从完全中心化的云计算进化到新的去中心化的计算。例如:IoT和边缘计算的兴起就在这个背景下产生。更重要的,从计算机架构和哲学范畴出发,去中心化一直是整个世界占主导地位的一种系统设计。当然,完全去中心化也是不切实际的。未来让数据和计算如何无缝在云端和终端迁移、交互以及协作将成为系统研究的一个重要方向,从操作系统、存储系统乃至一致性协议都需要进一步改进。

未来计算对实时性的要求越来越高,如何针对性的设计相应的计算平台,是系统研究的一个课题。存储平台的发展,从BigTable、MongoDB到Spanner, 遵循以提高可扩展性为首要需求,但对一致性的要求也越来越强,高可扩展及强一致性的存储平台将是未来的趋势之一。在智能边缘计算方面,如何对系统的性能和能耗进行优化,是一个值得持续研究的课题。另外,在边缘计算中,模型是存储和运行在边缘设备上的。因此,如何保护模型数据不被非法复制和盗用就成了一个重要的问题。在安全、隐私和可信计算方面,安全硬件、区块链和可验证的软件技术将一起构成新的安全基础。

软件和硬件的一体设计变为一个未来的重要趋势。如何更好的定义硬件和软件之间的边界以及合适的抽象、如何找出它们之间的最好划分成为了系统体系结构设计的重要问题。例如,对于深度学习、Tensor和计算图的引入就软件和硬件如何合作完成这种新的计算模式提出了新的要求;大数据领域、数据运算的抽象结合定制的加密和压缩芯片也将进一步提高云计算平台处理大数据的效率。在新的一体化设计革命中,新的特定领域编程语言、编译器和优化、以及虚拟化技术也将同时变革。

异构系统正成为近年来计算机体系结构研究的一个热点。深度学习加速器、FPGA为基础的可重构硬件、通用可编程加速器以及新的通用处理器都在不断创新。而内存硬件的创新例如高速非易失性内存(Non Volatile Memory,NVM)、内存封装的创新例如HBM(High Bandwidth Memory )以及体系结构的创新例如内存解聚(Memory Disaggregation)也将帮助计算从内存访问带宽和延迟的瓶颈中解放出来。

未来的人工智能计算系统的前端表达能力将越来越灵活,逐渐趋于通用计算;同时,后端的计算能力将越来越强大。面对前、后端的快速发展,自动化的编译优化框架成为了衔接两者的必经之路。而在人工智能时代,大规模计算系统不仅要在大规模设备上才能高效地处理海量数据,更需要能支持多种不同类型任务的混合执行的能力。未来,不同的计算任务在实际中的边界将变得越来越模糊,很多现实的应用中的数据分析都是由这些计算任务组合而成的综合体。现在更多大型系统有着更多的随机性,控制变量和环境变量大幅增加。这些新的变化,让人工智能可能发挥更大的作用。在将来,系统研究者需要探索如何将基于统计学习的方法更加广泛的应用到大型复杂系统的设计和控制中去。

机器学习还有哪些可以期待?

近年来,有很多新型的机器学习技术受到人们的广泛关注,也在解决实际问题中,提供了有效的方案,包括深度学习、强化学习、对抗学习、对偶学习、迁移学习、分布式学习、以及元学习。机器学习虽然取得了长足的进步,也解决了很多实际问题,但是机器学习领域仍然存在着巨大的挑战。

首先,主流的机器学习技术是黑箱技术,无法预知暗藏的危机。为解决这个问题,则需要让机器学习具有可解释性、可干预性。其次,目前主流的机器学习的计算成本很高,亟待发明轻量级的机器学习算法。另外,在物理、化学、生物、社会科学中,人们常常用一些简单而美的方程(比如像薛定谔方程这样的二阶偏微分方程)来描述表象背后的深刻规律。那么在机器学习领域,是否也能追求到简单而美的规律呢?如此的挑战还有很多,不过微软亚洲研究院对于这个领域未来的发展仍然充满信心。

其中,在轻量级机器学习和边缘计算方面,边缘计算指的是在网络边缘节点来处理、分析数据,而边缘节点指的是在数据产生源头和云计算中心之间具有计算资源和网络资源的节点,比如手机就是人与云计算中心之间的边缘节点,而网关则是智能家居和云计算中心之间的边缘节点。在理想环境下,边缘计算指的是在数据产生源附近分析、处理数据,降低数据的流转,进而减少网络流量和响应时间。随着物联网的兴起以及人工智能在移动场景下的广泛应用,机器学习与边缘计算的结合就显得尤为重要。

值得一提的是量子机器学习,这是量子计算和机器学习的交叉学科。量子计算机利用量子相干和量子纠缠等效应来处理信息,这和经典计算机有着本质的差别。目前量子算法已经在若干问题上超过了最好的经典算法,我们称之为量子加速。当量子计算遇到机器学习,可以是个互利互惠、相辅相成的过程:一方面可以利用量子计算的优势来提高经典的机器学习算法的性能,如在量子计算机上高效实现经典计算机上的机器学习算法。另一方面,也可以利用经典计算机上的机器学习算法来分析和改进量子计算系统。

而在简单而美的规律方面,面对大自然纷繁复杂的现象和系统,前人已经得出一个出乎意料的结论:貌似复杂的自然现象都由简单而优美的数学规律所刻画,如偏微分方程。Mathematica的创建者、知名计算机科学家、物理学家Stephen Wolfram也曾给出过类似的观察和结论: “事实证明,物理和其他科学领域几乎所有的传统数学模型最终都基于偏微分方程。”既然自然现象背后简而美的数学定律如此普遍,那么能否设计一种方法来自动学习和发现现象背后的数学定律呢?这个问题显然很难,但并非完全不可能。

即兴学习是机器学习的另一个有趣研究方向。预测学习利用所有当前可用的信息,基于过去和现在预测未来,或者基于现在分析过去。问题是,生活的世界是否可以预测?这个问题的答案是不明确的。与预测学习对世界的假设不同,即兴学习假设异常事件的发生是常态。即兴智能是指当遇到出乎意料的事件时可以即兴地、变通地处理解决问题的能力。即兴学习意味着没有确定的、预设的、静态的可优化目标。直观地讲,即兴学习系统需要进行不间断的、自我驱动的能力提升,而不是由预设目标生成的优化梯度推动演化。换言之,即兴学习通过自主式观察和交互来获得知识和解决问题的能力。

社会机器学习让机器模拟人类社会的行为。当前,机器学习的目的是模拟人类的学习过程。但是到目前为止,机器学习忽视了一个重要的因素,也就是人的社会属性。既然人类的智能离不开社会,那么能否让机器们也具有某种意义的社会属性,模拟人类社会中的关键元素进行演化,从而实现比现在的机器学习方法更为有效、智能、可解释的“社会机器学习”呢?事实上,现在的机器学习方法中已经开始出现“社会智能”的零星影子。由于社会属性是人类的本质属性,社会机器学习也将会是利用机器学习从获取人工智能到获取社会智能的重要方向。

通向AI幸福的未来路径

人工智能正在改变我们的生活,更在变革或颠覆着各行各业。人工智能在创造机遇的同时,也给人类世界带来了诸多挑战。

挑战一:机器或取代人类,造成失业与贫富不均。挑战二:人工智能威胁人类自身安全与社会秩序。挑战三:人工智能或促成信息垄断或意见两极。面对这些人工智能带来的挑战,问题已从最初的“它可以做什么”变为了“它应该做什么”。人工智能创造了许多契机,也带来了不确定性。应保持开放的态度,也保留质疑的精神,面对这些挑战并抓住其中的机遇。

应对AI挑战,微软亚洲研究院提出可以考虑以下路径:

路径一:推广计算思维普及教育,让每一个人成为AI的理解者与受益者。在对计算机智力超越人类智力的担忧背后,呈现出基础教育中计算思维培养的缺失。让新一代受教育者学会运用计算机科学的基本概念来解决问题、设计系统和理解人类行为,正成为建立其未来竞争力的关键。

微软的目标是使人工智能全民化。自2014年起,微软亚洲研究院积极与教育部和大中小学合作,以计算思维为切入点,通过产学合作协同育人项目,改革计算机基础教育模式。五年来,已有近140门相关课程在全国29省市的110余所高校中开设,由东部发达地区的重点高校带动西部教学资源稀缺的地方高校,惠及数百万师生。同时,通过“创新杯”、“编程之美”、“编程一小时”等系列竞赛活动,让“计算思维”的概念为高等教育、基础教育界所重视,为其推广做出了贡献。信息化和智能化的时代背景对人才提出了新的要求,计算机基础教育和计算思维普及的重要性也与日俱增,微软正在与国内外计算机领域学者一起,为这个崭新的时代创造更多可能。

路径二:推动各行业数字化转型,让每家公司成为AI的使用者与创造者。技术变革将行业发展裹挟其中,我们看到人工智能在教育、医疗、养老、环境保护、城市运行、司法服务等领域的广泛应用。人工智能发展的核心是数据,而各行业都储备着大量数据,若以人工智能技术有效利用这些数据,行业革新将不只是愿景。

数字化转型的内涵远不止于将传统业务数字化,这只是漫漫征途的第一步,智能化是我们希望到达的“远方”。人工智能技术应深入到各行各业,与具体的应用场景结合,从而彻底变革传统的行业工作模式与产品形态。例如微软亚洲研究院与华夏基金就人工智能在金服领域的应用开展战略合作研究,与培生教育共同开发了英语学习应用「朗文小英」,并与东方海外航运 (OOCL) 展开合作计划,通过应用人工智能研究,改善航运网络营运以提升效率。在医疗领域,微软亚洲研究院与辉瑞公司合作构建了冠心病、脑卒中、高血压、高血脂等常见慢性病的知识图谱及智能问答系统,以帮助患者与医生进行更有效地沟通。

路径三:加强国家和政府引导,让AI在政策、法律和规范的指导下更具效能。在人工智能面对的诸多挑战中,技术不是最终难题,人在其中的能动性更值得关注。经过几代人、无数杰出的科学家研发而成的人工智能,必须得到更好的管理与规范,才能真正地造福人类。我们亦需要一股力量来缓解科技对人类社会造成的冲击,政策和法律正是重要的规范与疏导力量。

前面提到的三大挑战中,很多问题能够也需要通过国家帮助解决,譬如失业、贫富不均、安全保障、垄断和偏见、教育等问题都需要政府的力量。就失业问题而言,根据前几次工业革命的经验,工业革命后人的智力、人对新事物的接受度也会随之提升。但不幸的是,人的进步与科技进步并非同步的,这中间有一个时间差。如何让这段时间平滑过渡,让受到科技冲击的人能够有其他选择,这就需要国家和政府的关注与帮助。同时,如何有效消除数据壁垒、提升用户体验,这也需要政府的努力。

路径四:敦促科技公司自律,让AI更加安全可靠,更透明,更可解释。科技公司是人工智能技术的受益者,也应当肩负起技术应用的社会责任,让人工智能变得更加可靠。微软自开启人工智能领域研究以来,始终关注人工智能开发与应用的道德伦理问题,作为联合创办人创立了人工智能合作组织(PAI),致力于推进相关问题的讨论。

个性化推荐系统

据报道,推荐系统给亚马逊带来了35%的销售收入,给Netflix带来了高达75%的消费,并且Youtube主页上60%的浏览来自推荐服务。如何搭建有效的推荐系统,意义深远。微软亚洲研究院从深度学习的应用、知识图谱的应用、强化学习的应用、用户画像、可解释推荐等几个方面,一起看看推荐系统的未来。

深度学习技术在推荐系统中的应用前景很广阔。其中的一个挑战是多样化数据融合:用户或者物品的数据往往是复杂多样的,物品的内容可以包括文本、图像、类别等数据,用户的行为数据可以来自社交网络、搜索引擎、新闻阅读应用等多个领域,用户的行为反馈也可以电商网站中的搜索、浏览、点击、收藏、购买等多种行为。在这些不同的维度中,不同用户或物品的数据分布也千差万别;用户在不同的行为反馈上的数据量也不同,点击行为的数据量往往远大于购买行为的数据量。因此,单一、同构的模型是不能有效地处理这些多样化的数据的,如何深度融合这些复杂数据是一个技术难点。

在捕捉用户长短期偏好方面,用户的偏好大致可以分为长期和短期两类,长期偏好往往指用户的长期兴趣所在,短期偏好指的是用户在当前环境下的即时兴趣,例如最近一周比较喜欢的热门歌曲。如何结合情境因素的影响,将用户的长期偏好与短期需求更紧密、有效地结合起来,也是推荐系统的研究热点。

与社交网络相比,知识图谱是一种异构网络,因此针对知识图谱的推荐算法设计要更复杂和精巧。将知识图谱引入推荐系统,主要有如两种不同的处理方式:基于特征的知识图谱辅助推荐,核心是知识图谱特征学习的引入;基于结构的推荐模型,则更加直接地使用知识图谱的结构特征。例如,微软亚洲研究院使用了向外传播法,将每个用户的历史兴趣作为知识图谱上的种子集合,沿着知识图谱中的链接迭代地向外扩展等。

通过融合深度学习与知识图谱技术,推荐系统的性能取得了大幅的提升。然而,多数的推荐系统仍是以一步到位的方式建立的。在此,往往要假设已充分获取用户数据,且其行为会在较长时间之内保持稳定。然而对于诸多现实场景,例如电子商务或者在线新闻平台,用户与推荐系统之间往往会发生持续密切的交互行为。在这一过程中,用户的反馈将弥补可能的数据缺失,同时有力地揭示其当前的行为特征,从而为系统进行更加精准的个性化推荐提供重要的依据。

构建推荐系统的核心任务之一在于如何准确地分析出用户的兴趣特点,也就是常说的用户画像。简单说来,用户画像是指从用户产生的各种数据中挖掘和抽取用户在不同属性上的标签,如年龄、性别、职业、收入、兴趣等。目前,主流用户画像方法一般是基于机器学习尤其是有监督学习的技术,但仍面临着挑战,特别是如何从多源异构用户数据中构建深度、统一和动态的用户画像,相应可展开的研究方向包括:构建具有更强表征能力的用户表示模型;基于多源和异构数据的用户画像;不同平台用户画像数据的共享和用户隐私保护;面向用户画像的统一用户表示模型等。

前面所提及的研究,大都将重心放在提高推荐准确性上,但与推荐对象的沟通考虑得不够。是否能够以用户容易接受的方式,充分抓住用户心理,给出适当的例子与用户沟通。研究发现,这样的系统不仅能够提升系统透明度,还能够提高用户对系统的信任和接受程度 、用户选择推荐产品的概率以及用户满意程度,设计这样一个可解释的推荐系统是终极目标。目前,微软亚洲研究院在考虑从下面三个方面进行研究:利用知识图谱增强算法解释能力;模型无关的可解释推荐框架;结合生成模型进行对话式推荐,例如与微软小冰合作,为小冰生成音乐推荐解释等。

图像识别:机遇与挑战并存

在计算机视觉领域,图像识别这几年的发展突飞猛进。图像识别技术的高价值应用就发生在身边,例如视频监控、自动驾驶和智能医疗等,而这些图像识别最新进展的背后推动力是深度学习。尽管到目前为止深度学习在图像识别方面已经取得了巨大成功,但在它进一步广泛应用之前,仍然有很多挑战需要我们去面对。与此同时,也看到了很多具有未来价值的研究方向。

挑战一:如何提高模型的泛化能力。图像识别技术在可以被广泛应用之前,一个重要的挑战是,怎样才能知道一个模型对未曾出现过的场景仍然具有很好的泛化能力。

挑战二:如何利用小规模和超大规模数据。虽然深度学习通过利用大量标注数据在各种任务中都取得了巨大的成功,但现有的技术通常会因为只有很少的标记实例可用而在小数据情景中崩溃。这个情景通常被称为“少样本学习(few-shot learning)”,并需要在实际应用中仔细考虑。另一个极端是如何利用超大规模数据有效地提高识别算法的性能,并且目前的算法并不能很好地利用这种超大规模数据 。

挑战三:全面的场景理解。除了识别和定位场景中的物体之外,人类还可以推断物体和物体之间的关系、部分到整体的层次、物体的属性和三维场景布局。获得对场景的更广泛的理解将会帮助例如机器人交互这样的应用,因为这些应用通常需要物体标识和位置以外的信息。这个任务不仅涉及到对场景的感知,而且还需要对现实世界的认知理解。要实现这一目标,还有很长的路要走。

挑战四:自动化网络设计。近年来,图像识别这一领域的重心从设计更好的特征转向了设计更新的网络架构。然而,设计网络架构是一个冗长乏味的过程,它需要处理大量的超参数和设计选择。调优这些元素需要有经验的工程师花费大量的时间和精力。更重要的是,一个任务的最优架构和另一个任务的最优架构可能是完全不同的。

数据智能的未来热点

数据智能研究契合当今大数据时代各领域、各行业从数据中挖掘、实现价值,进行数字化转型的迫切需要,因而在近年来得到了充分重视,发展迅速。展望未来,数据智能技术将朝着更自动、更智能、更可靠、更普适、更高效的方向继续发展。

热点1:在更高的语义理解水平上进行分析。为了更加智能地分析数据,需要对数据有更加丰富的语义理解。与知识图谱 (Knowledge Base) 不同,虽然数据分析中最常用的关系数据模型也是对实体和关系的建模,但是关系数据模型的建模是为查询和存储性能而优化的,往往丢失了大量语义信息。如何引入领域知识和常识型知识,对于更好地理解数据至关重要。

热点2:构造通用知识和模型的框架。人类对知识和方法能够举一反三,触类旁通。具体到数据分析领域,分析中用到的知识和模型需要在不同数据对象和分析任务之间共享和迁移。在机器学习领域,已经有很多相关工作,也提出了一些方法,比如迁移学习、多任务学习、预学习模型等等。要实现这个“举一反三”的目标,除了需要深入研究具体的机器学习算法,也需要从模型和知识的框架体系来思考,研究适合数据分析领域的通用知识和模型的原语体系,以及知识和模型的迁移共享的统一框架。

热点3:建立高质量的训练数据集和基准测试数据集。由于训练数据的缺乏,人工智能、深度学习等技术在数据智能领域的进一步应用遇到了很大的困难。正如ImageNet数据对于计算机视觉领域的研究起到了显著的推动作用一样,数据智能领域的研究也亟需建立起一整套公用的大规模、高质量的训练数据集和基准测试数据集。一旦有了丰富的训练数据,数据智能领域的很多研究,诸如自动分析、自然语言交互、可视化推荐等等,将会取得突破性的进展。

热点4:提供具有可解释性的分析结果。用户将不再满足于仅仅依赖黑盒式的智能、端到端地作用于整个任务,而需要更细粒度的、有针对性的、更透明的数据智能。例如,数据智能用于财务审计系统中,准确推荐最有风险的交易记录进行优先审查,以达到在最小化系统风险的前提下,最大化审计效率。在这类系统的研发中,需要构建可理解性强的模型。在推荐高风险交易记录的同时,尽量提供系统是依据哪部分信息、通过怎样的逻辑判断这是一条高风险交易的相关依据。这与过去通常使用的黑盒技术路线有了明显的变化,将成为今后技术发展的一个趋势。

热点5:人类智能和机器智能更加紧密融合。现有人工智能技术从本质上依然只是被动服从人类设定的既定逻辑然后自动地运行,归根到底还是无法突破人类传授的学习框架,没有创造力。因此在可预见的未来,数据智能将依然无法摆脱人与机器协作的模式,需要全面地总结人类在数据分析方面的智能和经验,便于转化为机器算法,系统化地集成到已有的智能系统当中。

热点6:强大的指导性分析成为主流。数据分析的核心目标之一便是指导行动,无论分析得有多好,如果不采取行动,那么分析的价值就不会得到实质的体现,这就是指导性分析的重要价值所在。现在的数据智能技术在给出指导性分析的同时,并没有具备足够解释性的模型,无法提供充足的依据,从而不足以让人类用户充分信任自动推荐的结果。提供具有更好解释性的指导性分析是一个趋势。

热点7:基于隐私保护的数据分析更加成熟完善。通过从立法、技术、到用户参与等全方位的共同努力,隐私保护将被进一步纳入到未来的数据分析中。从技术层面, 应该确保个人数据由数据主体控制如何收集、管理、处理和共享,并在整个生命周期得到保护,同时应开发并部署保护隐私的数据处理技术,以便在保护隐私的前提下,数据得以处理并获得想要的结果。

热点8:智能分析助手得到普及。在不久的将来,智能的数据分析助手能够帮助人类更加高效地分析和利用数据。这些数据分析智能助手通过自然语言对话的方式与人交流数据分析的任务和结果,理解分析的背景和上下文,可以完成人类交给的特定数据分析任务 (根据分析的语义层级不同,可分为基本分析命令和高级数据挖掘任务),也可以把具有商业价值的数据事实推荐给相关人类用户 (比如自动从数据中挖掘到的数据洞察),并对某些数据事件做出智能判断和适当的反应 (比如自动对数据中需要注意的变化进行提示和警报)。这样的智能体还具有一定的学习能力,能够通过与人类分析师的对话交流积累特定领域的知识,从而能够更加具有针对性和更加智能地进行自动数据分析。

热点9:协作化的可视分析。随着各种沟通工具的兴起和普及,协作化的可视分析会成为热点。不同于传统的面对面、小规模的协作,新的协作分析往往是异步的和大规模的,人们在不同的时间和地点,使用不同的设备,对同一个数据进行可视分析。在此过程中,如何协调人们的协作?如何避免重复性的工作?如何保证不同人在不同的显示终端上看到的数据是一致的?如何共享各种信息?如何搭建一个高效的协作平台?这些都是需要解决的技术挑战。

热点10:可视化将无所不在。在更长远的将来,相信可视化终将变得透明。就像文字和语音一样,广泛渗透到我们的日常生活中。为此需要有三个方面的技术储备:可视化视图必须能够被快速地生产和消费;要进行交互方式的变革,各种人类更习惯的方式 (例如手势、笔纸、触控等) 需要慢慢演化成更成熟的交互手段;需要显示设备的普及,只有当显示设备无处不在的时候,可视化才能真正变成一种沟通的基本方式。

站在微软亚洲研究院新旧二十年之交,微软全球资深副总裁、微软亚太研发集团主席、微软亚洲研究院院长洪小文表示:为什么研究院的同仁会选择在微软公司做基础研究,而不是去大学的实验室?其中的答案是显而易见的,计算机作为一门应用型学科,要让研究成果从实验室走出去,融入到产品研发和实际应用中,直达用户体验,贯通创新价值链条的全程,才能成就技术发展的最大的社会效能。

微软亚洲研究院曾被《麻省理工学院技术评论》(MIT Technology Review)誉为“世界上最火的计算机实验室”,如今的微软亚洲研究院还将有望成为“最有商业远见的计算机实验室”——与微软的产品与商业紧密结合在一起,微软亚洲研究院正走在“计算商业”的大路上。(文/宁川)

你可能感兴趣的:(预见未来: 微软亚洲研究院看下一个二十年)