大数据与智慧城市
陈宝权1,程章林2
1. 山东大学计算机科学与技术学院 济南 250101;
2. 中国科学院深圳先进技术研究院 深圳 518055
摘要:城市大数据的关联分析与智能提取是智慧城市建设的关键,通过构建真实城市沉浸式交互分析环境,将复杂的城市大数据以及数据挖掘结果以形象直观的方式展现给用户,让用户以视觉理解的方式获取数据中蕴含的信息并进行交互,实现人类智能和机器智能的有机融合是解决复杂城市问题的有效途径。分析了城市大数据面临的挑战、发展现状、处理流程以及技术要点,最后探讨了智慧城市的发展趋势。
关键词:大数据;智慧城市;交互式可视分析;机器智能
Big Data and Intelligent City
Chen Baoquan1, Cheng Zhanglin2
1. College of Computer Science and Technology, Shandong University, Jinan 250101, China;
2. Shenzhen Institutes of Advanced Technology, CAS, Shenzhen 518055, China
Abstract: Fusion and analysis of urban big data is the key to achieving city intelligence. Specifically, to solve for the complex urban problems, it is imperative to build an immersive and interactive visual analytics environment where humans can make sense of out of the otherwise disconnected and abstract data. The state of the art and challenges in urban big data were summarized, and then a work flow for urban data analysis and the trend in the future intelligent city were presented.
Key words: big data, intelligent city, interactive visual analytics, machine intelligence
1 智慧城市与城市大数据
随着我国城市化进程的不断推进,人口和资源迅速向城市集中,中国城市化比例已经超过了50%,是世界上城市人口最多的国家。城市化虽然提高了人们的生活水平,但同时也带来一系列的社会和环境问题。目前,各大城市普遍出现了以人口膨胀、交通拥堵、资源紧缺、环境恶化、生态破坏、事故频发等为特征的“城市病”。此外,中国城市的空间结构和社会环境尤为复杂,繁华的城市中心人口密度大、人员结构复杂、流动性大、犯罪率高,成为城市发展的不稳定因素,给城市管理和公共安全防护带来极大的困难。这些问题已成为制约城市健康、可持续发展的难题,如何妥善解决这些问题并提供更好的城市生活已经迫在眉睫。目前渐趋成熟的“智慧城市”理念为解决上述问题提供了思路,成为促进未来城市发展的新理论和实践。目前,智慧城市建设已经上升为国家战略,科学技术部、工业和信息化部、住房和城乡建设部、发展和改革委员会等多个部委纷纷制定了相关政策和方案推动智慧城市建设,至今已有近百个城市(区)在进行智慧城市建设试点。
智慧城市建立在数字城市基础之上,可以看作数字城市的高级形态,旨在将云计算、物联网以及数据挖掘等先进技术充分地运用到城市的各行各业,人类可以用一种更加精细和动态的方式管理生产和生活,达到“智慧”的状态。随着十多年来数字城市项目的开展,目前国内各大城市都构建了较好的城市信息化基础设施,给智慧城市建设提供了海量的城市大数据:在市民家庭方面,移动电话、有线电视、宽带网络基本普及;在政府层面,电子政务网络平台基本形成,对外提供信息公开和网上办事等功能,人口、交通、土地、房屋、企业、市政、地理等基础信息数据库不断完善;在医疗卫生领域,电子病历、健康档案开始试点;几十万甚至几千万个监控摄像头覆盖整个城市;电子商务不断发展壮大。通过各种传感设备可以实现人类对城市环境各种数据的获取,总的来说,城市大数据包含两方面的内容:一类是城市数字化(数字城市、数字交通、数字医疗、数字政务等)产生的物理实体感知数据,另一类是人类社会交往产生的社会感知数据(E-mail、微信、微博等)。这些数据从多个维度描述了城市现实物理环境和社会生活的方方面面,构成了一个与之平行的虚拟镜像。这使得城市大数据呈现出明显的“4V”特性:海量的数据规模(volume)、多样的数据类型(variety)、实时动态数据(velocity)、巨大的数据价值(value)。智慧城市的一个重要内涵就是通过数据关联、分析,提取知识和智能,挖掘其中蕴含的巨大价值,实现城市运行与管理的智能化。
2 城市大数据面临的挑战
智慧城市建设是一个复杂巨系统,在城市复杂事件分析决策过程中需要对复杂事件的对象(who)所涉及的行为和状况(what)、时间(when)、地点(where)和起因(why)等关键要素有及时、全面、精准的了解,并且随着事件的演化,能够对这些要素的动态性进行及时捕获与感知。因而,相比其他领域的大数据,面向城市智能分析与决策的城市大数据面临以下挑战。
(1)数据关联耦合关系复杂
现代城市作为人类社会的政治、经济、文化、商业、教育和科技中心,具有基础设施高度聚集、空间结构高度复杂和社会管理高度动态的三“高”特征。纵横交错的城市运行系统使得人流、资金流、物资流、能量流、信息流高度交汇,在城市物理环境、信息空间和人类社会之间形成了多要素、多维度、多结构、多层次的关联耦合关系。单个系统的异动都会对其他系统产生直接影响,甚至引起连锁反应。一些原本在物理世界突发的局部范围的自然灾害或社会事件,可通过网络媒体迅速广泛传播,进而影响到大众行为,并对原始事件产生影响。网络与社交媒体的普及使得公众群体不仅是信息的生产、加工和传播者,而且是事件演化的推动者。如社交网络助推的突尼斯等中东非国家骚乱事件、互联网络上进行的人肉搜索等,都体现了网络活动对现实社会的重要影响,这就导致城市大数据间存在复杂的关联耦合关系。
(2)数据整合与共享不足
在我国现阶段,城市基础信息资源依然不够完整,信息的横向整合和共享严重不足,城市数据碎片化地分散在不同的系统中,从而难以建立有效的智能分析与决策支持系统。如2013年在青岛发生的中石化输油管道泄漏爆炸特别重大事故,共造成62人死亡,136人受伤,其发生的主要原因在于爆炸区域各种地下管道的分布信息没有共享与整合,导致现场处理事故的工作人员不能清晰完整地了解输油管道与附近市政管道之间的复杂关系;同时,工作人员对市政管道内出现的高浓度油气累积状况缺乏有效的现场检测与感知手段,形成了信息盲区,因而导致了惨剧的发生。类似地,在一些城市大型交通枢纽、公共场馆、商业中心等地点,涉及的对象的种类、关联性、状态的演变等特性远比上述情形复杂,其信息也牵涉更多管理部门,在分析决策时亟需将分散在不同系统的碎片化数据有机整合在一起。
(3)需要临场获取时效性数据
对于一个快速演化的事件,迫切需要将各种相关信息快速汇聚,完整地呈现在各级决策者面前,以及时建立对事件的准确评测、便捷决策和快速响应,从而掌控整个事态的发展进程。但是,已有的信息化数据不可能恰好可以满足对某事件评估决策的具体要求,往往需要按需主动抓取,甚至现场采集补充新的数据,与已有信息进行有效融合,才能实现对事件更完整、更精细的刻画,从而为及时精准的决策和服务提供足够的信息。
这些挑战给城市大数据分析、理解和应用带来了非常大的困难。在很多情况下,其复杂性已超出目前机器智能所能解决的范畴。考虑到人类智能与机器智能的互补性,机器的高速信息处理能力远远超过人脑,而在处理某些复杂问题尤其是高层次理解问题上,人脑的直觉和判断要远胜机器智能,机器智能无法完成的对复杂事件的理解和分析,需要借助人脑智能与机器智能共同完成。另一方面,城市复杂事件的处理与分析事关社会公共安全和生命财产,潜在风险大,临场应变程度高,人是进行决策的最后也是最重要的一环。因此,有必要融合人脑智能和机器智能,在城市大数据分析理解过程中既有机器的智能参与,也需要人脑智能的判断与决策。
可视分析技术为实现机器智能和人脑智能的有机融合提供了一条可行的途径。可视分析是一个涉及数据挖掘、人机交互和可视化等的交叉学科,其引导的分析推理模式是探索复杂数据中蕴涵的新规律和新现象的催化剂[1]。美国的国家可视化与分析中心(NVAC)于2005年出版的《可视分析的研究和发展规划》[2]指出,可视分析着重于对一个问题的全面解决,其核心是采用可视化和用户交互方法,辅助用户从大尺度、复杂、矛盾甚至不完整的数据中,快速挖掘有用的信息,以便做出有效决策。人类在理解、分析和决策时主要通过视觉方式获取信息,可以通过可视界面和交互,将人的智能特别是“只可意会,不可言传”的知识、个性化经验和直觉融入复杂数据的关联分析和推理决策过程[3]。
因此,对于复杂城市大数据的分析理解,需要构建沉浸式的交互分析环境,将复杂的城市大数据以及机器智能处理结果真实、直观地呈现出来,让用户以视觉理解的方式获取数据中蕴含的信息,将机器的自动分析与用户的视觉理解结合,通过实时交互的方式,迭代递进完成城市数据感知任务。
3 城市大数据国内外发展现状
经过若干年发展,与智慧城市各方面相关的研究已经有较多有形成果,包括数据采集、数据分析、模拟仿真、数字城市信息平台以及典型的数字城市应用案例等。
目前,城市大数据分析已有一些比较成功的典型案例,比如基于大规模出租车轨迹数据分析现有城市道路网的不足、提取城市中不同的功能分区、设计最佳行驶路径等;利用有限的地面监测空气质量数据,结合交通流、道路结构、兴趣点分布、气象条件和人们流动规律等大数据,推断整个城市细粒度的空气质量;基于社交网络数据的推荐系统、提炼群体智慧、发现异常事件等。以上这些研究主要基于城市数据采用机器学习等算法,仅仅利用机器智能自动挖掘出有价值的信息,很少有通过机器智能与人脑智能有机融合的方式实现城市大数据感知理解与决策。
在实现机器智能与人脑智能有机融合的过程中,要构建沉浸式的交互分析环境,高精度城市三维信息平台是基础,需要以三维城市平台为载体关联、索引各种城市非结构化信息,并直观展示各种城市大数据及交互过程。
近年来,各种数字城市信息平台发展迅速,GoogleEarth 3D[4]、微软Bing Map 3D、Skyline和Worldwind是典型的数字城市平台,如图1所示。GoogleEarth可以提供二维和三维漫游显示及用户交互的接口,世界上任何一个用户都可以通过Google Earth 3D浏览、增添三维模型、图片文字等各种丰富的内容信息。三维数字城市平台在大众服务方面的应用实例也很多,如电子地图、导航和虚拟旅游等。美国费城虚拟城市是典型例子,它为用户提供俯视、沉浸的方式浏览虚拟城市,游客能够身临其境一般地在城市内行走、观光,得到沿途所见景点、商店、广告等信息,甚至可以进入到建筑内部,了解室内布局或在固定视点环视室内场景,如图2所示。
图1 Google Earth 3D和Microsoft Bing Map 3D示例
图2 Philadelphia虚拟城市及其室内浏览
除了浏览漫游之外,三维数字城市建模在城市规划、决策、应急指挥等具有重要指导作用和意义。联合国2006年就建立了“联合国灾害管理和应急空基信息平台(UN-SPIDER)”,旨在普及各类与灾害管理有关的空间信息和服务;在文化遗产保护领域提供了很大帮助,如希腊亚里士多德大学古希腊Polyphemus巨人的岩洞的三维建模项目、国内龙门石窟研究院与北京大学等合作的龙门石窟三维数字图书馆[5]、武汉大学敦煌莫高窟等数字化项目;在对社会行为分析决策方面也能提供帮助,如美国华盛顿大学在NSF支持下研发的UrbanSim,通过人口、交通网络、土地状况融合经济趋势,对住房、商用地、城市扩张等提供决策,并在休斯顿、盐城等城市进行了应用。
目前城市三维空间数据基础建设中,传统的遥感、测绘方法仍是主要的数据获取方式,构建的主要信息交流平台仍然是相对独立的地理信息应用,例如在平台上显示遥感影像、数字地图和简单的社会信息,提供简单的交互查询方式。大部分应用是针对某个单独领域的,而没有整合为涉及城市方方面面应用的巨系统,交互方式也以机器为主体。未来数字城市的发展方向应该是以生活在城市中的人为中心,是融合建筑、交通、电气、通信等实体和基础网络设施以及植物、气象、环境等自然要素的空间数据虚拟现实世界,也是社会经济等非空间信息的载体;数字城市基于空间、非空间信息而建立,同时在此框架下能够跨越时间、空间,进行复杂的自然和社会现象的模拟。
4 城市大数据处理流程与框架
从数据的角度讲,智慧城市的核心在于全方位采集城市生产、生活等各方面的数据,并对这些数据进行关联、集成、统计、分析,提高城市生产、管理、运营的智能化水平,其流程框架如图3所示,该框架由数字化(digitization)、计算(computation)、应用(application)3部分组成。
图3 智慧城市数据流程与框架
数字化的任务是对城市实体(包括空中、地面、地下以及静态和动态对象)进行几何、空间数据信息的测量和收集,建立城市静态三维模型和动态时空演变模型。比如以车载结合机载的激光扫描获取空中与地面的大规模城市三维场景,研究基于激光扫描点云的自顶向下的交互式三维建模技术;通过新型声波探地技术进行地下管网的三维成像;利用各种无线传感器网络采集城市的动态信息;对城市公共场所的火警、污染气体扩散等进行监测,对家庭用水、用电情况进行采集分析等。
计算是指以第一部分数字化得到的高精度城市三维模型、城市动态采样信息为基础,通过建立物理演变模型和人物行为模拟等,针对城市中不同应用需求进行预测和决策。
应用与数字化和计算紧密相关。数字城市的应用主要分为城市的资源管理和应急反应两大方面,资源管理是指支撑相关部门对水、气、土地、通信基础设施等进行规划,对能源、交通、人口等进行管理调度;应急反应则是对突发疾病、反恐、污染、洪水、反常天气等小概率但危害严重的事件进行预测和决策,从而最大程度地减少损失,保护人们的生命财产安全。
通过上述智慧城市技术流程框架可以看出,智慧城市具备“三维、动态、实时”三大特点,这三大特点将引领数字生活到数字城市(digitallife to digital city)、数字城市到数字生活(digital city to digital life)的革命性进步,是智慧城市应用的新需求。虽然目前建立城市的高精度三维模型仍需要耗费大量物力、财力,但很多应用需求却促使必须向“二维到三维(2Dmap to 3D world)”的特点迈进。例如,对高层建筑火灾情况的应急救援和人群疏散、气体污染物泄漏扩散、由城市三维模型生成“三维数字噪声地图”的城市噪音仿真模拟等应用都不是传统的二维数字城市系统所能解决的,而这些应用正是提高城市中人们安全保障和生活质量的有效途径。城市绝对不仅是拥有不变结构和设施的静态城市,还包括生活在其中的人群所进行的各种各样的动态活动、各种设施的动态运转进程以及随时可能发生的各种险情和灾害。那么哪些应用使得仅仅拥有高精度的三维数字城市模型还远远不够,而需要数字城市“从静态到动态(staticto dynamic)”发展呢?获取大楼内火灾各个阶段的发展状态、人群的流动分布等动态信息,将促进更加高效地对火灾进行应急救援和疏散;市民出行查询最优交通路线,将不再是仅仅查找“最短”路径,而是综合城市交通的静态道路和动态路况信息进行最优选择;通过手机信号等采集城市人口流动情况,将能有效地识别各个不同时段人流在工业区、住宅区等的分布状况,为政府部分和相关产业提供更好的区域规划设计辅助。总之从本质上来说,我们所处的真实城市本身就是一个充满动态的城市,如果说前面列举的应急救援、动态交通路径等应用让人觉得仅是美妙的海市蜃楼,那么“从批处理到实时(batchto real-time)”则是让海市蜃楼落地生根变为现实的力量源泉。要实现大规模污染扩散、应急救援、动态交通等应用模拟和决策,所需的信息采集量和模拟运算量将非常惊人。由于受到计算能力的制约,通常只能在灾害事发过后对记录的数据进行分析和过程重建,但这样仅能起到“事后诸葛”的作用,不能真正发挥对应急救援等应用的支撑辅助决策。目前,高性能计算机发展迅速,国家对超算中心建设的重视与投入为各种实时应用提供了有利的基础,使得很多智慧城市的大规模实时应用都将不再虚幻。
5 技术要点
5.1 城市场景几何建模与可视化
目前在计算机视觉和计算机图形学领域,针对城市场景的三维建模出现了很多种不同的解决方法,其中典型的一种方法是程序式建模(proceduralmodeling),该方法基于各种语法(grammar)或规则(rule),能够快速构建大规模城市场景中各种复杂的建筑物、墙面及街道的三维模型,但是该类方法主要用于生成虚拟的城市场景,很难重建真实城市场景中各种建筑物的复杂形状变化和结构模式。要针对现实城市场景重建其逼真的三维模型,首先必须获取场景的三维空间数据,这构成了城市场景建模的另一类方法——基于测量数据的城市场景三维建模。
在早期除了人工测量之外主要利用遥感技术和航空摄影测量的方式获取大规模城市场景的影像数据。这种大范围摄影的方法获取的主要是城市场景中建筑物顶面的信息和建筑物的整体结构信息,很难获得建筑物立面的大量几何细节结构和纹理信息,基于此重建出来的三维模型由一些比较简单的线框结构组成,模型的逼真度和真实感较差。在计算机视觉领域,研究人员多从地面街道上拍摄场景的高分辨率图像,采用基于图像的方法恢复城市场景的三维外形数据。这种基于图像的方法还不够顽健,很难全自动地获取三维信息,只适用于小范围场景数据获取与建模工作,而且重建的模型精度有限。
近年来,随着三维激光扫描设备的发展,各种激光扫描设备也被用于获取城市场景三维数据,通过激光扫描能够直接获取物体表面高精度的三维外形信息。普通的地面定点式激光扫描需要将扫描仪固定在一个视点扫描,测量完成后再换个视点开始新的扫描,不能连续扫描,只适合于小规模场景的数据获取。移动激光扫描是近年来迅速发展起来的一种新型空间立体数据获取手段和工具,这是一种非接触式的激光测量方式。将激光扫描仪装载在汽车上,能够跟随车辆前进快速捕捉道路两旁目标物体表面的三维点云数据,包括位置、颜色、反射强度等信息,随带的高清摄像机同时获得点云数据对应场景的纹理图像。该系统的数据采集速度可以达到50km/h以上,一天内就能够完成核心城区街区场景的三维数据采集与建模工作,非常适用于大规模城市场景的三维外形和表面纹理数据获取,而且场景中各种目标物体的测量与重建精度能达到测绘标准。目前比较成熟的移动三维激光扫描系统有加拿大Optech公司的三维激光测量车Lynx和英国3D Laser Mapping公司的StreetMapper。
为了重建大规模城市场景完整的高精度三维几何模型,本文综合利用多种数据来源,采用不同的方法重建城市场景几何模型。如图4所示,该系统主要通过车载激光扫描和机载激光扫描分别获取城市场景中各种物体(主要是建筑物、树木、道路等)的侧面和顶面三维信息,随带的高清摄像机同时获得对应的纹理信息,融合这些数据通过点云处理和重建算法获得高精度的城市三维模型。二维照片、卫星影像、定点激光扫描数据在城市重建中起辅助作用,满足不同的需求,比如对于重点或地标性建筑物,可以通过定点激光扫描/拍照获取更加全面、完整的信息。
图4 车载和机载激光扫描系统
5.2 动态信息采集与数据处理
城市土地、人口、交通、气象、水质等方面的动态信息,对城市环境监测与改善、土地利用与开发、公共实施管理等都具有重要的参考价值。利用无线传感网络低耗自组、异构互连、泛在协同的基本特征以及RFID(radiofrequency identification)、数据获取技术和高性能数据处理技术,可以实现数字城市领域动态信息采集的独特应用,达到对动态数据的及时发现、实时采集和快速处理的目的。根据数字城市提供的数据资料和信息模型,最大限度地利用信息资源,从而促进生态系统与经济利益的平衡与协调,达到耗损最少、效益最优,充分发挥整体优势,确保城市的可持续发展。图5是动态数据实时采集系统。
图5 动态数据实时采集与处理
5.3 城市模拟与分析
城市模拟主要包括物理模拟、城市人口流动采样与建模、人群行为模拟等。物理模拟是基于城市场景模型对城市暴雨积水、危险物泄漏、毒气扩散、火灾扑救、气象预报等进行模拟。例如,应用计算流体力学的方法以高性能计算机为依托,使用数字城市提供的城市地理几何数据和气象部门提供的实时天气条件,可以快速模拟由突发性污染源产生的污染物在城市楼群街区(包括封闭或半封闭的公共场所)内的传输和扩散。在很短的时间内模拟出污染物的分布及其随时间的演化,并实时地演示动态分布图,可以为应对措施的抉择提供依据和参考,并对公众提供相关的信息。城市人口流动采样与建模可被广泛应用于城市规划、交通规划与管理、环境评估与监测、灾害研究与应急、流行病的监测与预报、城市经济发展研究理等。利用水、电、气消耗、手机通信数据,可以对城市人口流动进行采样和建模,构建中国城市人口时空动态分布的基础数据库。人群行为模拟则是城市公共安全事故、灾害事故等突发事件的预防、预测、监控、预警、应急救援等方面的基础研究技术,是建立城市公共安全应急救援指挥系统和城市群综合防灾体系的关键支撑技术之一。
6 结束语
美国林登(Linden)实验室开发的“第二人生(secondlife)”游戏就可以由玩家构建一个全三维的虚拟世界,在这个世界中,玩家可以制造物品、买卖交易、旅行休闲等,可以选择不同的交通工具去任何想去的地方,如商场、夜总会、体育馆、教堂、图书馆、赌场等,玩家在这里可以换一种身份、性别和角色展开另外一种逼真的生活,经历不同的人生,体验不同的感受。所有这一切都来源于真实世界,其与真实世界的区别在于游戏中的三维场景是虚构的。如果将这里的虚拟场景换成基于真实城市大数据构建的数字城市,建立起现实世界的一种数字化再现,人们就可以在这个数字化的世界中体验真实的人生,称之为“第一人生”。
“第一人生”表现的是一个高度模仿人类现实世界的虚拟世界,它复制了现实世界的场景及其具有的各种信息属性,可以看作是现实世界的信息化虚拟镜像,很多原来需要在现实世界中完成的工作都可以转化到这个虚拟世界中实现,成为社会、经济、政治、军事等活动的试验场。比如传统的旅游、教育、电子商务、游戏娱乐、军事演习等活动都可以在这个虚拟世界中完成。随着虚拟世界的进一步发展,它与现实世界的分界越来越模糊,两个世界就融合在一起,成为人类生存的一个新空间,实现人类生活的飞跃。
参考文献
[1] Johnson C, Moorehead R, Munzner T. NIH-NSF Visualization Research ChallengesReport. Los Alamitos: IEEE Computer Society Press, 2006
[2] Thomas J J, Cook K A. Illuminating the Path:The Research and Development Agenda for Visual Analytics. Los Alamitos: IEEEComputer Society Press, 2005
[3] Tufte E R. Envisioning Information. Dorval:Graphics Press, 1990
[4] Jones M T. Google’s geospatial organizingprinciple. IEEE Computer Graphics and Applications, 2007, 27(4): 8~13
[5] Ma W, Zha H B. Surveying and mappingcaves by using 3D digital technologies. Proceedings of the 12th InternationalConference on Virtual Systems and Multimedia, Xi’an, China, 2006