人工智能(AI)领域的技术进步给地理空间相关研究和应用的智能化发展和融合创新带来了新机遇和新挑战。虽然早期人工智能概念的提出和理论算法的发展可以追述到20世纪40~50年代,但其近期快速发展的主要动力来自于深度学习模型和开发框架(如Tensorflow、Keras、PyTorch)的快速发展和产业化日趋成熟,各行业领域大数据的生产爆发,和计算机硬件(如图形处理单元GPU和高性能计算平台HPC)和终端设备的计算性能不断升级,进而可以支持在很短的时间内训练和部署人工智能模型、支持数据驱动的智能化决策和产业变革。地理空间人工智能(Geospatial Artificial Intelligence,简称GeoAI), 是指地理空间相关科学与人工智能相结合的交叉学科研究方向,通过研究与开发机器的空间智能提升对于地理现象的动态感知、智能推理和知识发现能力,并寻求解决人类和地球环境系统相互作用中的重大科学和工程问题 (比如人口迁移预测、城市扩张预测模拟、复杂条件下的智能交通决策、高精地图制作与自动驾驶、全球变化对农业产的影响、自然灾害应急救援工程等)。地理空间智能的萌芽与发展与地理学、地图学与地理信息系统、遥感科学与技术、地球系统科学、资源环境与城乡规划、智能交通和计算机科学(尤其是机器学习和知识图谱)等学科间的交叉融合、创新发展紧密结合。
地理空间智能的研究框架
日前发布的第七次人口普查数据显示,中国城镇化水平已超过63%,已处于城镇化进程的下半场。在此背景下,城市空间的需求正在从关注“增量”的快速建设向关注“存量”的精细化治理转变,城市空间监测评估、品质提升和精细治理转型正在成为热点。与这一大趋势呼应,国家“十四五”规划纲要明确提出了“加快数字社会建设步伐,全面提升城市品质”的国家战略,需要我们将新近涌现的智能化算法应用在高密度城市空间建设与管理的迫切需求上,探索高密度与高品质协同发展的路径。
当前城市空间层面的智能化研究与实践经过近年来的快速发展,基本已经解决了城市数字本底的构建问题,相当数量的城市及相关委办实现了业务上云,建设了大量的大数据中心,并通过各类摄像头、物联网和穿戴式设备来实现海量数据的大规模、高精度获取。以移动互联网、城市大数据、物联网、穿戴式设备等新技术的平台性整合,形成兼具大规模和高精度的建成环境数据集成,以及与之匹配的高分辨率市民行为与感知数据。随着城市数据时空精度的不断提高,这些海量的新数据能的可视化也揭示了之前难以有效获得的直观图景,为个体层面的行为活动与空间形态现状评估提供坚实的基础。
但城市空间的智能化需求远不止于海量数据的可视化展现,及其所支持的简单现状监测和使用评估。高密度城市空间建设与管理的人性化、品质化需要能高效处理和应对大量复杂而交联的城市问题,而这是通过现状数据可视化所不能解决的。换而言之,智能化算法的应用不能止步于城市空间及市民行为基础数据的获取与清洗层面,而是应该更深入融合到城市规划、设计、治理等领域中来,通过各类深度学习算法的引入,推动可感知、可建模、可分析、可预测、可解释、可决策的智能化变革,有望为这一系列经验主导的行业范式带来的变革可能。
互联网、传感技术和大规模计算基础设施在城市空间中产生了各种各样的动、静态大数据,其中超过80%的数据与时空有关,如空气质量报点读数、天气、出租车移动轨迹、实时路况等。这些数据都至少具有时间或者空间维度,并且可能还有其它属性维度。时空数据按照数据结构可分为点数据、网数据;按照时空信息是否动态变化又分为三类:空间静态、时间静态、时空动态。通过组合可分为六类,其中,空间静态时间动态的点数据:例如传感器大多安装在固定位置,但其产生的读数却随时间不断变化;时间和空间都随时间变化的点数据:两个时空动态点数据之间没有关联,例如在不同时间段滴滴打车的使用记录;空间静态时间动态的点数据:例如路网可以用一个网络来表达,虽然路网是空间静态的数据结构,但在其上叠加动态的交通流量信息,叠加了动态流量信息的管网也就变成了空间静态时间动态的数据结构;事件时空都动态的网络结构数据:整个网络的节点和边都在不断变化。以轨迹数据为例,空间中的人、车、物在不同的时间段经过不同位置,体现出不同的状态,时空点按照时间顺序连接,形成链式结构。
时空大数据意味着对一个城市的丰富知识,如果正确使用,可以帮助解决各类城市化发展以及场景赋能挑战。通过融合基础地理信息数据资源池(2D、3D),感知物联网数据资源池(环境感知数据),维度丰富的时空数据资源池(人、车、物、场),构建统一的地理信息数据、时空数据、业务数据的数据治理框架,以及丰富灵活的时空服务体系框架,能够支撑海量数据和复杂应急应用的高效率对接。
数字孪生的概念模型最早出现于2003年,由Grieves M.W.教授在美国密歇根大学的产品全生命周期管理课程上提出,当时被称作“镜像空间模型”,后被定义为“数字孪生”。2010年,美国国家航空航天局(NASA)在太空技术路线图中首次引入数字孪生概念,用于实现飞行系统的全面诊断和预测功能,以保障在整个系统使用寿命期间实现持续安全地操作。
2019年10月以来,国家发改委、科技部、工信部、自然资源部、住建部等部委密集出台政策文件,有力推动城市信息模型(CIM)及建筑信息模型(BIM)相关技术、产业与应用快速发展,助力数字孪生城市建设。
目前,数字孪生城市建设处于1.0阶段,主要面临以下问题和挑战。一是以城市静态数据为主,而城市场景复杂,城市的状态瞬息万变,如何及时、准确地捕捉可以反映城市动态数据是开展智能城市应用的基础,同样也是一大难题。二是依靠数据直接表达的信息来解决问题,数据背后更深层次的知识有待进一步发掘,城市数据被利用的深度和广度还很不足。三是缺乏人机交互和人机智能融合的可视分析能力,通过展现端对物理世界的反控能力更是不足,城市的展现和感知没有形成闭环。四是以还原真实城市为主,无法通过应用智能模型前瞻性地创造出未来场景,以帮助使用者看到明天的城市问题并据此引导今天的发展路径。五是以政府为主进行建设,没有形成开放生态圈,导致可持续性较差。
人工智能是新一轮科技革命和产业变革的重要驱动力,其战略重要性已成为全球普遍共识。以2015年国务院正式把人工智能纳入“互联网+”的重点任务之一作为起点,我国对人工智能的重视程度持续增加,其发展至今大致可分为四个阶段。
其中,具有标志意义的是第二阶段,2017年的政府工作报告第一次写入“人工智能”,人工智能正式上升为国家战略。同年国务院发布《新一代人工智能发展规划》的中明确提出“三步走”的战略目标:2025年,新一代人工智能在智能制造、智能医疗、智慧城市、智能农业、国防建设等领域得到广泛应用。第三阶段,即人工智能开始和实体经济深度融合落地。第四阶段于2020年开启,人工智能被纳入“新基建”政策,成为新技术基础设施的主要支撑技术之一,将肩负起更重要的角色,去推动万亿实体经济产业数字转型、智能升级和融合创新。国家政策支持人工智能走向“泛在智能“,即人工智能技术将广泛渗入新型基础设施建设,其本质不仅仅指向人工智能自身的产业化发展,更是在实体经济中寻找应用场景,赋能生产力升级。
人工智能于1956年在达特茅斯会议上被首次提出,发展至今普遍认为,人工智能分为计算智能、感知智能和认知智能三个层次。计算智能即快速计算和海量存储能力;感知智能即让机器具有“能听、会说、会看”的能力,对具象事物能够识别与判断,其发展得益于以卷积神经网络(Convolutional Nerul Network, CNN)、循环神经网络(Recurrent Nerul Network, RNN)等为代表的深度学习模型的迅猛发展,但深度学习难以有效利用先验知识,其不透明性、不可解释性已成为制约人工智能发展的障碍;认知智能则为理解与解释能力,旨在让机器能读懂语义、逻辑推理和学习判断。因此,认知智能的实现需要以知识为驱动力,这涉及到知识表示、语义理解、联想推理、智能问答、情感计算、决策规划等关键技术。
当前人工智能的发展仍然处于弱人工智能的状态,研究重心正经历由感知智能向认知智能的过渡。以视听觉等识别技术为目标的感知智能突破了工业化红线,但还只能在某一方面的人类工作上协助或替代人类。当人们能使用机器识别更多事物,自然而然地引发了对事物的理解和分析等深层次的自动化知识服务的需求,而需要外部知识、逻辑推理或者领域迁移的认知智能领域还处于初级阶段。
知识图谱(Knowledge Graph)的概念最初由谷歌于 2012 年正式提出,主要用来支撑下一代搜索和在线广告业务。知识图谱本质上是基于语义网络(semantic network)的知识库,旨在描述客观世界的概念、实体、事件及其之间的关系。知识图谱是符号主义研究范式在大数据和人工智能时代的演变和发展,它以知识为处理对象,通过模拟人脑的知识认知、问题解决、知识问答、知识推理等功能,增强机器的认知能力、学习能力、推理能力。其发展与语义网密不可分,相比于传统的语义网,知识图谱的优势在于:(1)语义表达能力更加丰富,能够支持更多场景下的应用;(2)可以很好地结合人工智能技术,实现认知智能、可解释人工智能;(3)基于图结构的数据,便于知识的存储和集成。
认知智能是一种能够实实在在落地、有着广泛且多样的应用需求、能够产生巨大社会经济价值的人工智能技术。而知识图谱作为认知智能的底层支撑,将加速人工智能从“感知智能”向“认知智能”的进阶,在电商、社交、物流、金融、医疗、司法、制造等众多领域已越来越多地涌现出知识图谱赋能人工智能的案例。知识图谱提供了全新的视角和机遇,并带来新科技、产业和社会新纪元—认知时代的黎明。
人工智能的发展已经渗入到地理空间智能、城市空间智能、时空大数据智能、数字孪生的城市发展有关的应用领域。我们看到这些领域无论在理论方面、还是技术创新和应用实践方面,一个核心的底层创新是基于时空的人工智能:时空人工智能(Spatio-Temporal AI)。随着城市数字孪生的发展,时空人工智能(ST-AI)开始受到产学研的广泛重视,为此我们组织行业专家首次发布这本白皮书“时空人工智能赋能数字孪生城市(2021)”。本书的发布旨在推动AI技术与城市数字孪生的场景结合,通过场景应用推动技术升级,通过技术创新赋能城市数字化转型。
(1) 城市应用场景挖掘不足,缺乏对业务逻辑的深层理解
很大一部分数字孪生产品脱离应用场景和实际业务需求,盲目跟风,缺乏对业务逻辑的深层理解,忽视对城市运行治理的有效支撑。城市规划、建筑管理等行业性孪生应用多,基于数字孪生的城市治理、服务等应用普遍深度不足。由于城市级异构大数据汇集和跨行业跨域应用还处于初级阶段,各专业、各行业领域的算法模型成熟度不高、尚待沉淀。且市场缺乏规范的建设指引,具有长期考量、实现体系化布局、面向深度应用需求的建设方案还比较少。
(2) 缺乏统一时空智能平台规范,数字底座亟待整合
数字孪生城市源于“一张图的GIS、BIM、CIM实践,但高于条线“一张图”建设。城市管理部门对城市数字底图都有强烈需求,如住房与城乡建设系统推进的城市信息模型平台,自然资源与国土规划主导的时空大数据平台,公安政法条线依托进行城市安全和综合治理的城市底图等。每个底图自成体系,一般仅支撑本系统内应用,无法随需、随时支撑其他部门调用。长期以来智慧城市条线强协同弱,没有明确牵头部门,即使有些地方成立了大数据局,但协调统筹力度仍然不足,多张底图如何整合形成城市级统一的数字底图和数据资产,是数字孪生城市建设首先要面对的问题。
(3) 时空数据孤岛欠缺关联融合,数据价值远未释放
数字孪生城市的核心在于构建一个统一的时空智能底座,但目前尚未形成可兼容异构信息的统一标准的时空数据底层框架,机构和厂商各自推进,难以确保统一编码、多模态数据的精准融合表达。且城市矢量时空、政府业务数据、物联网、栅格数据、模型数据、点云数据多源数据的融合处理存在一定困难,格式间存在壁垒。数据孤岛虽然一直都受到人们的重视,却一直未能解决。各部门业务系统数据格式不统一、数据权限不明确、数据对接机制不健全,都将制约数字孪生城市作用的发挥。
(4) 算法模型与动态数据融合不深,快速分析与辅助决策能力不足
当前数字孪生城市涉及的新型测绘、标识感知、协同计算、全要素表达、可视化、数字空间模拟仿真、态势预测等价值远未释放,关键技术自身发展和融合应用还有待加强。海量数据加载技术、云边计算协同技术、模拟仿真技术等成熟度不高;利用人工智能尤其是时空人工智能、边缘计算对动态数据快速分析处理能力不足。
(5) 投资运营机制不明确,尚未形成开放产业生态圈
从建筑部件到地块、到各种专业单元,最终汇聚到城市,形成了城市运营活数据的层层汇聚,用于评估城市的“实体”建设基因和“虚拟”运行绩效之间是否有相关性。例如,一个运行绩效良好的科技园区如何依赖于土地混合程度、绿化水平、路网可达性、住房租金、或咖啡厅密度等方面的支撑。建立有效的运行绩效和建设基因之间的关联机制,赋能普通老百姓和利益相关方,助力他们更便捷而理性地参与到城市建设或城市运营管理中,如何通过建立起市民、专家以及政府之间实时有效的沟通互动渠道是需要各地实践的。
(1) 细粒度的城市智慧场景服务
因制宜做好数字孪生城市顶层设计,要将数字孪生城市与城市治理现代化场景、业务需求紧密结合,同时考虑城市未来发展规律和信息技术演进方向,推进数字孪生城市落地应用。在“泛在智能”的背景下,借助人工智能技术,将数字孪生城市的建设与经济、生活、治理等应用场景紧密结合,推动实体经济产业数字化转型,做到真正为城市智慧场景服务。
(2) 业务需求为导向的统一时空智能底座建设
随着数字经济新技术、新应用、新场景的发展,跨地域、跨行业、跨业务的数据共享需求与日俱增,数字孪生城市建设亟待制定统一的规则框架、法律法规及基础平台。遵循目标导向与需求导向相结合的原则统筹规划,充分考虑城市未来的发展规律和信息技术的演进方向,统一共性需求,协同推进时空智能底座的建设。建立基于统一底座的数字孪生应用体系,针对现有条线系统的城市底图和数据资源进行评估,遵循统一标准构建技术先进、数据完整、拓展性强的时空智能平台,并逐步推动应用场景的丰富和系统的迭代发展。
(3) 多源异构时空数据的融合与数据资产管理
要解决数字孪生城市各层级、各系统之间的数据融合、信息共享和业务协同机制,重点是解决各系统之间的衔接配合与关联约束关系问题,用系统科学的方法指导智慧城市的复杂巨系统规划设计,提高顶层设计的科学性、规范性和可操作性。加快完善多元异构数据融合处理标准规范,将矢量、栅格 网格、模型、点云、政务、感知等各类数据统一格式、编码,形成全周期的数据标准规范,借力知识图谱在数据融合方面的优势,构建多源异构数据的融合处理能力。
(4) 基于高效算法模型的时空数据深度挖掘与分析
在提供对城市多源数据的常规通用空间分析能力基础上,结合人工智能技术构建具备机器学习、深度学习和知识图谱等算法模型的深度空间分析能力,利用分类、聚类、回归、深度学习等监督与非监督的学习方法,实现信息的分类、挖掘与预测等。将不同类别的分析能力按特定的应用场景进行建模,组成面向特定专题的空间分析能力,如面向园区规划相关的园区产业定位分析与动态评估,面向商业选址的可行性分析与销量预测,面向交通领域的智能调度与出行规划等等。提供实时在线分析建模能力,能够构建空间数据的分析管道,以有向无环图形式组织数据和算法模型,按照策略进行分析过程的调度执行。
(5) 多方利益者共建的产业生态全方位共享合作
城市全域数字孪生化和全域智能化不可能一蹴而就,需要构建共建共治共享的城市数字化转型新模式来提供持续动能。数字孪生城市2.0的落地离不开具有全栈时空人工智能的技术平台公司的支持,但是单靠一家公司远远不够,需要依托相关的技术联盟聚拢相关企业及具有优势学科的高校与科研院所来共同完成。要建立创新生态,使得政府与数字城市相关领域的企事业单位、高校、科研机构联合起来,组成跨行业、开放性的联合会。负责数字孪生城市理论、标准、解决方案等公共性问题的研究,在上下游产业建立有效运行的产学研合作新机制,形成数字孪生的标准和质量。负责各数字孪生应用场景的方案编制,组织应用场景示范,支撑未来数字孪生城市的建设和发展。