1. 关键技术
时空大数据应用,涉及采集、接入、存储、管理、分析诸多流程环节,每个流程环节又有众多技术路线及其实现框架可供选择。这些技术和框架叠加与融合,即构成了时空大数据技术体系,支撑时空大数据的多类型应用。
(1)数据接入层主要作为数据入口,负责时空大数据的接入与缓存,并供下游系统消费;
(2)数据存储和管理平台负责时空大数据的存储,并组织相应的索引接口,按访问模式可分为分布式文件系统型和非关系型数据库型两类:分布式文件系统型主要用于面向大规模数据量的聚合分析场景,而非关系型数据库型主要用于各类数据精确查询;
(3)数据处理与分析平台除了提供基本查询访问接口之外,进一步提供高性能分析方法,根据数据存在形式和应用场景,分为面向批处理的离线数据分析和面向流处理的实时流计算;
(4)应用层则根据需要,直接调用查询/处理层的访问接口与计算分析操作,或者通过二次开发来组合相关方法,以支持时空大数据的高阶应用。
1.1 时空大数据
日常生活中带有时间与位置标签的数据十分常见,人类生活中所产生的数据约有80%和时空位置有关。2011年,麦肯锡环球研究院Manyika等发布了报告“Big data: The next frontier for innovation, competition, and productivity”,报告提出医疗保健、零售、公共领域、制造业和个人位置这五大类数据组成了当前主要的大数据流,而这些数据都具有显著的地理编码和时间标签。
1.1.1 时空大数据特征
随着互联网、物联网和云计算的高速发展,数据获取手段向多元化方向发展,数据种类不断多样化,促使时空相关的数据呈现“爆炸式”的增长趋势,时空信息与大数据的融合标志着我们正式进入了时空大数据时代。时空大数据公认具备“4V”特征:规模性(Volume)、多样性(Variety)、高速性(Velocity)和有价值(Value)。此外,还具备对象/事件的丰富语义特征和时空维度动态关联特性,具体包括以下四点:
(1)时空大数据的要素包括对象、过程、事件等,且这些要素在空间、时间、语义等方面具有关联约束关系;
(2)时空大数据在空间和时间上具有动态演化特性,这些基于时空大数据要素的时空变化是可被度量的;
(3)时空大数据具有尺度特性,根据比例尺大小、采样粒度以及数据单元划分的详细程度可以建立时空大数据的多尺度表达与分析模型。
1.1.2 时空大数据分类
时空大数据从感知对象角度可以分为感知地理环境的时空大数据和感知人类社会活动的时空大数据。随着对地观测技术的发展,各类遥感数据成指数级增长并逐步积累,成为一类典型的时空大数据,即“遥感大数据”。随着互联网技术、社交媒体平台的不断发展和进步,人类活动每时每刻都会产生大量的时空数据,具有位置坐标和时间标签,具体包括移动轨迹数据、社交媒体数据、购物订单数据、手机信令数据等。这些数据记录着人类的日常生活,蕴含着人类活动的潜在规律,且它们正以前所未有的速度和规模增长和累积,亟待被合理、高效、充分地挖掘应用。
1.1.3 时空大数据管理
时空数据的高效管理是时空大数据实时、全面、系统地分析和计算的基础。时空数据具有非结构化特征,数据项不定,数据长度变长,记录甚至是嵌套的,因此时空大数据高效管理方案一方面需要有效组织大规模的时空数据,另一方面需要支持表结构组织管理非结构化数据。
时空大数据管理的关键技术包括时空索引和编码、适应时空非均衡数据的负载均衡、高效查询检索、管理平台技术等。
时空大数据综合管理平台是在数据管理平台和时空数据存储方案的基础上,结合时空大数据环境高效存取、多维索引的特点构建。大多数时空数据存储管理解决方案基于文件级管理平台和数据库级管理平台设计。
1.1.4 时空大数据分析
时空大数据分析就是在时空大数据中应用各种分析和挖掘模型,发现地理数据中潜在的、有价值的时空模式、关联关系及其随时间的演变趋势,对于理解复杂的地理学规律具有重要的科学价值。目前主要的时空大数据分析方法分为4类,包括时空聚类分析、时空异常分析、时空关联分析与时空预测分析。
(1) 时空聚类分析
时空聚类分析旨在发现地理空间中各类实体的时空分布格局与规律,对于揭示地理实体或地理现象的本质特征、相互依赖关系和演化趋势具有重要的指导意义。据聚类方法是否顾及非空间专题属性,可以将当前时空聚类分析方法分为二大类:时空位置聚类和顾及非空间专题属性的时空聚类。
(2) 时空异常分析
时空异常分析旨在从海量时空数据库中挖掘得到偏离整体或局部分布特征的少部分实体,为深入剖析地理现象或地理过程的特殊分布状况、变化或潜在发展规律提供重要的理论依据和实践指导。时空异常分析可视为事务型异常探测在空间域和时空域的扩展与延伸,进一步顾及了时空数据的相关性、异质性、非平稳性等特征。根据位置、时间、属性三者之间的组合关系,时空异常分析大致分为:基于位置的空间异常探测、基于位置-属性的空间异常探测、基于位置—时间的时空轨迹异常探测和基于位置—时间—属性的时空序列异常探测。
(3) 时空关联分析
时空关联分析旨在从时空数据集中识别不同类别地理实体间频繁存在特定时空关联关系(如时空邻近关系)的实体类别集合,对于理解地理实体间的时空交互具有重要的科学意义。其中连续时/空域的离散划分会割裂邻近时空位置上数据间潜在的时空关系,为此,Shekhar等人首次提出了非事务化模型,用于发现连续空间域内频繁同现于邻近空间位置的地理实体集合(称空间同位模式)。目前,相关学者主要在3个方面开展深入研究:空间域向时空域的拓展、欧氏空间向网络空间的拓展和全局模型向局部模型的拓展。
(4) 时空预测分析
时空预测是通过构建反映时空变量间关系的模型对地理事件或现象未知的空间属性值或专题属性值进行估计。依据分析理论的差异可将时空预测模型分为时空统计模型与机器学习模型。其中,时空统计模型通过统计推断来刻画变量间的关系,如处理(时)空间依赖性的地统计学模型、时空自回归移动平均模型等,以及表达(时)空间非平稳性的地理加权回归、地理时空加权回归模型等。与时空统计模型相比,机器学习模型能够自适应地对任何复杂非线性关系进行建模,近年来被广泛地应用于时空预测分析中。如向量机、决策树、神经网络、深度神经网络等。
1.2 时空大数据计算
时空大数据计算就是在时空大数据采集、接入、存储、管理、分析等各个流程环节中,处理时空大数据的计算方法、技术选型、实现框架、性能分析等的总称。这些计算,有些是为了实现时空大数据的数据整理、准备和流式赐服,有些是为了计算结果的规整合并和可视化,有些算法是为了计算加速,有些是基于流式时空数据的机器学习模型训练、校验和应用。
1.2.1 基于格网空间化的时空大数据计算框架
时空大数据计算一般基于地理坐标系的球面网格或基于多面体剖分的球面网格进行时空剖分,使用支持动态调整的平衡树索引或基于静态空间划分的哈希索引对海量时空数据建立索引,并结合索引与数据特性和管理平台特性设计时空数据编码方案,以优化时空范围查询和时空最近邻查询等时空查询算法。
在格网剖分的框架下,任何时空数据的属性都空间化到每个格网,进而构建了结构化时空数据阵列。遥感图像就是天然的数据格网化数据,非常容易构架机器学习的框架。
1.2.2 时空大数据的分布式计算
时空大数据因其数量大、类型多的特点及存储模式的变化,使得传统的集中式时空分析平台以及串行算法存在很大的局限性,难以满足实际应用的规模与高效需求。分布式并行技术充分利用和发挥集群构架资源的优势,将计算分析任务分解成若干子任务,分发到计算机集群中进行处理,大大提高了计算吞吐量和计算效率。传统的时空分析算法大多为集中式单机算法,通过对其进行分布式并行扩展,即可利用计算机集群完成对时空大数据的高性能计算分析任务。
时空大数据计算一般基于分布式计算平台,利用MapReduce、DAG计算模型、数据分区负载均衡以及分布式索引等关键技术,提高时空大数据分析的计算效率。分布式时空大数据分析的实现主要包含四个步骤:基于时空邻近性的数据分区与负载均衡;分布式两级时空索引的构建;高效空间关系计算库的实现;SQL语言时空谓词的扩展。
1.2.3 时空数据流式计算
时空数据流实时产生,具有较高的时效性价值,在物流配送、车客匹配、指标监控等方面具有广阔的应用场景。不同于静态时空数据的处理,时空数据流具有逐步到达、乱序、时空分布不均、未来状况难以预测等特点。时空数据流的计算需要状态、时间窗口、容错等一系列技术的支持。
实时时空计算一般运用现有分布式流处理引擎对时空数据流进行高效处理,以充分利用时空数据流的时效价值。实时时空计算是目前的技术前沿,已经有一些原生的流数据处理引擎,在事件驱动应用、ETL等方面已经有了广泛的应用,并证明了其具有低延迟、高吞吐、处理准确等优势,能够作为当下流式计算的行业标准。但是,无论是在学术界还是工业界,流处理引擎的时空扩展仍然较未成熟。
1.3 时空知识图谱
时空知识图谱不单单是一个“增强型”的开放域知识图谱,而是需要结合业务场景和领域知识,并针对时空知识自身的特点,对知识的概念、实体和关系进行语义化和时空化拓展。时空知识图谱除了描述语义关系外,还需要考虑空间关系和时间关系的描述,如何建立时空关系和语义关系的映射,是时空知识图谱构建的关键问题。
时空知识图谱的构建遵循时空知识抽取、时空知识融合与关联、时空知识推理与计算、时空知识场景应用的基本流程。从海量结构化、半结构化和非结构化时空数据中进行实体、关系和属性的信息提取,通过实体对齐和指代消解实现对时空数据的知识融合并将知识存储到知识库中,最后进行进一步的知识推理、计算和图谱应用。
1.3.1 时空知识抽取
时空知识抽取是构建大规模时空知识图谱的重要环节,其目的在于从多源异构时空数据中自动抽取出实体、关系及属性等知识要素,并将其组织成三元组形式存入知识图谱中。时空数据按存储类型可分为结构化、半结构化和非结构化数据。面向不同类型的数据源,知识抽取涉及的关键技术有所不同。针对结构化数据(如地图、地名库等),通过建立数据库中概念与知识图谱中本体的映射关系以及基于规则的推理,从数据库中自动抽取空间实体、属性及其关系;针对半结构化数据(如网站的表格、列表型数据),可建立相应的模板抽取器实现知识抽取;针对非结构化数据(如网页文本或其他文本信息、微信、微博、图片等数据),主要利用已有的知识图谱知识,通过远程监督的方式来构建训练集,并利用深度学习的方法学习出抽取器,进而进行知识抽取。
由于爆发式增长的网络文本蕴含丰富的时空语义信息以及自然语言处理技术的迅速发展,网络文本的时空知识抽取成为关注重点之一。深度学习对语料库的依赖性明显低于其他机器学习方法,能够在深层结构上自动学习上下文特征,在地理实体、时间信息、空间信息、属性抽取和关系抽取等方面从海量文本中获得较好的知识抽取性能并及时更新时空知识,成为构建动态的时空知识图谱的重要途径。时空数据也常包含大量地图、图像、轨迹等异构数据,因此在进行知识获取时,需要对数据进行进一步解析和转换,理解地图符号的时空意义、识别各类时间、空间以及时间-空间关系等。
1.3.2 时空知识融合与关联
多政务数据、时空基础数据、网络数据、领域数据等海量时空知识的来源渠道众多,实现对时空数据的高效融合和关联,对充分挖掘数据价值、降低时空大数据应用系统的建设成本、提高空间数据的使用效率具有重要的现实意义。
不同数据来源的时空知识描述存在一定的互补性和差异性,如分类体系不统一、地理空间实体歧义、特征描述详略不同、实体关系冲突等信息冗余和不一致问题。知识融合是将不同数据中不同标识实体的语义理解,关联到同一实体上,实现对同名、多名和缩写等多种实体语义的消歧和共指消解,是解决知识图谱异构问题的有效途径。时空知识的融合包括模式层(即概念层)和实体层的融合。模式层的融合主要是基于地理空间本体库的地理本体知识扩展,进行新旧本体的融合;实体层的融合包括实体的指称、属性、关系以及所属类别等,主要避免实例以及关系的冲突问题,造成不必要的冗余,主要用到实体链接技术。除此之外,基于逻辑推理和知识发现等技术,用时空数据产生过程中所反映出的用户行为、状态和偏好等语义信息来丰富单纯的地理空间信息,即进行语义标签化扩充;反之,也可对外部单纯的语义信息予以时空关联。
1.3.3 时空知识推理与计算
知识推理是指基于已知的事实或知识推断得出未知的事实或知识的过程。在知识图谱中,推理主要用于对知识图谱进行补全和知识图谱质量的校验。时空知识图谱除具备知识图谱常用的本体推理、规则推理以及常识推理能力外,还具备时态推理和空间推理能力。时态推理能够对目标查询辅以时间约束,使得推理结果符合时间需求,即可以看作是约束满足问题,其中变量表示时态对象,变量之间的约束对应于对象间的时态关系。与时态推理类似,空间推理过程产生多种空间对象及对象嵌入空间属性的理解,空间推理包含多种空间关系的推理,如拓扑、方向、距离等。
图数据中蕴涵着丰富的结构信息,这本质上对应着数据因内在关联而产生的一种非线性结构。表示学习是将图的拓扑结构、节点属性、节点标签特征经过神经网络非线性映射,在深层可以提取到更高层次的特征表示。主要目标是将图数据转化成低维稠密的向量化表示方式,同时确保图数据的某些性质在向量空间中也能够得到对应。图表示学习从方法上来说,可以分为基于分解的方法、基于随机游走的方法,以及基于深度学习的方法,而基于深度学习的方法的典型代表就是图神经网络(GNN)相关算法。一种图数据的表示如果能够包含丰富的语义信息,那么下游的相关计算任务如节点分类 、链接预测 、社区计算、相似子图计算等,就都能得到相当优秀的输入特征。主要计算任务包括:
节点分类 ——预测一个没有标签的给定节点的类型。
链接预测 ——通过一个已知的实体和关系预测另一个实体,或通过两个实体预测关系。
社区计算——识别密集连接的节点群,用来发现网络中的社区结构。
相似子图计算——计算两个子网络的相似性,图融合可以被认为是基于知识相似度的计算任务。
1.3.4 基于场景智能的预构建场景图谱库
(1) 城市图谱[ws1]
随着物联网、云计算、大数据等技术的发展,智慧城市建设从感知智能到认知智能逐步提升。5G技术的应用将加快提升城市的感知能力,数据采集更快、更多、更全。数据包含了文字、图像、音视频等多模态,要把这些数据用好,需要把这些数据组织成大型的知识库,并将其作为智慧城市的基础资源。
由于知识图谱以资源描述框架(resource description framework,RDF)的形式对知识体系和实例数据进行统一表示,并可以通过对齐、匹配等操作对异构数据进行集成和融合,在语义搜索、问答系统、智能客服、个性化推荐等应用中占有重要地位。知识图谱技术在商业智能、智慧医疗、智慧司法等智慧城市各领域中具有广阔的应用前景。
城市的智慧教育、智慧医疗、智慧民生等都是围绕着自然人的数据开展的,因此智慧城市知识图谱建设的核心问题是构建以城市自然人为核心的本体,同时构建民生、教育、医疗等领域的子本体,形成多领域多模态的知识图谱结构,实现智慧城市知识图谱的应用生态。
理想的智慧城市模型应该是现实中运行着一个城市,网络上运行着一个对应的数字城市。现实城市运行中产生的各种数据,都能实时映射到数字城市,即数字孪生。而数字城市通过人工智能的模型算法,及时反馈优化现实城市的运行。目前不少城市已经把数据抽取到城市大数据中心,也实现了局部智慧,但数据结构设计仍模拟现实城市。
通过城市里面的实体构建城市的知识图谱,并且在图谱中描述关系方向、强度、时序等信息。智慧城市知识图谱和一般的智慧城市大数据中心的区别在于以下3点:
以人为本的设计思路,让智慧城市更好地围绕为人服务展开。一般的大数据中心把自然人信息、法人信息、地理信息、经济运行信息等都放在一个层面上,没有形成以人为核心的数据架构。
数据不与具体业务挂钩,而是在对城市大数据进行属性分类、关系分析之后提取更高层面的知识库,利于真正的数据共享。
结合图数据库技术及语义网描述体系、标准和工具,便于计算机系统对大规模知识系统进行存储与检索计算,便于人工智能模型之间的有机结合,特别是在语义搜索、智能客服、问答系统等方面的应用。
(2) 园区图谱
制定合理的园区发展政策,并能对招商效果、企业流失趋势、政策实施效果等进行分析预判以及时调整政策,对园区持续运营和抢占高地有重要意义。而单凭数据分析无法实现对未来的评估和预测,时空人工智能技术为此提供了实现的契机。提供园区交流分析、园区相似度查询与关系发现、与标杆园区的对比分析等交互式图谱分析。运用多源时空数据挖掘与基于人工智能的时空图谱技术,实现园区整个生命周期的动态化管理(图3-4)。
目标园区基础信息查询:对相关信息根据所在地区、产业类型等指标进行查询;展示包括园区企业、常住人口、就业人口、客流情况、内外交流情况、职住平衡指数、交通便利性、周边配套设施、龙头企业、产业等信息。
产业关联分析:提供细分产业标签的上下游关系分析服务,为产业的强链、补链、增链、延链提供依据。
企业画像:融合政府数据,帮助政府构建企业法人库及企业关系图谱,为各职能部门对企业及法人的监管提供信息支撑。
园区招商引资:根据园区产业结构,产业链全景,及企业自身发展风险情况,提供多种场景、组合条件的企业筛选,对接园区发展需求,选取最适合园区产业发展方向和趋势的企业。
园区定位规划:对尚无产业规划的园区进行产业规划推荐,对已有产业规划的园区进行产业补全建议。
园区动态评估:依据产城一体、产业聚集、合作共赢等第四代产业园区发展方向建立可测度、动态可更新的园区评价体系。对园区从创新力、健康力、竞争力、影响力和发展力等各种维度进行综合评估,帮助园区运营者和政府管理者清晰了解园区整体企业现状。
园区对比归因:园区在发展过程中需不断提高核心竞争力,标杆管理是通过对标优秀园区来提升园区竞争地位有效管理方法。找出与标杆园区的差距,学习其成功经验,可以有效避免发展中的一些陷阱。如何收集标杆园区数据,快速建模与自身园区进行对比,找到两者的关键差异形成可操作方案,仍是难题。基于知识图谱,利用图表示学习算法和相似子图计算,计算自身园区与头部园区间的图谱相似度,自动高亮最大差异点,即潜在优化点。
园区优化建议:针对最大差异点进行相应优化建议的智能推荐,并实时计算采纳该优化建议后的园区综合得分。
编辑切换为居中
图 3 园区知识图谱
编辑切换为居中
图 4 园区知识图谱可视化
(3) 社区图谱
运用时空AI算法,获取互联网等大数据,使用数据融合关联多源多方数据,进行社区知识融合。制定网格价值评估模型、社区智慧图谱,通过网格内用户价值评估结果对网格进行画像。运用时空AI技术构建网格画像分析模型的方法,通过在地图上任意网格或网格组合,实时对该网格区域内居住人口、工作人口、企业、基础设施、公共安全等进行分析推理,形成直观的可视化成果,便于相关方直接获取信息。可以快速分析推理出评价单元的区域内包含人口综合分析、人口流动趋势、社区比较、社会治安等标签的区域画像,可以有效的辅助社区管理人员快速了解社区各区域形势,以便于更合理有效进行民生、治安、资源分配等工作的进行,为社区管理人员及社区服务人员提供便利,更好的为民众服务。
(4) 人群图谱[ws2]
人群图谱指面向人群的画像标签体系,基于一定的指标输出多维度的数据计算结果。并结合基于人群活动、移动轨迹、活跃场所、工作、居住以及车辆状况等线下应用场景,产出各类标签、人群分类等内容应用于用户群体识别和用户分组,利用签到数据建立用户图谱,同时结合用户位置推断用户属性的框架,该框架从用户签到数据中抽取单个用户的空间、时间和位置知识,并利用时空人工智能引擎方法生成用户对签到位置的偏好,进而推断用户属性。
画像标签采用专业的时空人工智能算法,对出行数据的收集及处理处理,结合先进的自动化数据技术,再对数据进行智能清洗,结合人与地理位置的相关性数据,通过人与地理位置的结合、变化、频次等状态,实现人群标签的划分以及线下场景的捕捉,综合采用聚类算法、行为识别算法以及预测算法等对数据进行建模分析,深度学习用户行为特征,描绘用户画像,从数据统计到知识计算,构成人群图谱。
(5) 门店图谱
面向线下各种零售场景,进行了精准推荐技术的相关研究,主要包括以下部分:第一,构建商品知识图谱并设计用户画像标签体系,通过购买的商品组合给目标用户打上人群标签,基于人群标签产生推荐结果。第二,分析目标用户与购买过商品的用户的购物行为相似性,求出满足设定阈值的相似用户集合,并将集合中的相似用户购买的商品作为用户喜好,计算目标用户对候选特定商品的兴趣度,生成推荐结果。
(6) 商品图谱
随着电子商务在全球市场不断进行开拓,其中商品知识图谱承担了重要的角色,被广泛应用于平台治理、品牌运营、前端导购等核心业务。由于电商领域存在商品类型繁多、属性体系庞大等特性,商品知识图谱与通用知识图谱存在一定的差异。因此,本文主要研究基于商品属性的商品图谱构建,以及不同语言的商品图谱进行对齐与融合。
基于属性的商品图谱主要描述了商品的属性及属性值信息。采用基于规则的方法,设计领域相关的词汇表来提取商品的属性信息,基于属性增强的属性值抽取模型,不仅将属性视作标签类型,同时建模其语义信息,从而能够处理上万级别的属性,甚至是模型从未见过的新属性。商品知识图谱根据商品的详细信息和开放式的行业信息,利用图谱的方式存储商品信息,从而应用于商品管理、商品推荐等商务活动。由于商品知识图谱的应用场景众多,因此商品知识图谱还被细分为概念知识图谱、过程知识图谱、专家知识图谱和整体框架知识图谱等,不同商品图谱的构建重点和方式有所不同。在电商平台的日常经营中,描述商品属性信息的商品知识图谱在导购、推荐等活动中发挥了重要作用。此类商品图谱包含了商品的详细属性信息,由【商品实体,属性,属性值】三元组构成。
1.4 时空信息可视化
时空信息可视化就是将时空关联的信息通过计算机可视化手段展示出来,是信息化时代人类洞察时空过程内涵和规律的重要手段和高效人机界面,也是数据分析、数据挖掘等方法的有效补充,甚至在一些重要场合起到不可替代的作用。时空信息可视化的典型的例子有:空气污染传感器数据可视分析、出租车轨迹数据可视查询、多变量统计数据分布的定量可视分析、城市多维信息可视分析、国家气象局三维大气可视分析等。数字孪生城市的基础是城市时空信息的实时可视化,多粒度真实还原城市的大小部件机器运行状态,并提供在虚拟环境中操控真实城市的界面。
编辑切换为居中
图 5
以往对于数据在图形上表现只是停留在饼图、柱状图和折线图等简单的视觉表现形式上,为了更有效地传达数据信息,帮助用户理解,依附于目前多媒体的科技手段,可视化的表现形式从平面到三维,媒介形式从纸张到网络以及视频、虚拟环境,在互动性及时效性上都不断地发生着变化,智慧城市的建设中3D技术与AI、VR技术的深度结合,让人类产生全新的交互体验。
1.4.1 描述型可视化
描述型可视化即人们通过观察图表直接接收图表所表达的规律价值信息,该可视化类型特点是不需要进行操作,仅仅通过直观视觉接收信息。依托于如今的高速网络和大数据背景,数据的时效性尤为重要。可视化技术与互联网技术的融合基于Web的便捷性,基于地图形式的可视化方式与GIS、地图等行业的结合具有较好的视觉效果,能够非常直观地展现数据中的群组信息(图6),与地图结合的可视化有散点及聚合可视化、线性可视化、分级设色可视化3种形式。
编辑切换为居中
图 6 基于地图结合的时空数据可视化
1.4.2 挖掘型可视化
可视化技术与数据挖掘是相互驱动的,数据挖掘与数据可视化结合目前有3种方法:一是将可视化技术应用到信息领域,通过数据挖掘从数据库中提取出有用的信息;二是先进行数据的可视化,然后应用到数据挖掘工具中;三是把数据可视化用作补充和完善数据挖掘的一种方法。时空大数据挖掘常用的方法有分类、聚类、关联规则、神经网络、Web数据挖掘、深度学习等,数据挖掘可视化能够深入分析数据中潜在的价值规律为人们所用(图7)。
编辑切换为居中
图 7 面向数据挖掘的时空可视化
1.4.3 交互型可视化
交互过程其实是一系列特定任务的集合,用户根据需求,与可视化界面中的图形元素进行交互式、响应式设计分析,加强用户对数据的控制力,建立起良好的人机关系,包括二维场景中的一些交互操作,还包括三维场景及虚拟现实场景中的一些交互操作,接收用户的交互反馈,并根据反馈生成新的可视化结果,实现查询、检索等需求。随着三维可视化、虚拟现实、3D互联网等技术的不断发展和深入,人们可以利用计算机去处理图形、图像、视频、声音、动画等,产生交互式的三维动画、动态仿真,对真实物理效果的模拟和较强的视觉冲击力加强用户对数据的感知能力(图8)。近年来,交互可视化方面的成果主要分为以下两个方面:一是对时空数据进行动态可视化及可视性分析;二是运用虚拟现实技术对地形环境仿真,进而开展交互和分析。如让用户可基于城市3D模型进行人口管理、交通规划和城市建设等任务的高效智慧化人机交互操作,实现现实与虚拟的完美结合。
编辑切换为居中
图 8 时空信息交互可视化