数据可视化

数据可视化_第1张图片

数据可视化处理可以洞察统计分析无法发现的结构和细节。例如Anscombe的四组数据Anscombe‘s Quartet)。

狭义上:科学可视化、信息可视化、可视分析学

科学可视化

可以分为:标量场可视化、向量场可视化、张量场可视化

标量场可视化:标量场指二维、三维或四维空间中每个采样处都有一个标量值的数据场。标量场的可视化一般采用映射为颜色或透明度、等值线或等值面、直接体绘制等方法。

数据可视化_第2张图片

向量场可视化:与标量场可视化不同的是,向量场可视化以向量为单位进行采样,具有一定的方向性。

数据可视化_第3张图片

张量场可视化:张量是矢量的延伸,标量是0阶张量,而矢量是1阶张量。张量场的可视化方法有3种,即基于纹理、几何和拓扑的可视化方法。

信息可视化

与科学可视化相比,信息可视化更关注抽象且应用层次的可视化问题,一般具有具体问题导向。

根据可视化对象的不同,信息可视化可归为多个方向:

§时空数据可视化

§数据库及数据仓库的可视化

§文本信息的可视化

§多媒体或富媒体数据的可视化

可视分析学

是一门以可视交互为基础,综合运用图形学、数据挖掘和人机交互等技术等多个学科领域的知识,以实现人机协同完成可视化任务为主要目的分析推理性学科。

数据可视化_第4张图片

基本模型

顺序模型

数据可视化_第5张图片循环模型(与顺序模型相比,主要变化体现在:重视信息反馈、突出用户交互、强调任务导向)

数据可视化_第6张图片

分析模型

数据可视化_第7张图片

常用方法

A视觉编码

数据可视化本质是视觉编码

数据可视化_第8张图片

1.图形元素:通常为几何图形元素,如点、线、面、体等,主要用来刻画数据的性质,决定数据所属的类型。

2.视觉通道:图形元素的视觉属性,如位置、长度、面积、形状、方向、色调、亮度和饱和度等。

数据可视化_第9张图片

B统计图表

(1)饼图(Pie Chart)(2等值线(Contour Map)(3散点图(Scatter Diagram)(4维恩图(Venn Diagram)(5热地图(Heat Map6)箱线(Box-plot)图(7雷达图(Radar Chart)

C图论方法

数据可视化_第10张图片

社会网络中的齐美尔连带

D视觉隐喻

(1)直接在现实图像上进行视觉隐喻

数据可视化_第11张图片

美国政府的机构设置

(2)对现实事物,甚至是虚拟事物(如龙等)进行了一定的抽象处理之后,再进行视觉隐喻。比较有典型的是鱼刺图和树型结构图。

数据可视化_第12张图片数据可视化_第13张图片

E图形符号学

§图形符号:点、线、面

§位置变量:二维平面上的位置;

§视网膜变量:尺寸、数值、纹理、颜色、方向和形状。

F面向领域的方法

数据可视化技术的发展呈现出了高度专业化趋势,很多应用领域已出现了自己独特的数据可视化方法,1931年,一位名叫Henry Beck的机械制图员借鉴电路图的制图方法设计出了伦敦地铁线路图。

数据可视化_第14张图片

视觉编码

视觉编码的关键在于找到符合目标用户群的视觉感知习惯的表达方法,同一个数据的可视化编码结果可能有多种,但对目标用户群中产生的视觉感知可能不同。

A视觉感知

1)视觉感知是指客观事物通过视觉感觉器官(眼睛等)在人脑中产生直接反映的过程。

2)视觉认知是指个体对视觉感知信息的进一步加工处理过程,包括视觉信息的抽取、转换、存储、简化、合并、理解和决策等加工活动。

完图法则(又称Gestalt法则)较好地解释了人类视觉感知和认知过程一项重要特征:人类的视觉感知活动往往倾向于将被感知对象当作一个整体去认知,并理解为与自己经验相关的、简单的、相连的、对称的或有序的以及基于直觉的完整结构。因此,视觉感知结果往往不等同于感知对象的各部分的独立感知结果之和。

数据可视化_第15张图片数据可视化_第16张图片

B数据类型

从可视化处理视角看,我们可以将数据分为4个类型:定类、定序、区间型和比值型,并采用不同的视觉映射方法

数据可视化_第17张图片

C视觉通道

数据类型与视觉通道的对应关系图

数据可视化_第18张图片

视觉通道的选择与展示

数据可视化_第19张图片

在数据来源和目标用户已定的情况下,不同视觉通道的表现力不同视觉通道的表现力的评价指标包括: 

精确性                                                          可辨认性

数据可视化_第20张图片数据可视化_第21张图片

可分离性                                                     视觉突出性

数据可视化_第22张图片

由于不同视觉通道具有不同的表现力,因此数据的可视化编码过程中应忠于原始数据、目标用户的感知特征以及可视化表示的目的,选择高表现力的可视化图形元素及视觉通道。

一般情况下采用高表现力的视觉通道表示可视化工作要重点刻画的数据或数据的特征。

D视觉假象

1)可视化视图所处的上下文(周边环境)可能导致视觉假象。

数据可视化_第23张图片

2)人们对亮度和颜色的相对判断容易造成视觉假象。

数据可视化_第24张图片

3)目标用户的经历与经验可能导致视觉假象。

测评跳过

应用案例

1.美国Oakland地区犯罪数据的可视化

Stamen Design 工作室的 Michal MigurskiTom CardenEric Rodenbeck曾研发过一种可视化应用,主要以可视化方式显示Oakland地区发生的犯罪事件的统计数据。该应用的原始数据来自CrimeWatch,并进行必要的预处理后存放在自己的数据库之中,并进一步采用数据可视化技术实现了犯罪数据的可视化显示。

数据可视化_第25张图片

1)从实现方法选择看,主要采用了本章介绍的统计图表方法,尤其是基于地图的数据可视化方法,可以通过浏览地图的方式找到对应的统计数据。

(2)从视觉编码角度看,其可视化图形元素及其视觉通道分别为圆圈及其填充颜色。采用不同颜色(及字母)代表了不同类型的犯罪事件,确保了较高的表现力。

(3)从可视化结果看,提供了交互式可视化功能,较好地体现了本章介绍的反馈模型和分析模型的理念,达到了更好的用户体验。用户可以在所示的系统界面中调整可视化参数,如犯罪事件发生的起止时间、犯罪类型、具体发生的时间段等。

(4)从可视化测评角度看,该案例较好地实现了数据可视化的几个基本原则,包括忠于原始数据、目标用户的感知特征、可视化表示的目的以及具备较强的用户体验。但是,由于数据获取困难和系统缺陷的存在,该系统对实时数据的动态可视化功能较弱。

2.采用R语言对车辆重量与油耗之间关系数据进行可视化

 

attach(mtcars)

plot(wt,mpg, main="汽车重量与耗油耗间的关
      系
",   xlab="车重(千磅)",ylab="油耗"
      ,pch=19)

abline(lm(mpg~wt),col="black", lwd=2, lty=1)

lines(lowess(wt,mpg),col="blue",lwd=2,lty=2)

install.packages("car")

library(car)

scatterplot(mpg ~ wt | cyl,

 data=mtcars,
 lwd=2,
 main="散点图",
 xlab="车重(千磅)",
 ylab="油耗(英里/加仑)",
 legend.plot= TRUE,
 id.method="identify",
 labels=row.names(mtcars))

 

 

 

 

 

 

 

 

社会网络方式可视化国际贸易数据

采用社会网络方式可视化国际贸易数据

采用社会网络方式可视化国际贸易数

 

 

 

 

你可能感兴趣的:(数据科学)