数据可视化 -- 入门(draft version)

Data visualization的技术在国外正如火如荼的发展, 比如 TableauDomo 他们旨在为公司提供更好的数据分析服务,让公司做出更好的决策(Business Intelligence). 在国内也不少公司正在向这一方向的服务发展。到底什么是data visualization,为什么我们需要数据可视化呢?


什么是可视化(visualization)

Webster 字典中visualization的定义如下。

Vi.su.al.i.za.tion [1]

1.Formation of mental visual images

2.The act or process of interpreting in visual terms or of putting into visible form.

简单的说我们可以把可视化理解成是一个:将抽象的科学或者商业数据.用图像表示出来.帮助理解数据的意义的过程。它通常会在进行数据分析(data analysis)的过程中大量的 使用。


为什么要进行数据可视化


数据可视化(data visualization)例子:


Gapminder : Hans Rosling 在Ted talk 上面就利用了data visualization的技术


统计的作用是用于理解数据,常规的统计学方法能够帮助我们得到一些数据的核心信息。很多时候我们根据这些核心信息得到的结论往往是不全面甚至是错误的。 data visualization 能够帮助我们看到数据的整体, 结合核心信息得到更完整的结论。


 数据分析有时候就想瞎子摸象一样,需要有整体的认知才能对数据有很好的认识。单单只是一部分的认知,往往是非常不全面的。



简单的说我们可以把可视化理解成是一个:将抽象的科学或者商业数据.用图像表示出来.帮助理解数据的意义的过程。它通常会在进行数据分析(data analysis)的过程中大量的使用。



Example 1 :



以上是4组数据, 每组数据有两个变量 X 和 Y, 我们用常用的统计算法去评估四组数据的特点

Means(平均值): X = 9 Y = 7.5

Variance(总体方差): X = 11Y = 4.122

Correlation(关联) x-y:  0.816

Linear regression(线性回归方程): Y = 3.0 + 0.5X



咋一看你会觉得,好像所有的数据貌似都是一个特点。一样的平均值,方差,线性回归方程。根据这些参数我们可以下一个结论,这四组数据是一样的。但是,如果我们用简单的data visualization去分析这些数据,得到的结果确实完全不一样的。

图像更容易理解,更有趣,也更容易让人们记住。[3]

视觉,触觉,听觉,嗅觉,味觉。在每天的生活中,我们用这五种感官去了解,外界的信息。五官帮助我们接触的信息的数量是不同的。从图标里面我们可以看到,视觉在每秒能够接触的信息比我余下的四个感官的总和还要多。

很多研究已近表明,在进行理解和学习的任务的时候,图文一起能够帮助读者更好的了解所要学习的内容[2]。



preattentive feature:

https://eagereyes.org/seminal-papers/treisman-preattentive-processing#more-8679


Reference

[1 ]http://www.merriam-webster.com/dictionary/visualization

[2] Hockley, W.E. The picture superiority effect in associative recognition. Memory and Cognition 36 (2009), 1351-1359.

[3]http://dataviscourse.net/2015/assets/slides/01-Introduction.pdf

你可能感兴趣的:(数据可视化 -- 入门(draft version))