Tableau数据可视化(part2:设计原则)

(摘自UDACITY的课程:使用Tableau进行数据可视化 www.udacity.com学习过程 )

Tableau数据可视化(part2:设计原则)_第1张图片
![Uploading image_003053.png . . .]
Tableau数据可视化(part2:设计原则)_第2张图片
Tableau数据可视化(part2:设计原则)_第3张图片
Tableau数据可视化(part2:设计原则)_第4张图片
Tableau数据可视化(part2:设计原则)_第5张图片

Tableau数据可视化(part2:设计原则)_第6张图片
Tableau数据可视化(part2:设计原则)_第7张图片
Tableau数据可视化(part2:设计原则)_第8张图片
Tableau数据可视化(part2:设计原则)_第9张图片

Tableau数据可视化(part2:设计原则)_第10张图片

小提琴图
小提琴图会显示平滑的数据分布图。分布图使用一种叫做核密度估计的方法进行近似估计,你不需要了解该方法,但是该方法很神奇,你可以在 此处了解详情。和箱形图相似,通常也会包含区间,但是也会显示实际数据分布。
小提琴图几乎适合所有情况。它们会展示非正态分布(箱形图则不会)。但是,平滑操作可能会丢失细节,对于少量数据来说,经常会失败。个人而言,我喜欢使用小提琴图而不是箱形图,但是有时候可能需要快速简单的分布图。


如何选择图表

你有一些数据并且知道想要显示什么,但是如何选择最佳图表来讲述故事呢?说实话,掌握这一技能需要练习和经验,但是我将提供一个实用的图表选择流程图。

Tableau数据可视化(part2:设计原则)_第11张图片

Andrew Abela 博士 ( http://extremepresentation.typepad.com/blog/2006/09/choosing_a_good.html) 给出的图表建议

当然,这个流程图并非涵盖所有图表,还有很多其他可视化图表
图表选择示例
当你在探索数据时,首先要做的是查看各种变量的分布情况。根据以上图表,你需要显示单个变量的分布。下面我划分为少量数据点和多个数据点,变成列直方图和线条直方图。

Tableau数据可视化(part2:设计原则)_第12张图片
Tableau数据可视化(part2:设计原则)_第13张图片
Tableau数据可视化(part2:设计原则)_第14张图片

Stephen Few 发表了一篇关于如何选择正确图表的文章。请阅读一下这篇文章,然后我将提出一些问题,使你能够练习选择图表。

(下面2幅图摘自:Eenie, Meenie, Minie, Moe: Selecting the Right Graph for Your Message http://www.perceptualedge.com/articles/ie/the_right_graph.pdf)

Tableau数据可视化(part2:设计原则)_第15张图片

Tableau数据可视化(part2:设计原则)_第16张图片

Tableau数据可视化(part2:设计原则)_第17张图片

Edward Tufte 在《Visual Display of Quantitative Information》中提出了这类图表(并且给出了小小图组这一名称),以便简要地可视化随着时间推移而变化的定量数据。迷你图很简单,旨在强调在很小的显示区域内的数量变化。这种图表变得热门起来,广泛应用于金融领域。你将经常在股票中见到此类图表,用于表示股价随着时间的变化情况。Edward Tufte 和其他人写了一篇关于迷你图的文章,建议阅读一下。

来源:Yahoo Finance。Yahoo Finance 经常使用迷你图。以下网站提供了更多的示例:https://finance.yahoo.com/most-active。

Tableau数据可视化(part2:设计原则)_第18张图片
Tableau数据可视化(part2:设计原则)_第19张图片

数据点是 X 轴上的地毯图。” https://en.wikipedia.org/wiki/Kernel_density_estimation

但是,你依然可以为内核选择参数,例如高斯曲线的带宽。因此,这种方法依然存在任意性,但是与直方图相比,通常效果更好(但是更复杂)。如果你对此类图表感兴趣的话,建议阅读这篇文章(我认为这类图表很酷)。

循环图
循环图用于将周期性数据进行分组。例如,如果有多个星期的数据,最好是将所有数据按一周的某一天分组,这样可以更清晰地查看每周的趋势。
这是关于循环图的简介,作者是 Stephen Few(又是他的成果,他有很多不错的研究成果)。

Tableau数据可视化(part2:设计原则)_第20张图片

Tableau数据可视化(part2:设计原则)_第21张图片
Tableau数据可视化(part2:设计原则)_第22张图片

看到添加颜色后提供了大量额外的信息。我们知道,GDP 越高,预期寿命就越长。但是,通过将各个国家所属的区域用颜色标注,我们可以从此图中看到不同类型的国家在全球的分布情况。GDP 很低的国家几乎都在撒哈拉以南非洲,很高的国家则是欧洲和北美。中间的橘色部分是独立国家联合体,即前苏联国家(如果你觉得该缩写一开始没明白的话,我也没明白)。
颜色是可视化过程中的重要工具,我们必须正确使用颜色,才能产生最大的影响。
调色板
调色板是指用来表示数据值的颜色范围。对于定量和定性数据,你需要使用不同的调色板。选择正确的调色板非常重要。例如,我们来看一个使用非常广泛但是很糟糕的调色板。(在这里朝着 Jake VanderPlas 吼叫吧)。
在过去一段时间内,可视化工具(例如 MATLAB 和 Python 的 matplotlib 库)使用的默认调色板是 jet。(幸运的是,二者都更新为了新的调色板)。你可能还会听到彩虹调色板这一说法。jet 调色板的颜色从深蓝到深红,然后一直变成绿色和黄色。我在下方提供了该调色板的彩色版本和灰度模式,以显示色谱的亮度。
jet/彩虹调色板存在缺点,因为亮度并没有从一端平滑地过渡到另一端。黄色比其余颜色要亮很多,使某些数据显的格外重要,实际上并非如此。与大片的绿色相比,黄色和蓝绿色异常突出。从图中可以看到 jet 调色板的亮度,并不是平滑的渐变

Tableau数据可视化(part2:设计原则)_第23张图片
Tableau数据可视化(part2:设计原则)_第24张图片
Tableau数据可视化(part2:设计原则)_第25张图片
Tableau数据可视化(part2:设计原则)_第26张图片
Tableau数据可视化(part2:设计原则)_第27张图片

定性数据的调色板
对于定性数据,经常需要对比不同组或类别的数据。为此,你需要选择肉眼看去尽量不同的颜色。I want hue 是一款很棒的工具,可以最佳方式构建独特的调色板。我在下图中创建了一个散布图,表示鸢尾花样本的花瓣长度和宽度。通过用不同的颜色标注各个物种,可以清晰地看出数据分成三个不同的群体。

Tableau数据可视化(part2:设计原则)_第28张图片

为色盲人士设计颜色
人类通过视网膜内的细胞(叫做视锥细胞)产生的信号来识别颜色。光线进入眼睛,到达视锥细胞,视锥细胞向大脑发送电子信号。通常有三类视锥细胞:S(短波)、M(中波)和 L(长波)。它们对不同波长的光敏感。短波视锥细胞对蓝色敏感,中波对绿色敏感,长波对红色敏感。
但是,大约有 10% 的男性和 1% 的女性存在基因突变,影响到这些视锥细胞,产生色盲。最常见的色盲形式是红绿色盲,通常是因为中波视锥细胞对光敏感性转移到了红色光线上,这种突变称为绿色弱视。绿色弱视人群无法区分红色和绿色,如下图的红色和绿色苹果所示:

Tableau数据可视化(part2:设计原则)_第29张图片

还有很多关于颜色的知识可以学习,此处是 Robert Simmon 的 一系列帖子,可以帮助你开始学习。
此外,还有很多免费在线工具可以帮助你构建调色板。
Paletton
Adobe color wheel
I want hue,用于构建定性数据调色板


Tableau数据可视化(part2:设计原则)_第30张图片
Tableau数据可视化(part2:设计原则)_第31张图片
Tableau数据可视化(part2:设计原则)_第32张图片
Tableau数据可视化(part2:设计原则)_第33张图片

Tableau数据可视化(part2:设计原则)_第34张图片
Tableau数据可视化(part2:设计原则)_第35张图片
Tableau数据可视化(part2:设计原则)_第36张图片
Tableau数据可视化(part2:设计原则)_第37张图片
Tableau数据可视化(part2:设计原则)_第38张图片
Tableau数据可视化(part2:设计原则)_第39张图片
Tableau数据可视化(part2:设计原则)_第40张图片

Tableau数据可视化(part2:设计原则)_第41张图片
Tableau数据可视化(part2:设计原则)_第42张图片
Tableau数据可视化(part2:设计原则)_第43张图片
Tableau数据可视化(part2:设计原则)_第44张图片

Tableau数据可视化(part2:设计原则)_第45张图片

这篇文章(作者:Stephen Few)很好地解释了如何使用具有不规则区间的折线图。


Tableau数据可视化(part2:设计原则)_第46张图片
Tableau数据可视化(part2:设计原则)_第47张图片
Tableau数据可视化(part2:设计原则)_第48张图片

讲述正确的故事
正如在这节课中学到的那样,我们可以采用各种不同的技巧用视觉元素表示数据。即使是同一数据,不同的表示方法也会讲述不同的故事。 这篇文章很好地讲解了通过如何强调不同的视觉元素来改变故事。


你可能感兴趣的:(Tableau数据可视化(part2:设计原则))