解构Tableau的绘图逻辑(四)

行、列功能区(绘图逻辑)

与维度和度量不同,标记栏和行、列功能区对应的是Tableau绘制图表的逻辑。也就是说,我们是通过这两个功能区来排列组合维度和度量,从而得到我们想要的图表。首先我们来讲行、列功能区的作用。

行、列功能区主要有两个作用:

  1. 决定如何排列数据。
  2. 同时决定视图的详细级别。

这里必需要理解两个重要的概念:离散和连续。在Tableau中离散数据用蓝色表示,连续数据用绿色表示。如果你注意观察过左侧的维度和度量功能区,就会发现默认的维度都是蓝色的,度量都是绿色的。

但这是不是意味着维度都是离散数据,度量都是连续数据呢?答案是否定的。维度和度量、离散和连续,是Tableau中两组不同的概念,不能混淆。维度和度量上一节我们已经讲过,这里不再累述。

首先讲离散数据的作用,也就是蓝色胶囊,官方的说明文档里离散的作用是绘制标题,我个人觉得这个解释可能并不太好理解,什么是标题?起初这也是困扰我的一个知识点。我个人认为离散数据绘制表格这种说法更容易理解一点。

比如我们分别拖动类别到列功能区,地区到行功能区,再拖动销售额到文本,这样就形成了一个交叉表格,我们点选每一个列或每一个值,这些值都是独立存在的。

我们可以看到,官方说明文档里离散绘制标题,其实就是表格的标题或者说是表头,本质上还是生成了一个表格。所以,离散数据绘制表格的解释可能更贴切,更易于接受。

同时,因为这两个离散字段还是维度,所以,我们的这个视图的详细级别就被这两个维度决定了。关于详细级别,这里受篇幅影响,暂且略过。

通过分析->查看数据选项,我们可以查看视图数据。绘制这个表格的视图数据由3列构成,地区和类别2列是维度,决定了视图的详细级别,销售额1列是度量,是销售额在这个详细级别下聚合的结果。这个3列18行的视图数据,就是我们绘制这个交叉表视图的基础。

下面我们接着讲连续数据,也就是绿色胶囊的作用,它的作用是画坐标轴。比如我们拖动地区到列功能区,销售额拖到行功能区,这样就生成了一个简单的条形图。这里可以看到,销售额字段形成了一个纵轴,也就是Y轴,而这个轴是一个连续的整体。从视图数据可以看到,地区这个维度决定了视图的详细级别,销售额受地区维度的影响聚合成了6个值,对应条形图里的6根柱子。

如果把地区这个离散字段换成利润这个连续字段,那么我们又多了一个横轴,也就是X轴,这样我们实际上就得到了一个散点图,但是这个散点图上只有一个点,因为没有拖任何维度过来,所以数据的详细级别是在整个数据集这个层次上,数据没有被任何维度分割成不同的组。我们看一下底层数据,只有两个值,所以在散点图上只有一个点。

当然离散数据和连续数据是可以一起用的,比如我们上面使用的地区和类别构成的表格,如果将销售额和利润分别再拖到行、列功能区,可以在表格中嵌套坐标轴。从视图数据中可以看到,地区和类别共同决定了视图的详细级别,利润和销售额形成了18组数据,对应图表里的18个点。

但是如果我们尝试把绿色的连续字段拖到蓝色的离散字段前面,这是不允许的。就是说坐标轴里是不能嵌套表格的,因为无法在一个连续的坐标轴里对表格进行定位,这应该很好理解。

当然,离散和连续并不是一成不变的,也是可以相互转换的。比如我们在销售额上点击右键勾选离散,把销售额从连续数据转变成离散数据,虽然视图数据没有改变。但是视图的展现形式就可以从条形图变成表格。离散和连续的转变,这里并不做过多介绍。

你可能感兴趣的:(解构Tableau的绘图逻辑(四))