【演奏的船长】数据分析学习记录W3-维度与度量,离散与连续

维度与度量、离散与连续是Tableau中两组非常基础且重要的概念,本周对这里两组的概念进行了定义澄清和关系辨析

【维度与度量】

  • <维度Dimension>不可聚合的分类定性数据,是观察数据的角度。

  • <度量Metric(Tableau中为Measures)>可聚合的定量数据,为某一个维度下各分类的统计值(计数度量),或根据某特定聚合函数的计算值(复合度量)。

【演奏的船长】数据分析学习记录W3-维度与度量,离散与连续_第1张图片

[描述]

维度就是那些数据行的名称。
group by 的属性通常就是维度
地址不属于一般的维度,应当归为明细,将地址提炼为国家、地区、城市时才变成维度
维度用于设置粒度,即视图中的详细级别。我们通常希望按特定类别组合对数据进行分组。

度量就是那些似乎永远都只能作为“列”的名称而不作为“行”的名称的东西。
度量主要用于分析或者评估,比如对趋势的判断,对业绩或者效果的判定等等。
不可做聚合的字段不是度量,比如单价

按照官方的说法:如果字段包含分类数据(比如产品名称、地区、订单日期),就划分为维度;如果字段包含定量数据(比如销售额、利润),就划分为度量。分类数据通常是指文字、日期和无意义的数字,定量数据通常是指有意义的数字。
当只有一个度量时,如果有n个维度列,则理论上的维度组合有2的N次方个。
举例来说,我们都玩网络游戏,网游中你的各项属性名称:生命、体力、经验、魅力等等,都是属性,都是Dimension,只不过他们的metric名称都一样罢了——点数,比如生命点数还剩多少。

【离散与连续】

  • <离散变量>数值只能用自然数或整数单位计算的变量。例如,企业个数,职工人数,设备台数等,只能按计量单位数计数,这种变量的数值一般用计数方法取得。
  • <离散字段>字段值各自分离且不同。在Tableau显示为蓝色胶囊,视图中显示为标题
  • <连续变量>在一定区间内可以任意取值的变量。例如,生产零件的规格尺寸,人体测量的身高,体重,胸围等,这种变量只能用测量或计量的方法取得。
  • <连续字段>字段值构成了一个不间断的整体。在Tableau显示为绿色胶囊,视图中显示为轴
    [描述]

连续或离散的胶囊会对tableau颜色的默认行为产生影响。颜色功能区上的连续胶囊将形成一个梯度。颜色功能区上的离散胶囊将形成一个调色板,其中每个唯一值都分配到一种颜色 。

【演奏的船长】数据分析学习记录W3-维度与度量,离散与连续_第2张图片

【总结】

  • 维度和度量的核心差别在于是否可聚合。多数情况下,维度是离散的,而度量是连续的。同时维度和度量都可以是离散,或者连续的(比如,时刻就是连续的维度,考试得分就是离散的度量);
  • 视图的框架取决于字段的离散与连续组合,与"维度","度量"无关。可结合想要绘制的图表灵活的选取相应字段或调整字段的离散/连续。

你可能感兴趣的:(【演奏的船长】数据分析学习记录W3-维度与度量,离散与连续)