优阅达“优分享”| 2018 Tableau 峰会『干货帖』:通过 Tableau 计算挖掘数据真相

为什么要学习计算字段?在 Tableau 中,当数据未提供回答问题所需的信息时,创建计算字段非常有助你实现自助式分析。

主要用途有以下几种:将数据分段;转换字段的数据类型,例如将字符串转换为日期;聚合数据 ;筛选结果;计算比率;集成如 R 之类的外部服务等......

下面,我们将从宏观整体角度,介绍每种计算类型及运用场景案例,帮助你循序渐进地了解计算,更好挖掘数据。一睹为快吧

优阅达“优分享”| 2018 Tableau 峰会『干货帖』:通过 Tableau 计算挖掘数据真相_第1张图片

计算类型及实例介绍

计算通常分为3种类型,分别是基本计算字段、表计算以及详细级别表达式(LOD)。

『类型一:基本计算字段』

优阅达“优分享”| 2018 Tableau 峰会『干货帖』:通过 Tableau 计算挖掘数据真相_第2张图片

首先,聚合函数我们比较常用的就是SUM、AVG或者是MIN、MAX。还有包括统计学中的中位数,求相关性等,这些也属于聚合函数。

数字函数,我们常用的是ZN函数,ZN函数会将在连续日期时突然缺失的那几天转换为0,日期少几天,ZN函数就会补多少个0。

用户函数,比较偏向于 IT 场景,它会获取我们进入登陆 Server 的一个人的名字,这时可以用 USENAME 来做一个权限设置。

字符串函数内有一个是包含的函数,有时我们设置权限表,会有一个USE,一个权限,这时如果权限重复,数据会翻倍。所以此时换一种方式,比如说我们按照地区来设权限,把字符串内的函数包括和 Usename 结合在一起使用,此时数据不会翻倍。这个小知识,IT人员可以考虑这样设置权限。

▌案例:零售行业的指标是如何计算?

利润=营业额-单件成本*数量

利润率=总利润/总营业额

折扣=1-营业额/销售吊牌金额

客户数=客户名称计数不同

交易次数=订单ID计数不同

客单价=总营业额/客户数

连带率=总数量/交易次数

坪效、人效、完成率、存销比……


『类型二:表计算』

表计算是嵌入在 Tableau 中的快速计算方法。快速表计算,总共有8类,我们可以做差异,可以做移动平均,可以做百分比差异、百分比、总额百分比、百分位,排名、汇总之类的一个计算,它相当于基于一个计算结果(聚合结果)做了一个二次计算。

优阅达“优分享”| 2018 Tableau 峰会『干货帖』:通过 Tableau 计算挖掘数据真相_第3张图片
瀑布图:用到汇总计算,通过汇总算出每一个点,它相当于是一个高点,做一个汇总  
优阅达“优分享”| 2018 Tableau 峰会『干货帖』:通过 Tableau 计算挖掘数据真相_第4张图片
排序凹凸图:无法查看具体数值,但可以了解每辆车排名的升降情况  

除了刚刚那几个函数之外,我们还可以去集成 R、MATLAB 和 Python 。我们以 R 为例,它其实是做一个表计算,把表计算的结果以及一个代码发送到 Server,然后 R 代码就会进到 R,产生一个 R 值,最后返回到表计算里面。

▌案例:表计算的集成

❶ SCRIPT 函数-集成外部服务-以 R 为例

将表达式传递到外部服务以与 R、MATLAB 和 Python 集成的函数。

优阅达“优分享”| 2018 Tableau 峰会『干货帖』:通过 Tableau 计算挖掘数据真相_第5张图片

❷ 集成外部服务-以 R 为例

1.下载 R

2.下载,安装和调用 R serve

 a. install.packages("Rserve")

 b. library(Rserve)

 c. Rserve()

3.在 Tableau Desktop 中连接 R:

帮助 -> 设置与性能 ->管理外部服务器连接

4.输入服务器名称, 端口号为 6311

5.测试连接!


『类型三:详细级别表达式(LOD)』

详细级别表达式是三个函数,fixed、Exclude、Include,它相当于在改变你的视图级别,有的时候你双击,你的视图就根据你双击的那些字段来划分它的详细级别,但是有的时候你的计算级别不一样,这时候就会用到详细表达 LOD。

Fixed:指定确切的详细级别,独立于可视化内容所用维度实现

Exclude:以较高详细级别进行计算,删除某一维度执行计算

Include:以较低详细级别进行计算,创建粒度较高的表达式

▌案例:客户分析 LOD

比如,找出每个客户订购的订单数是比较简单的,但是如果我们想了解订购过一个订单、两个订单、三个订单(依次类推)的客户数目,该怎么办呢? 如果要生成相应视图,我们必须按订购的订单数划分客户数。

再比如,在我们的订单数据里面,一个客户可能存在多次购买,那么新客户增长情况如何?越早购买的客户对后来销售额的贡献会越大吗?各个地区客户争取情况每日趋势如何?

另外,争取新客户的成本可能非常高,因此会希望能够确保现有客户有重复购买。在间隔一个、两个、三个、N 个季度重复购买的客户数目是多少? 从未重复购买的客户数目是多少? 如果按季度阵列划分重复购买行为,会有什么发现么?

优阅达“优分享”| 2018 Tableau 峰会『干货帖』:通过 Tableau 计算挖掘数据真相_第6张图片
客户订单频率
优阅达“优分享”| 2018 Tableau 峰会『干货帖』:通过 Tableau 计算挖掘数据真相_第7张图片
新客户增长情况
优阅达“优分享”| 2018 Tableau 峰会『干货帖』:通过 Tableau 计算挖掘数据真相_第8张图片
同期群分析
优阅达“优分享”| 2018 Tableau 峰会『干货帖』:通过 Tableau 计算挖掘数据真相_第9张图片
各地区客户争取率
优阅达“优分享”| 2018 Tableau 峰会『干货帖』:通过 Tableau 计算挖掘数据真相_第10张图片
回头客分析

我们在使用 LOD 的时候,还会跟参数进行结合。比如,下图展示的是每个地区的销售情况,同时有一个参照地区,每一个地区都会跟参照地区做比较,然后可以进行一个切换。我们在计算里面有时候可以融入参数。

优阅达“优分享”| 2018 Tableau 峰会『干货帖』:通过 Tableau 计算挖掘数据真相_第11张图片


如何正确进行计算

或许你还不知道该根据哪些应用场景选择计算类型,我们在这里分享一种思维方法,方便各位更好做出决策。

优阅达“优分享”| 2018 Tableau 峰会『干货帖』:通过 Tableau 计算挖掘数据真相_第12张图片

首先我们看计算是否会需要排名迭代或者移动,跨行计算这种,如果要存在这种计算的时候,你就要用表计算,因为这些计算相当于存在一个跨行,你要跨行只有表计算能去实现跨行的结果。

如果你不是做这类计算,我们可以做其它的判断。你的视图里面是否有所需的所有数据,如果是,则可进入下一问题。视图布局是否允许使用快速表计算,因为有的时候视图布局是不允许用快速表计算的,如果是允许可以使用快速表计算,相当于做一个二次计算。

如果是不允许,以及包括视图没有所需数据的时候,就可以统一去看另外一个问题,我们的数据粒度是否一致,如果我们的数据粒度是一致,可以直接使用基本计算,如果数据力度是不一致,就需要用到详细级别表达式。



文章部分信息来源于网络,如有侵权请告知

你可能感兴趣的:(优阅达“优分享”| 2018 Tableau 峰会『干货帖』:通过 Tableau 计算挖掘数据真相)