【TOAN HOANG 专题(17)】直方图与正态曲线

本文搬运自国外Tableau大神原创文章,Tableau交流问答群为国内唯一独家授权组织

Toan Hoang:知名Tableau大神,数据可视化自由职业者和Tableau Magic的创始人,萨尔萨舞教练,钢琴演奏者,技术爱好者和程序员。


【TOAN HOANG 专题(17)】直方图与正态曲线_第1张图片
效果图
【TOAN HOANG 专题(17)】直方图与正态曲线_第2张图片
Toan Hoang

另本文由Tableau交流问答群Tableau爱好者——周宇丰对原文进行翻译,若有问题,欢迎讨论

原作者注:这篇教学是关于如何在Tableau中创建直方图与正态曲线,整个过程不会超过10分钟

数据准备

我们先使用Tableau读取自带的“示例 - 超市”数据源,当然也可以通过如下链接下载:

https://pan.baidu.com/s/1J7lfxOelL5pRfwbfFnUN8g 提取码:jhcm

【TOAN HOANG 专题(17)】直方图与正态曲线_第3张图片

计算字段

数据全部读取完成之后,我们需要创建如下数据桶和计算字段:

客户总数:

COUNTD([客户ID])

各客户销售额:

{ FIXED [客户 ID]: SUM([销售额]) }

我们使用详细级别表达式来汇总每个客户的销售额

各客户销售额平均值:

{ AVG([各客户销售额])}

我们没有指定LOD的计算维度,因为我们的计算范围是整个数据源

各客户销售额标准差:

{ STDEV([各客户销售额])}

参数:销售额数据桶大小

●将参数名设为销售额数据桶大小

●将数据类型改为“整数”

●将当前值改为“2500”

销售额(数据桶):

INT([各客户销售额] / [销售额数据桶大小]) * [销售额数据桶大小]

正态曲线:

( 1/MAX([各客户销售额标准差])*SQRT(2*PI()) )

* EXP(-SQUARE(MAX([销售额(数据桶)]) - MAX([各客户销售额平均值]))

/ (2 * SQUARE(MAX([各客户销售额标准差]))))

备注:这就是高斯分布方程,一般也叫做正态分布

工作表

在我们的工作簿中以此做如下操作:

●将“标记栏”中的类型改为“条形图”

●拖“销售额(数据桶)”“列”

○右击胶囊并将其转化为“维度”

●拖“正态曲线”“列”

【TOAN HOANG 专题(17)】直方图与正态曲线_第4张图片

现在我们做可视化的最后一步的调整

●在“行”上设置“双轴”,但千万不能做“同步轴“

●调整视图的颜色

●隐藏轴

●调整工具提示

你可能感兴趣的:(【TOAN HOANG 专题(17)】直方图与正态曲线)