tableau 字段去重_用大白话介绍一款数据分析利器Tableau:从入门到考证

MONOCHROME.

MONOCHROME.

tableau 字段去重_用大白话介绍一款数据分析利器Tableau:从入门到考证_第1张图片

缘起

_________

近期鄙人趁闲暇时间(在公司每个人都尽量配点儿证书的压迫下),考了两个数据分析相关的证书:Tableau Desktop Specialist和Tableau Desktop Certified Associate。几个爱学习的朋友撺掇我线下来段儿单口相声,把Tableau是个什么玩意儿,怎么用到工作中,如何快速通过认证给讲讲清楚,顺便练练我的表达能力。我谢谢大家的好心好意,我想不如先简单写下来,这样给我提意见的朋友会更多些。于是今天我奉献了下班后躺在床上刷抖音的时间,把这款工具介绍给还没用过的朋友。

●●●

一、为什么我们要用Tableau

1

首先,简单聊聊什么是数据思维。我认为其实每个人都有数据思维,张三儿是个打工仔,他不仅关心自己的工资,还关心周围同事工资,关心完了还想比较比较自己在哥儿几个里面算高算低,如果操心比较多,还想把全公司的人工资打听个遍。打听完了,问题来了,这怎么比较自己工资水平如何呢?懂点儿统计的朋友会很明确的知道,需要去计算均值、中位数、众数、最值等统计指标了,用过办公软件的朋友会很轻松地打开EXCEL,敲几个公式计算出这几个统计指标,供张三儿比较。张三儿还不满意,辛辛苦苦统计的数据,最后只计算这几个指标,看不到公司全貌。学过统计的朋友又好心建议,你画个直方图吧,可以看到全公司的工资分布情况,你下个阶梯有多少人,未来晋升难度有多大,清清楚楚。

提到直方图,问题来了。常用EXCEL的朋友知道,一般想要画直方图,需要先计算工资的最大最小值,然后分组,然后计算每个组内的频数,最后画一个条形图了事儿。且不说组距有可能设的不合理,但是这一通操作就有点儿费手。会用更高级别编程语言的朋友站起来了,哪有那么费事儿,一切皆可代码化,让我给你秀一段儿“import………”。如果用Tableau需要多长时间呢?答案是3秒钟。Tableau可以快速调整组距大小,1秒钟调整图形颜色,1秒钟把直方图变成分布曲线,而且几乎不存在代码编译错误。

以上只是列举了Tableau一个小小的应用场景。Tableau官网介绍其功能“可以帮助人们查看并理解数据”。在数字化的今天,在各行各业都对数字更加敏感的时代,具有数据思维的人应该使用更加灵活的数据化分析工具,毕竟我们需要把更多的时间用在理解数据、发现数据规律、洞察商业逻辑上,而非编译代码中。

tableau 字段去重_用大白话介绍一款数据分析利器Tableau:从入门到考证_第2张图片 tableau 字段去重_用大白话介绍一款数据分析利器Tableau:从入门到考证_第3张图片

二、Tableau核心功能  

2

首先需要理解Tableau对数据的认识方法:对数据指标进行分类,可以分为维度和度量,维度指标大多是离散的,度量指标大多是连续的。维度指标大家可以从字面上去理解,即分析问题的维度。还拿张三儿收集的工资数据为例,可以按照部门划分,可以按照性别年份、可以按照入职年限划分。部门和性别都是离散的维度,入职年限是连续的维度。度量指标即划分完维度后,具体分析的问题对象,即工资数额,这是连续的度量。离散的度量也有可能用到,比如分完部门以后,统计部门内员工来自于不同省市的数量,这样的度量本身也是连续的,但是是对离散变量进行统计以后得到的。

接下来可以了解一下Tableau的核心功能,通过功能介绍,大家也可以看出Tableau的简洁之处,一个成功的产品必然是能发现用户痛点,且能够快速解决,在使用时不给用户添堵,此为大道至简:

1.强大的数据连接功能

Tableau常用的连接文件有xlsx、csv、txt、pdf(没错,可以读取pdf表格)。常用的数据扩展方式有“并集”(相当于UNION,加行),“表关联”和“混合”(相当于各类join,加列)。数据连接方式有两种“提取”和“实时”(如果都是在本地操作,数据量不大的话没啥差别)。这里,鄙人推荐一个好用的功能“数据解释器”,即如果你发现你收到的EXCEL表格脏乱无比,同一个标签页中记录了多个表格信息,各种空行、空列、大小标题、合并单元格,想立马拍回去时,不要着急,Tableau“数据解释器”功能帮你一键进行数据清洗,分别提取每一个关系型表格,便与你后期处理。如果这样的数据用python的pandas读取,那可又费劲了。最后,Tableau处理百万级数据,如果电脑配置不算太差,是基本不卡的。而EXCEL处理几十万级数据就已经非常卡顿了,很有可能公式没拉完,小圆圈儿转一半EXCEL就自动卡到关闭,丢失的数据和公式就让人欲哭无泪了。而Tableau不会对源数据产生任何更改,而且支持你对读取后的数据做各种合并、拆列、给字段重命名、给文本取别名操作,如此灵活又可爱的Tableau,怎能不爱呢?

2.灵活的计算函数功能:

用惯了EXCEL的朋友会习惯性的写一些公式,新增一些字段,辅助进行数据分析。而Tableau相当于在一个视图中进行操作,会不会不支持这些呢?其实Tableau的计算函数非常容易实现,每一个计算函数旁边都有注释和示例,可读性比EXCEL的函数注释强很多,对日期的处理也比SQL、Oracle更友好。常用的计算函数有:数字函数、字符串函数、日期函数、类型转换函数、逻辑函数、聚合函数、表计算函数等,这里不一一赘述。此外,Tableau还提供了3个强大的函数,他们同属于LOD(详细级别表达式)家族。最常用的函数是Fixed,它可以固定分析维度的级别,使得度量计算结果不受视图详细程度影响。比如,张三儿想看看他们公司2019年入职的员工,2020年一共领了多少工资。那么就需要用到Fixed函数,控制员工编号这个维度,计算每个员工编号的最早领工资日期是不是2019年,如果是则打标签“1”,对标签为“1”年份为“2020”的数据进行筛选后,再计算工资总额,就能回答张三儿的问题。具体关于计算函数篇,不在赘述。总而言之,语法规则简单易学,但和关系型数据库一样,同样存在较难对行与行之间数据进行计算的问题。

3.快速可视化功能:

人们对于数字和文本的感受力,远远不如对图形和色彩的感受力。为了更快的对眼前的这批数据有一个直观感受,不断的切换分析维度和展示形式,用图像去认识数据,是最直观的方式。Tableau可以支持的快速绘图类型有饼图、条形图、堆积图、树状图、折线图、散点图、面积图、直方图、箱型图、甘特图、符号地图、面积地图等。图形的名字五花八门,还可以结合计算字段和一般图形绘制更为复杂的帕累托图、桑基图等。需要明确的一点是图形的展示形式是服务于分析问题的,越简单直观的图形越能发挥数据可视化的价值。Tableau在可视化部分的创新之处在于,它将图形的颜色、大小、标签等属性均抽象为标记,使用者只需要简单的将一个维度/度量拖到相应的标签处,图形就会随之改变。此外,Tableau还提供了添加各类参考线的功能,只要简单的把相应的参考线拖到图形中,就可以显示出使用者想要的均值、一倍标准差、四分位等参考线。最后,Tableau还提供了一些简单的数据挖掘功能,如最小二乘法拟合曲线、基于K近邻的聚类等。当然,Tableau可视化也有其问题,鄙人一直嫌弃的就是它的图形分辨率不够,对比度不太明显,这一点有待优化。

4.直达你心的交互功能

传统的PPT过于死板,且需要我们耗费大量精力去维护其形式美观、格式准确、内容连贯。而到了实际演讲时,我们往往回答不上领导提出的一些细微问题,因为没有数据支撑,没有图形展示,没有预备到这些问题。如果你也担心这一点,那可以尝试用Tableau的仪表盘去实现。举一个简单的例子,如果张三儿打工的是一家子公司遍布全国的大型公司,张三儿想看北京地区员工工资分布情况,直接在仪表盘的地图上点击北京地区,仪表盘的其他展示表格就会跟着变动,这在仪表盘中称为“操作”。仪表盘还支持许多其他的操作,如点击北京地区,在连网的条件下仪表盘的某个位置会跳转到北京子公司的百度百科页面。这些操作功能将大大有助于演讲者的展示。最后,Tableau还可以实现一些动态展示,比如前段时间比较火的中国GDP在的全球追赶动态视频,有人用python实现,有人用EXCEL实现,这里向大家隆重推出Tableau,也是只需要一个拖拽操作,一秒钟就可以实现。

MONOCHROME.

tableau 字段去重_用大白话介绍一款数据分析利器Tableau:从入门到考证_第4张图片 tableau 字段去重_用大白话介绍一款数据分析利器Tableau:从入门到考证_第5张图片

三、Tableau考证指南  

3

前面废话有点多,鄙人今天也累了,Tableau考证篇放在下一篇再讲。这篇太懒了,没有任何酷炫截图,下一篇尽量加上。

欢迎大家广泛交流,晚安。

tableau 字段去重_用大白话介绍一款数据分析利器Tableau:从入门到考证_第6张图片 tableau 字段去重_用大白话介绍一款数据分析利器Tableau:从入门到考证_第7张图片

●●●

-end-

排版编辑|小伊

内容审核|小伊

tableau 字段去重_用大白话介绍一款数据分析利器Tableau:从入门到考证_第8张图片

欢迎点击小程序给我留言

你可能感兴趣的:(tableau,字段去重)