Tableau成立于2003年,于2019年被Salesforce收购,是斯坦福大学一个计算机科学项目的成果,该项目旨在改善分析流程并让人们能够通过可视化更轻松地使用数据
Tableau是一个可视化分析平台,它改变了我们使用数据解决问题的方式,使个人和组织能够充分利用自己的数据
Tableau是分析领域值得信赖的领导者。作为现代商业智能的市场领先选择,Tableau平台以从几乎任何系统获取任何类型的数据,并将其快速轻松地转化为可操作的见解而闻名。就像拖放一样简单
Tableau以科学研究工作为基础,旨在使分析更快、更轻松、更直观。以提供即时反馈的快速迭代方式分析数据
Tableau与Power BI是两种流行的商业智能(BI)工具,用于收集、集成、分析和呈现业务数据。它们都有助于执行数据分析、数据操作和数据可视化,以了解各种数据集并从中得出结论
Tableau与Power BI的主要区别:
功能与特点
PowerBI和Tableau在功能和特点上有一些明显的区别。PowerBI是由微软开发的数据可视化工具,它与Microsoft Office套件集成得很好,可以轻松地与其他Microsoft产品进行交互。它提供了丰富的数据连接选项,支持多种数据源的导入和整合。PowerBI还具有强大的数据建模功能,可以通过创建关系模型和计算字段来处理和转换数据。此外,PowerBI提供了丰富的可视化选项,用户可以根据需要创建各种交互式图表和仪表板
Tableau则是一款由Tableau Software开发的数据可视化工具,它以其出色的可视化能力和用户友好的界面而闻名。Tableau具有强大的数据探索功能,用户可以通过简单地拖放字段来创建视觉化图表。与PowerBI相比,Tableau对于大型数据集的处理能力更强,并且更加注重用户体验。它提供了丰富的可视化选项和交互式功能,使用户能够更深入地探索数据并发现隐藏的见解
可扩展性与集成性
PowerBI是一个基于云的解决方案,它提供了丰富的云服务和功能,如Power BI服务和Power BI桌面应用程序。这使得用户可以轻松地在不同设备之间同步和共享报表和仪表板。此外,PowerBI还支持与其他Microsoft产品(如Excel和Azure)的紧密集成,使得数据的导入和处理更加便捷
Tableau则更注重与各种数据源和平台的集成。它支持多种数据连接选项,并提供了广泛的第三方集成插件和API,可以与其他系统无缝集成。Tableau还提供了丰富的开发者工具和扩展功能,使开发人员能够根据自己的需求进行定制和扩展
适用场景
PowerBI更适合那些使用Microsoft生态系统的企业和用户。由于其与Microsoft Office的紧密集成,PowerBI可以无缝连接和共享数据,使得数据分析和报告变得更加便捷。PowerBI也适合那些需要进行快速数据建模和可视化的用户,它提供了直观的界面和丰富的可视化选项,可以快速生成交互式仪表板和报表
Tableau则更适合那些需要更高级的数据探索和分析功能的用户。由于其强大的数据处理能力和灵活的可视化选项,Tableau适用于处理大型数据集和进行复杂的数据分析。Tableau提供了更多的自定义和交互式功能,用户可以更深入地探索数据,发现隐藏的关联和见解。因此,Tableau常被用于数据科学、商业智能和高级分析领域
Tableau官网:https://www.tableau.com/zh-cn
Tableau入门文档:https://help.tableau.com/current/pro/desktop/zh-cn/gettingstarted_overview.htm
Power BI官网:https://powerbi.microsoft.com/zh-cn/
Tableau Desktop提供了对您的数据进行访问、可视化和分析所需的全部功能。借助直观的拖放界面,您可以发现更快做出有影响力的业务决策所需的隐藏见解,即使处于离线状态也没有关系。同时还可以在安全的自助环境中利用受信任和受管控的数据
Tableau Desktop中的开始页面是一个中心位置,您可以从中执行以下操作:
开始页面由三个窗格组成:连接(Connect)、打开(Open)和探索(Discover)
Tableau支持的数据源有:
1)如何使用工作簿的数据源连接和数据字段?
注意:对于多维数据集数据源,会在创建数据库时将字段显式定义为维度或度量。对于关系数据源,Tableau将自动组织字段。默认情况下,包含文本、日期或布尔值的字段为维度,而包含数字值的字段为度量
默认情况下,在数据源中定义的字段名称显示在数据窗格中。您可以重命名字段和成员名称、创建分层结构,以及将字段组织为组和文件夹
2)分析窗格
分析窗格可以将高级分析应用于视图
在Tableau Desktop中,分析窗格、菜单或视图的上下文中提供了用于将分析对象添加到视图中的选项
Tableau中的每个工作表都包含功能区和标记卡,例如“列”、“行”、“标记”、“筛选器”、“页面”、“图例”等
通过将字段放在功能区或标记卡上,您可以执行以下操作:
尝试将字段放置在不同功能区和卡上,以找到查看数据的最佳方式
从数据窗格拖动字段以创建可视化项结构。列功能区用于创建表列,而行功能区用于创建表行
将维度置于“行”或“列”功能区上时,将为该维度的成员创建标题。将度量置于“行”或“列”功能区上时,将创建该度量的定量轴。向视图添加更多字段时,表中会包含更多标题和轴,您对数据的了解也会更加详细
Tableau使用标记显示数据,其中每个标记对应于数据源中的一行(或一组行)。“行”和“列”功能区上的内层字段决定默认标记类型。例如,如果内层字段为度量和维度,则默认标记类型为条形图。可以使用“标记”卡下拉菜单手动选择其他标记类型
向“行”和“列”功能区添加更多字段时,表中也会添加更多的行、列和区
标记卡是Tableau视觉分析的关键元素。将字段拖到“标记”卡中的不同属性时,您可以将上下文和详细信息添加至视图中的标记
使用标记卡设置标记类型,并使用颜色、大小、形状、文本和详细信息对数据进行编码
使用筛选器功能区可以指定要包含和排除的数据。例如,您可能希望对每个客户分区的利润进行分析,但希望只限于特定的装运容器和交货时间。通过将字段放在筛选器功能区上,即可创建这样的视图
可以使用度量、维度或同时使用这两者来筛选数据。此外,还可以根据构成表列和表行的字段来筛选数据。这称为内部筛选。也可以使用不属于表的标题或轴的字段来筛选数据。这称为外部筛选
所有经过筛选器会自动打开“筛选器”对话框。默认情况下不选中任何成员。选择要保留在视图中的成员。所有清除的成员都被排除
使用页面功能区可以将视图划分为一系列页面,使您可以更好地分析特定字段对视图中其他数据的影响。将某个维度放置到“页面”功能区上时,将为该维度的每个成员添加一个新行。将某个度量放置到页面功能区上时,Tableau会自动将该度量转换为离散度量
页面功能区会创建一组页面,每个页面上都有不同的视图。每个视图都基于您放置在页面功能区上的字段。使用将字段移到页面功能区时添加到视图中的控件,您可以轻松地翻阅视图并在一个公共轴上比较它们
向页面功能区中添加字段时,会自动向视图的右侧添加页面控件。使用此控件可在页面之间导航
一些功能区、图例或控件仅在您使用视图时执行操作后才会显示。例如,仅在“颜色”上有字段时,才会显示“颜色”图例
Tableau使用的是工作簿和工作表文件结构,这与Microsoft Excel十分类似。工作簿包含工作表,后者可以是工作表、仪表板或故事。每个工作簿可以包含不同类型的工作表:视图(又称工作表)、仪表板和故事
工作表以标签的形式沿工作簿的底部显示。在工作簿内,您可以创建新工作表、清除整个工作表、复制工作表、隐藏或显示工作表以及删除工作表。Tableau提供了若干种在工作簿中查看和组织工作表的方式
方式1: 单击工作簿底部的“新建工作表”、“新建仪表板”或“新建故事”按钮
方式2: 页面选择工作表/仪表板/故事->新建工作表/新建仪表板/新建故事
重命名工作表:
右键工作表->重命名或双击工作表名
每个Tableau工作簿都包含已当前工作会话的该工作簿中的工作表、仪表板和故事执行的步骤的历史记录
如果要使用现有工作表作为出发点来进行进一步探索,您可以复制该工作表
“复制”可创建新版本的工作表、仪表板或故事,您可以对其进行修改,而不会影响原始工作表
操作步骤:右键工作表->复制
复制为交叉表:
交叉表(数据透视表)是一个以文本行和列的形式总结数据的表
交叉表会用原始工作表中的数据交叉表视图来填充该工作表。不能以交叉表的形式来复制仪表板和故事
操作步骤:右键工作表->复制为交叉表
方式1: 光标悬停,单击标记,在工具提示中点击“查看数据”
方式2: 右键单击视图,然后单击“查看数据”
删除工作表会将其从工作簿中移除。一个工作簿中必须始终至少有一个工作表
若要删除活动工作表,请右键单击工作簿底部排列的工作表标签中的工作表,然后单击“删除”
注意:在仪表板或故事中使用的工作表无法删除
Tableau数据源中的所有字段都具有一种数据类型
可以在“数据源”页面上或“数据”窗格中更改字段的数据类型
1)在数据源页面修改
2)在数据窗格修改
对于文件中的混合数据类型,Tableau按Excel数据源中前10000行和CSV数据源中前1024行的数据类型来确定如何将混合值列映射为数据类型
可以打开Tableau Desktop自带的数据源或使用数据源连接器连接到数据源
Tableau数据源连接器的使用文档:
参考文档:https://help.tableau.com/current/pro/desktop/zh-cn/calculations_aggregation.htm
参考文档:https://help.tableau.com/current/pro/desktop/zh-cn/order_of_operations.htm
参考文档:https://help.tableau.com/current/pro/desktop/zh-cn/calculations_aggregation.htm
可以使用多种不同的Tableau专用文件类型来保存工作:工作簿、书签、打包数据文件、数据提取和数据连接文件
将视图导出为图像文件
操作步骤:选择“工作表”->“导出”->“图像”
参考文档:https://help.tableau.com/current/pro/desktop/zh-cn/save_export_image.htm
将数据导出为csv文件
1)导出数据源数据
操作步骤:在“数据源”页面上,选择“数据”->“将数据导出到CSV”
2)导出视图数据
操作步骤:右键工作表标签,单击“查看数据”,然后单击“全部导出”按钮
参考文档:https://help.tableau.com/current/pro/desktop/zh-cn/save_export_data.htm
本案例使用Tableau Desktop自带的“超市”数据,在开始页面点击打开
需求: 按总销售量额计,北京市位居前10名的客户有哪些?
操作步骤:
1) 将“Sales”(销售额)拖到“列”
2) 将“City”(城市)和“Customer Name”(客户名称)拖到“行”
3) 再次从“数据”窗格中拖出“City”(城市)到“筛选器”。在对话框“常规”选项卡上,只选择”北京“
4) 单击工具栏上的“降序排序”按钮
5) 将“Customer Name”(客户名称)从“数据”窗格拖到“筛选器”,并创建一个“Top10”筛选器,以显示前10名客户,点击应用
存在问题: 显示的名称与之前不再相同
原因: “前N个”筛选器和常规维度筛选器是同时应用的,它们都是维度筛选器,并且按Tableau操作顺序出现在同一位置
解决: 将维度筛选器转换为一个上下文筛选器,该筛选器将先于在工作表中创建的任何其他筛选器执行
6) 在“筛选器”功能区上右键单击“City”(城市),并选择“添加到上下文”。作为上下文筛选器,此筛选器现在优先于维度筛选器,因此视图现在将按预期方式显示