▼
更多精彩推荐,请关注我们
▼
图源:unsplash
本文经授权转自公众号 读芯术
Excel想必大家都不陌生,作为职场标配软件,它既是典型的入门级数据可视化工具,也有着许多强大功能。
还记得我初入职场时,工作团队的标准可视化工具就是Excel。然而,人工处理数据耗费了大量时间,使我们无暇提出见解或建议。
随着技术的发展,新的数据可视化工具不断涌现。下面将介绍五大可视化工具,并结合具体使用情况解释该在何时使用这些工具。
五大可视化工具
1. Excel
图源:wikimedia
人人都在使用Excel,我从来没有遇过不用Excel的数据分析专家。不管你信不信,但这就是事实。如今,一些数据科学家仍主要使用Excel进行日常工作。
Excel的最大的好处在于,它无处不在。如果你想和他人共享文件,无需担心他们是否能打开文件。
此外,用Excel完成临时任务非常方便,比如在任意处调整一个数字。一切都是可视化的,你可以看到每个表格框的具体内容。
Excel要在可预见的未来占据一席之地,这两个优势就足够了。
2. Tableau
图源:wikimedia
大约在7年前,我开始使用Tableau。因为它是付费的,我们不得不为它构建商业案例。但这绝对是值得的。
Tableau有很多特性。例如,用户可以构建交互式仪表板,并将其提供给许多其他用户。这样就可以减少BI团队的工作量,成员可以独立地解决数据问题,不需要每次进行一些小更改时都来寻求帮助。
下面这些事情,我在Tableau中可以轻松完成,而在Excel中却无法轻易实现:
· 想出一个制作方法,在几次拖放操作和几次单击中立即将数据可视化。
· 依据变量水平分组(如将年龄变量分组为0-18、19-25…组),立即将结果反映在所有图表中。如果在Excel中有很多图表,这点能够助攻你的工作。
· 动画。正确地使用方法能够让Tableau的动画传递静态图表无法传递的强大消息。
在我看来,探索性数据分析方面,没有什么工具能比得上Tableau。
3. Power BI
图源:wikimedia
Power BI与Tableau有很多相似之处。或许是偏见,但使用了一段时间之后,我发现Power BI在某些方面的用户体验确实不如Tableau。
例如,如果要对图表中的变量重新排序,需要创建一个自定义顺序,教程中用了11张屏幕截图进行说明。而在Tableau中,可以通过拖放操作在1到2个步骤中完成,节省了很多时间。
不过,我认为Power BI的仪表板性能更好,而且最重要的是,它有一个免费的桌面版(该版本不支持团队共享,但其功能对普通用户来说一般已经足够了)。
如果没有预算,但仍想提高工作效率,Power BI不失为一个好的选择。
4. Dash
图源:unsplash
假设你已经建立了一个机器学习模型来预测每张保险单的盈利能力,与其让模型在硬盘上闲置,不如让公司的每个承销商将它用于日常工作。为此,可以构建一个基于Dash的web应用程序。
有这样一个示例:Jason Chan根据以往终极搏击锦标赛(UFC)比赛成绩,建立了一个机器学习模型,来预测未来的比赛结果。Jason并没有止步于此,而是让所有人都可以使用该模型。
注意:如果您更喜欢R而不是Python,可以去试试 R Shiny.
5.Plotly
图源:wikimedia
Plotly提供了丰富的交互式图表,如果了解R或Python,这些图表将很有用处。Tableau中能执行的大多数图表都可以在Plotly中复制。
“如果我有了Tableau或Power BI,为什么需要Plotly?”
答案是可扩展性。
假设您正在按季度看保险资产的业务组合。有20种不同的分类变量,包括地区,产品,性别等。
如果精通Tableau,那么每个图表将花费2分钟的时间。总共需要2 * 20 =40分钟。
而搭配使用Python和Plotly,您可能需要花10分钟为第一张图表编写代码。(是的,编程比拖放困难!)
接下来花5分钟编写一个循环,为20个变量中的每个变量创建一个图表。总共是10+5=15分钟。
在for循环的帮助下,工作量的增长远小于20倍。此外,也可以保存工作代码用于以后的项目。
我一般会在Jupyter Notebook中使用Plotly,与同事分享代码。
如何为订阅者选择合适的工具
了解这五大可视化工具的功能之后,您可能会想在每个项目中都使用最先进的解决方案(Dash)。
这就像被深度学习的预测能力吸引了一样,你可能会想把其他所有的技术都扔进垃圾桶,手上的的每个项目都使用深度学习方法。
这是一个非常糟糕的做法。
我们需要考虑受众,并根据他们的需求调整可视化方法,把他们进行分组是一个不错的做法。
图源:unsplash
组1:高管
这些人是组织的关键决策者。他们时间很紧,更关心的是见解和建议,而不是技术细节。你要回答他们这些问题:
· 正在发生什么?
· 为什么要发生?
· 我们应该怎样做?我在承担何种风险?
对他们来说,最好的可视化方法是放一些幻灯片,直接回答这些问题。
可以使用Tableau、Plotly甚至Excel来创建图形。没关系,重要的是需要直接简洁地回答关键问题。否则,受众会不耐烦,您的努力相当于白费功夫。
组2:运营者
这些人将您的可视化成果作为工具。以保险业为例:
· 对于承销商,可以构建一个交互式仪表板,以便他们可以评估其承销的每项商业财产风险。
· 对于索赔调查人员,可以构建一个交互式欺诈评分web应用程序,为高风险索赔提供预警。
再如,自行车共享平台的修理工可以在互动仪表板上进行回复,以查找附近的破损自行车并进行收集和检查。
从工具选择的角度上看,如果已经使用了Power BI或Tableau,那么遵循现有方法是有意义的。
如果想从头开始构建,并充分利用灵活性,可以使用Dash。
图源:unsplash
组3:分析专家
对于这群人,更推荐使用Jupyter Notebooks绘制Plotly图。
可以用它们轻松提供可重复的分析,包括代码、输出和图表在内,所有内容都集中在一起,便于同行评审。
如果是简单的临时分析,使用Tableau和Excel也是不错的选择。
组4:其他利益相关者
虽然以上3个组通常代表最重要的利益相关者,但有时也可能会遇到其他的利益相关者。
如果是技术人员,用第3组的方法就不错。
如果是非技术人员,那么Excel,Tableau或Power BI都可能是很好的选择。只要确保订阅者可以访问该软件并知道如何使用它即可。
结论
作为数据科学家,我们花了很多时间研究数据和建立模型,但我们是否花了足够的时间考虑受众?他们是谁?他们的技术能力如何?我们如何才能以最吸引他们的方式交付结果?
没有一种工具占据绝对优势。对于特定的受众,某些工具比其他工具更合适。
想要充分发挥数据科学的威力,我们要尽最大努力将数据驱动的建议转化为现实行动——无论是使产品线更有利可图,还是检测更多欺诈案例抑或实现收入最大化。
图源:unsplash
用户思维很重要,了解你的受众,选择最适合的方式,将会达到事半功倍的效果。
扫描下方二维码
咨询CDA课程详情
长 按 关 注
CDA课程咨询
联系人:史老师
电话:18080942131