原文:https://community.tibco.com/wiki/spotfire-tips-tricks-raise-bar-effective-bar-charts
目录
数据分析界的一句着名谚语是“即使是最复杂的数据分析软件也无法达到技术熟练的分析师所能达到的水平。”但是,将强大的工具与熟练的分析师的知识结合起来可以带来业务突破。一个这样快速增长的技能领域是数据可视化。
视觉思维或视网膜与大脑的通信速度是每秒1000万比特[1],而言语思维大约是每秒1000比特 - 视觉思维的1/10000。这使得在当前数据时代学习有效数据可视化原理变得至关重要。这是一系列文章中的第一篇,它将探索从数据图中获取最大价值的技术:最终用户或图表创建者的提示。
我们从条形图开始,这是最原始但功能最强大的可视化类型之一。这些图表显示了不同类别的离散数字比较; 注意,类别也可以是定量的,例如分箱列。条形图可视化类型经常使用,有时称为无聊可视化。但它真的很无聊吗?我们将在文章中稍微介绍一下这一点。简陋的条形图的历史一直追溯到1800年代,William Playfair被认为是它的发明。 [2]
> 图1显示了16至18世纪中期的小麦价格与劳动力工资。来源[3]
研究表明,条形图的强大之处在于其易于理解,特别是涉及x变量的绝对测量(y值)时。 [4] 数据可视化的最新进展创造了基本条形图的变化,并扩展了从绝对测量到部分到整体关系的适用性。下面讨论条形图类型的一些有用示例:
1.直方图
直方图是连续分布的离散化表示,因此是最简单的条形图。在Spotfire数据面板中,选择一个数字变量会显示其分布直方图的快速预览,默认的数量为二十二。这种粒度决定了分布模式,建议用户改变二进制宽度以发现更精细的模式和数据中的峰值。
2.垂直条形图
这些建议用于数字(或日期时间)x变量到数字y变量关系。根据经验,条形图可以有效地取代大多数具有三个以上扇区的饼图。L. Wilkinson的图形语法指出,饼图实际上可以被认为是极坐标中的条形图。在下面的示例中,我们探讨了无家可归数据集(参考)中个人可用的避难所的比较关系,它是清楚地看到条形图如何更易于理解。请注意垂直条形图如何将焦点绘制为“绝对”y值。
在Spotfire中,您可以通过单击快速访问菜单中的条形图标来创建条形图。
3.水平条形图
沿x轴方向从零到正无穷大会产生数量增加的感觉。因此,建议在条形图可能的情况下,x轴为数字。在上面的例子中,我们看到了x轴上的类别; 根据信息可视化理论改进此图表,应将其转换为水平条形图。
此配置允许标签从左到右配置,即英语的自然阅读顺序,因此提供比垂直条形图更好的可读性或参考具有大量类别的图例。
在Spotfire中,您可以通过单击轴并从菜单中选择水平方向,将垂直条形图转换为水平条形图。
4.堆积条形图
到目前为止,我们仅讨论了图中的x和y维度。使用大小,颜色,格子等属性,可以在同一图表中显示更多维度或变量。这种情况的一个例子是高类型数据或数据,其中分类变量由其他类别组成,每个类别可以具有与其相关联的度量。可视化这些的最简单方法是通过堆积条形图。
当用户想要查看每个子类别(在本例中为2012年或2013年)与值轴上的总数相比时,建议使用堆积条形图。在这种配置中,值轴的网格线是一种有用的装饰,因为它们允许用户为每个条形图提供快速的视觉参考点。
在Spotfire中添加上面的段标签导航到可视化属性 - >标签,然后从值或百分比中选择。您还可以定义标签方向和其他配置。
5. 100%堆积条形图
使用100%堆积条形图可以比饼图更有效地显示部分到整体的关系。将其添加到与上述相同的数据中,可以看出对于较小的不平衡类别(在这种情况下快速重新安置)100%堆积条形图如何更好地显示比例。
在许多情况下,100%堆积条形图有助于检测比例偏差。例如,请参阅咖啡类别的销售趋势数据,100%堆积条形图可以轻松揭示最近“新奇”咖啡 - 南瓜香料拿铁咖啡的销售量增加?
通过“值”对段进行排序可以使这种趋势更加明显(在Spotfire条形图可视化属性 - >外观 - >排序中)。
6.并排条形图
随着子类别的数量增加(在此示例中为年份),堆积的条形图变得不那么有用。细分市场标签开始像图表垃圾一样分散注意力。在这种情况下,最好使用并排条形图。这允许在多个子类别(年)上同时比较相同的属性(Shelter类型)。
回到顶部
1.排序
在这篇文章的几个例子中隐含地使用了排序,但是下面明确地显示了条形图中排序的价值。这里对热饮类型的类别需求显示在左侧。在右侧,在对值进行排序并包括缩放滑块后,将重新创建相同的图形。很明显,澳大利亚大约40%的人更喜欢普通咖啡和巧克力味。
在Spotfire中,您可以通过右键单击>按值排序条形图来对条形图进行排序。可以使用可视化标题栏上的“控件”菜单图标插入缩放滑块。
格子/Trellis
Trellis是一种扩展并排条形图原则的方法,以显示不同实体的相同度量。此处显示2015年第四季度和2016年移动供应商的销售结果。该指标是销售额,实体是季度比较。(来自参考文献的匿名数据)
3.颜色
假设Product2是我们的产品,为了强调这一点,我们可以通过选择单色配色和单一补色来利用颜色来突出我们的产品。这比任何文本注释更有效。
注意如何使用单色淡入淡出我仍然能够从最少到最多显示其他产品的相对排序。关于色彩理论的讨论还有很多,但这个讨论更适合将来专门用于数据可视化的色彩理论和感知的文章。
4.在B'arc图中修改了网格线
B'arc是条形图的缩写。大多数需要圆形空间分析的图形(饼图,圆环图等)很难理解。在这样的图形中,信息可以以完全不同的属性编码,例如弧形,区域,角度等[5],这进一步增加了对这些属性的阅读准确性的争论。原因通常是尺寸以圆形表示的图形,缺乏最终用户关注的参考点。为下面的两个KPI示例提供这些参考点可以大大减轻用户解释图形的负担。
图中显示了使用带有圆形网格线的圆环图的商业名称记录上的计量表和KPI的总体数据质量的KPI。
这些图表是使用JSViz在Spotfire中创建的。使上图易于阅读的属性:
回到顶部
1.子弹图
子弹图由Stephen Few创建,在针对基准的比较措施方面非常有效。将其视为与使用固定刻度(以度为单位)测量温度的温度计相似,并与基准值(如101度F)进行比较。此处当前测量产品销售额1(蓝色条)是根据产品2销售(红色条)的基准测量的2015年和2016年第4季度。绝对差异报告为计算值。
通过创建定量梯度而不是灰色背景,可以针对Product1比例设置其他基准值。但为了便于阅读,我们不鼓励对这种特殊情况进行过度修饰。
2.偏差条形图
偏差条形图以0为中心,可以更容易区分收益和损失。在下面的示例中,左图显示了配送中心需要进行的交货数量,蓝线是交货数量的建议容量。用户需要从中估计每个配送中心的增量。更好的可视化是在右侧显示相同数据,但现在参考点是建议容量。这消除了从用户找到高于容量的配送中心的负担。
请注意,此处的颜色编码与讨论无关的另一个变量。
3.瀑布图
瀑布图类似于偏差图,但不是围绕可视化中心的共同参考,每个y变量点从前一个点的y值的终点获得其偏差值。例如,下图显示了零售店每周销售额差异百分比的瀑布图。商店ID从1到44+,每个商店的销售差异百分比从前一个商店的销售差异结束开始。
从广义上讲,瀑布图表显示了不同因素如何影响最终累积。此处横截面销售差异%导致每周累计销售额差异为16%。此图表类型也非常适合比较不同类别的y值。
4.棒棒糖图表
棒棒糖图表基本上是窄条宽度的条形图和y变量度量的标记。这些通常用于代替甘特图,并且当使用具有大量条形的条形图作为缩放滑块的替代时避免混乱。棒棒糖图表由于具有连接线到轴的点图的视觉美感而变得流行,但是不对称通常导致更多的分心而不是优势。
回到顶部
使用上述指南创建的条形图将在传达观察结果方面具有吸引力。但是,通常情况下,图表可能会因非生产性配置而受到损害。以下是一些常见的配置错误:
1.双Y轴
看下面的图表有什么问题吗?
根据左边的比例,两条线之间的交点在625k到633k之间,但根据右边的比例,交点在639k到654k之间。很容易想象,如果在财务规划期间保持不变,这将造成破坏。双Y轴永远不会好,但是在显示趋势(比如绝对值,同时百分比)时,如果使用颜色和标签正确编码,它们可能不是主要的罪恶。
2.非零参考轴
请参考上图,看看611k和671k之间的差异有多夸张?这是包含原点的相同图表。注意两条线之间的绝对差异的减少。当然对用例具有主观性,但通常在非零点处开始图形可能导致感知上不准确的模式。
事实上,切断参考零点是统计数据的主要方式之一。
3.减少图表垃圾
数据可视化对分析的作用是使用户尽可能容易地吸收可操作的信息。图表垃圾是指图表中对于理解图表不是必不可少的所有视觉元素,这些可能是理解数据的主要分心和障碍。因此,只要适用,始终通过消除不必要的图例细节,轴选择器,过多标签和注释来清除图形区域。但请确保提供描述性但简短的标题和其他配置信息。
回到顶部
在本文中,我们讨论了几种探索性数据分析和报告方案,其中条形图将是最佳可视化类型。了解条形图错误使用的几个示例以及其他可视化更适合的示例也很重要:
1.时间序列中的不等间隔
在处理缺少某些y值的时间序列时,通常更容易通过折线图来代替条形图来推断图案或趋势,如下例所示。请注意,标签已被隐藏以将焦点放在图案上。
2.时间趋势
与上面的示例类似,当它们与标记值与条形图相对应时,更容易感知趋势。然而,对于具有大量数据点的高度季节性数据而言,情况可能并非如此,在这种情况下条形图呈现更强的视觉效果(以数据与墨水的比率为代价)。绘制线条时,人们会关注形成的图案,但对于条形图,焦点取决于条形长度。
3.显示从一次基准到另一次基准的变化
斜率图通常包括两列度量,对应于同一分类变量的不同时间基准。连接这些测量的线的斜率给出了值的增加或减少的感觉。条形图通常用于显示并排比较,当斜率图可能同样如果不是更有用。
回到顶部
在本文开头附近,我提出了条形图是否枯燥的问题; 要回答这个问题,我们必须定义信息图和作为分析一部分创建的可视化之间的差异。在信息图中,您试图通过各种各样的花里胡哨吸引读者的注意力,但在分析设置中,读者已经很专注。所以不,简单而简单的Jane条形图配置正确并不乏味......除非您想冒失去重要见解的风险,因为图表上覆盖了装饰性的重音,导致读者失去视觉注意力。
总而言之,条形图是有用的,因为它们易于从人类认知角度理解而无需任何额外的培训以及它们可以编码的数据和关系的多功能性。
这总结了创建有效条形图的技术。观看该页面并进行投票以获得有关详细更新的通知。您还可以通过以下方式从Spotfire博士上面的任何特定方法请求特色会话: