最大的数据杀手——中国式复杂报表
作为资料人,在日常生活和工作之中,我们是否经常被要求制作如下图所示的一些数据统计表格:
总的来看,这些表格看似包含的信息很全,但是其实人脑对数字本身并不敏感,看到数字之后需要在左脑进行进一步思考才能转化为人最终获取到的信息。
而幸运的是,人的右脑对图像信息的处理速度非常快,能达到相同场景下数字处理速度的100倍以上。
基于人脑对数字和图像处理的以上特征对比,我们开始尝试使用图表的方式对数据进行更好的信息传达。
尽管如此,却经常发现自己虽然有数据,却不知道用什么图表来进行数据最佳形式的价值表达,只会使用几个简单的柱状图、折线图、饼图。
在颜色和字体等细节样式方面,不知道如何进行更加美观的调配,做出来的图表被人吐槽巨丑。
做好的报告不知道如何进行组合呈现,不知道如何进行合理的布局,最终做出来的报告,甚至有时候自己都有点不忍直视。
要构建一个优秀的可视化仪表板 (即真正信息丰富、可以指导行动的仪表板),仅将所有「顿悟」放到画布上是不够的。要让仪表板达到给使用者最佳的信息传达效果,我们必须认真考虑各种规划和设计各种元素。
接下来将从图表类型、颜色搭配、仪表板布局设计原则、作品完善四个部分详细地给大家进行讲解,希望能够让大家的商业数据可视化分析报告能力得到一定提升。
时间趋势分析
时间趋势分析,是我们日常工作中应用最为广泛的方法之一。对于这类场景,我们通常可以选择折线图、柱状图来更好地进行数据到时间趋势的分析,比如上图所示,我们用折线图来分析每个地区的年度合同金额走势。
但是如果我们同时还想知道总的销售额在每年的走势如何,仅仅通过折线图或者柱状图显然是无法表达的。如果想知道每年总的销售额的走势,这个时候我们就可以通过范围面积图、堆积折线图或者堆积柱状图来实现。
但是这三其实者也是有区别,范围面积图和堆积折线图是以每个地区作为一个模式的(单独观察每个地区的合同金额走势也同样方便),而堆积柱状图是将每个月份作为一个模式的。
比较和排序分析
第二种要给大家介绍的是比较和排序分析,对于这类场景,我们通常可以选择条形图或者柱状图来进行对比比较和排序,这是因为他们都是基于相同的基线然后将数值显示为长度或者高度,使得值与值之间的对比分析变得异常容易。
相关性分析
我们经常会有一些需要进行相关性探索分析的数据,例如研究某一种商品的单价和销售额之间的关系,研究员工考勤时间和离职率之间的关系,研究温室温度和作物生长的关系等等,这个时候采用散点分布图也许是我们的首选。
但是需要注意的是,相关性分析并不能保证绝对的存在关系,只是表示可能存在关系。一般来说,在用散点图进行资料的相关性分析时,我们还可以引入趋势拟合线进行辅助判断。
对于不同单位的数据,在FineBI中我们可以采用分面分析的方法。分面展示其实是提供了一种将多项指针并列分析的数据观察视角。
比如我想同时观察温度和衬衫销售的数据统计趋势、观察合同金额和购买数量的关系,这个时候就可以使用分面分析来进行资料统计观察。通过分面,可以分析不同指标的相关性,从而发现资料的潜在关联。
分布分析
分布分析也是我们做数据可视化分析时使用的比较多的一种方法,例如我们想知道不同产品类型的销售金额分布,这个时候我们可能会选择使用饼图进行展示。
通常来说饼图和堆积柱状图主要用于做数据的分布分析,但是需要注意不要试图尝试对不同系列的饼图进行数据分布对比分析,这将会不利于我们观察到每部分数据的变化情况,此时对比柱状图会是我们更好地选择。
周期性数据分析
对于周期性循环数据特征分析,比如企业经营状况——收益性、生产性、流动性、安全性和成长性的评价(适用于快速对比定位短板指标),我们建议使用雷达图进行展示。
地理资料分析
对于那些和地理位置信息相关的数据分析,地图是我们的首选类型,包括点地图、区域地图、热力地图、流向地图等等。因为地图除了能对比分析资料本身的差异性之外,还可以结合地理位置进行分析,发掘和地理位置信息等相关的业务价值。
例如某一家电商企业,想要分析不同区域服装种类的销售情况,如果通过地图进行地理位置信息相关的辅助分析,就能快速探索出服装种类和地区位置区域的相关性(例如南方衬衫、西装等服装热销,北方羽绒服、羊毛衫等服装热销)。
漏斗转化分析
漏斗图适用于分析具有明确流程节点转化率的资料分析场景,例如互联网企业常用的平台使用者访问阶段漏斗转化分析、使用者生命周期漏斗转化分析等等。
如上图所示 ,我们通过FineBI进行某个平台的使用者访问阶段转化率数据分析。我们逐级来看各节点转化情况,首先是使用者从浏览商品行为到新增购物车行为这一流程的转化情况,我们通过漏斗图可以快速看出其转化率为50.77%,反映出该平台的商品介绍、图片描述等对用户有较强的吸引力。
接下来继续看新增购物车到下单的转化率,可以看出其转化率高达99.66%,非常不错。之后却看到单至付款的转化率仅50%,这是一个值得反思的转化节点,通过资料分析猜测该平台商铺支付渠道不完善,需要增加例如支付宝、微信等快捷支付渠道,降低平台因为没有提供使用者习惯性的支付渠道而导致使用者放弃购买行为的几率。
日历图分析
日历图常用于分析和时间规律相关的分布数据,一般来说需要使用同一生长色系或者热力色进行渲染展示。
如上图所示,我们使用日历图分析每个月每天的发电量数据,可以很容易地发现8月、12月份的与中下旬处于全年的用电高峰期。
核心KPI指标分析
对于企业核心的KPI指针数据我们通常可以使用,KPI指针卡以及文本组件进行直观的汇总展示。
硕大醒目的关键绩效指标是使用者查看仪表板时的锚点,它们似乎在大声引导使用者说:「从这里开始!」这些数字可用作对话开场白,还能为旁边的图表提供上下文。
最后是适合直接使用表格进行展示的数据类型,通常来说比如需要查看精准的数据(比如需要反复查对的统计数据)以及需要明细展示的数据。通常来说我们可以和颜色进行结合(FineBI可自动渲染为颜色表格),更进一步的直观显示出数据的数值大小分布。
颜色搭配一致性原则
颜色是最有效的美学特征之一,因为它可以吸引注意力。我们最先注意到的特征就是颜色, 它能够以直接的方式突出显示特定见解、标识异常值。在论证观点时,颜色的使用应该以数据为基础,而不是个人的喜好或品牌的颜色。
一般来说,我们在使用颜色的时候可以遵循以下的配色一致性原则:
1.数值指标一致性
当根据某一个指标的数值大小进行颜色映射时,建议使用生长色系的渐变颜色。
例如上图所示,统计的是不同年份的一个地区销售额情况,左边的图颜色并没有色系和生长规律,使用者难以理解具体指标数值的映含义,而此时如果使用右边的生长色系的表达方式,它会传达给使用者一种颜色可测量感。
那么使用者根据这样的渐变生长色系,就可以很轻松地理解当年每个地区的一个销售额分布情况。
2.指标颜色一致性
在同一仪表板中,对于相同的度量尽量使用同一色系的颜色方案,避免使用过多的颜色对使用者造成干扰。
例如我们在做销售广告牌分析时,通常分析指标会有销售额和回款额,那么即使我们在对同一个指标做不同维度的数据可视化分析时,对于销售额和回款额建议分别使用相同的色系进行配色,比如销售金额尽量用黄绿色系,回款金额尽量用蓝色系。
我们在遵循这样的指标颜色一致性配色原则之后,使用者就能够快速地根据颜色区分来理解当前的数据可视化图表所要表达的指针含义。
3.色系颜色一致性
在同一仪表板中,尽量选择相同色系的颜色方案,避免撞色。
对于颜色如何去定义选择,这个可能是很多使用者非常头疼的事情,不知道该选择什么样的颜色去搭配。但是其实在色系搭配方面,FineBI里面内置了非常多的漂亮的配色方案可供大家进行同一色系颜色的选择,这一点对于使用者是非常友好的,毕竟有时候「颜值也很重要」。
如果我们是自定义配色,需要避免一些撞色。例如你把黄+白、蓝+黑、红+蓝、黄+紫等等色系进行搭配,这样不但从感官上不美观,而且还容易对使用者的眼睛造成刺激。
4.语义颜色一致性
符合语义的颜色可以帮助人们更快地处理信息,尽量根据指标含义选择符合人类最直观感受的颜色。
因此可以使用红色来表示热量分布,褐色表示干旱指数,蓝色表示降水量等等。
仪表板的用途是引导读者查看多个可视化,讲述每个见解的故事,揭示见解之间的联络。 更多地采用更好的仪表板设计,使使用者可以发现正在发生的事情,了解最重要的信息及其重要性。考虑如何在仪表板上引导用户的视线。那么我们在设计仪表板布局的时候,需要遵循哪些原则?
1.故事性可视化仪表板布局
在设计仪表板之前,我们首先需要知道使用者的习惯和阅读需求。通常来说,使用者看一个仪表板或者读一个可视化作品的时候就像看一本书一样,遵循着从上到下从左到右的原则。
也就是说,最重要的核心指标分析(一般可以选择使用较大的数字进行KPI指针汇总显示),我们可以放在左上方或者顶部。如果需要新增过滤控件进行页面级的辅助数据筛选,控件的位置一般放在顶部位置。
其他一些次重要的指标分析可以放到左下方,最后是一些相对不那么重要数据或者是引导式分析最末尾的数据、明细数据、需要查看精准的数据(比如需要反复查对的统计数据)等等可以放到仪表板的右下方位置。
2.管理仪表板/大屏广告牌布局
另外在做一些管理仪表板或者是大屏广告牌的时候,我们可能会需要将一些比较重要的数据(一般来说可能是地图或者是核心的数据可视化分析等等)放到中部进行展示。管理仪表板往往展现的是一个企业全局的业务,一般分为主要指标和次要指针两个层次,主要指针反映核心业务,次要指标用于进一步阐述分析。所以在制作时给予不一样的侧重,这里推荐几种常见的版式。
上面几个版式不是金科定律,只是通常推荐的主次分布版式,能让信息一目了然。实际项目中,不一定使用主次分布,也可以使用平均分布,或者可以二者结合进行适当调整。比如下图所示,指标很多很多,存在多个层级的,就根据上面所说的基本原则进行一些微调,效果会很好。
1.标题和文本注释
当我们完成图表的数据可视化统计和组合布局之后,并不意味着已经完成了我们的数据分析报告,如果只是几个图表的组合拼接成的一个仪表板,可能会让使用者难以阅读和理解。由于数据可视化分析报告的可读性至关重要,所以我们需要使用简短有力的标题和文本,以最少的字数传达最有价值的观点、信息或故事。
通过标题和文本注释结合可视化来对数据进行讲述,突出显示具体见解,提供其他背景信息,将所有这些元素整合到一个顺畅的演示中。通过这些故事点让人们能够以更加有序的方式,深入探索每个可视化中的指标和见解。优秀的可视化作品不但可以帮助您更好地理解自己的数据,还可以更快地提供更有意义的见解,甚至启发其他人提出和回答新问题。
2.不要重复相同业务意义的表达
对同样维度和指针的数据可视化呈现形式有多种多样,但是注意不要在同一仪表板中重复相同业务意义的表达。例如我们统计每个地区销售额的占比分布情况,可以使用折线图、也可以用柱状图、饼图来进行展现,但是此时我们只需要选择最佳的表达方式(饼图)进行呈现即可。
3.钻取分析多层级资料
对于一些有树层级关系的数据,在FineBI中可以通过数据层层钻取或者多层饼图的形式进行呈现。通过数据钻取的形式,让用户在做数据穿透分析时更加方便灵活,同时节约常规仪表板多个维度分析所要占用的额外区域。
4.联动分析,替代控件过滤
通常在做一些需要数据过滤筛选的时候,我们可能会使用控件进行过滤。但是用户实际在阅读整体的数据可视化报告时,通过设定FineBI图表和图表之间的联动关系来代替控件过滤,往往能够更进一步增强仪表板的引导式分析,让使用者进行更加快捷和灵活的数据联动分析。
5.消除杂乱
6.多维分析,防止一叶障目
如上图所示,这是一家牛奶生产企业的某个固定销售报表的广告牌,我是这家公司的战略决策者,那么我从这样的固定维度的报表中只能够得出两个结论:
1.2016年相比2015年的公司牛奶销售额相对有所增长,环比增长率位122.82%;
2.每年中各个月份的销售额相差不大,唯一是在2月份中,可能是由于春节的影响,拉动了大众的集中消费,所以在每年2月份公司的牛奶销售额会迎来一个小高峰阶段。
如果是传统的固定报表,那么数据分析能给用户传递的信息可能也就到此为止了。可是真的仅仅如此吗?我们再来引入产品维度分析看看。
我们可以仔细观察这个资料分析结果,无论是2015或是2016年,看起来好像每一年中的第一季度和第四季度的鲜奶销售额比较高,酸奶的销售额比较低;而第二季度和第三季度的酸奶销售额比较高,鲜奶销售额比较低。而像固定报表中的单一维度直接汇总,往往就将这样真正有数据业务价值的结果掩盖掉了。
这里我们进一步来验证一下。继续用雷达图进行每个季度不同产品类别的牛奶销售额统计,观察每年季度的销售额资料统计结果,我们可以轻松验证之前的资料观察结果。
我们再来从业务的角度进一步思考目前的资料结果原因,第一季度和第四季度主要为春、冬季节,天气比较冷,这种冷天大家都喜欢热鲜奶喝,因为比较暖身体。第二季度和第三季度主要为夏、秋季节,天气比较热,而这种热天大家都喜欢和酸奶,因为比较清爽。
如果我是这家公司的战略决策者,那么每年对于第一季度和第四季度,公司将主要生产鲜奶,降低酸奶的生产量;对于第二季度和第三季度公司将主要生成酸奶,降低鲜奶的生产量。
这样一来,我们通过逐步的探索分析将数据和业务联合起来,总体上既能提高企业的产品销售额,又能降低每个季度公司的库存压力。
我们每天遵循的习惯可能会隐藏数据背后潜在的价值,所以我们需要多尝试从看表格数字思考转换到看图形感知分析,勇于改变现状。在对数据进行探索分析思考时,要善于从不同角度去进行可视化分析,完善数据全貌,这样才能发掘数据背后的巨大价值。落实到具体的数据工作中,作为数据人,我们除了分析日常业务提出来的问题之外,还需要学会积极去处理未预见的问题,时刻保持对数据的怀疑态度,练就自己在探索资料业务问题时的前瞻性。
优秀的可视化作品不但可以帮助您更好地理解自己的数据,还可以更快地提供更有意义的见解,甚至启发其他人提出和回答新问题。构建商用可视化是一门综合技艺,需要运用科学、艺术、交流、叙事等方面的技能。
人人都可以制作可视化,但要获得真正有效的商用可视化仪表板,我们需要投入时间、开展协作、进行迭代。 FineBI提供一个快速的可视化分析工具可以供我们进行使用,但是请记住:多从使用者角度出发,再优秀的仪表板仍然可以继续完善和改进!