数据可视化(学习笔记三)

本期主要学习内容:对比型数据 和 分布型数据 可视化数据图表

可视化图表选择

对比型数据

对比型数据,即在实际工作中经常需要将多个数据进行对比,如:多个组织营业额和利润率的对比情况。如何让业务方或者用户更清晰的了解各体系各类别之间的对比情况,通常是以不同的标记和可视化图表来体现出来:

(1)高度/长度:柱状图、条形图;

(2)大小:面积图、气泡图

(3)颜色:热力图、散点图、气泡图

(4)字号大小:单词云图

(5)形状:星状图

实战举例(星状图)

对比型数据各图形的使用场景可参考顶部的思维导图,此处只做实战的可视化图表分析。

场景:双十一已过,某宝要比较三家电商公司(淘宝/京东/拼多多)在消费者心中的印象评分,进而改善平台服务质量。

对比系列(维度):淘宝/京东/拼多多

对比数据类别(指标):商品丰富度/商品质量/物流效率/售后服务(以下评分为5分制)

实战数据

可视化图表选择

通过已知的三个对比系列以及四个对比类别,得出多系列(<6个)多类别(<6个)进行对比,可选择“星状图”进行可视化分析。若分析的系列过多且数据类别<6,建议选择堆叠柱状图。

星状图:

特点:

各类别数据上限相同(这里上限为5分),且系列类别不超过6个,若大于5个时,可以将其他类别数据归为“其他”。

视觉效果好,每个星角水平直线上,可以对比各系列之间类别的数据情况。

评分5分制

分布型数据

数据的分布特征,是统计学中「描述性统计」模块研究的内容。要对数据的分布情况进行可视化呈现,首先需要了解数据的描述性度量(集中趋势、离散程度、偏态和峰度),通过这些反映数据分布特征的关键指标,才能确定能够使用哪些图表来进行可视化展示。

描述性统计的相关内容,可以参考这篇文章《统计学第1篇 描述性统计》。

实战举例(频数直方图/频率直方图)

分布型数据各图形的使用场景可参考顶部的思维导图,此处只做实战的可视化图表分析。

场景:用户想了解50家店铺的收入、成本和店铺综合评分的分布。

对比系列(维度):50家店铺“月度”数据对比

对比数据类别(指标):收入/成本/综合评分

50家店铺各系列分布情况

这里可以将收入、成本和综合评分的数据进行分组,x轴为收入、成本、综合评分,y轴代表店铺的数量和频率。各类别的数据按数组可分为(0~20)/(20~40)/(40~60)/(60~80)/(80~120)/(120~140)。

(图形示例如下)

来自数据大佬的图



总结:选择可视化图表前,要先对业务需求进行分析,通过分析目的判断是要进行数据对比还是分布情况对比,通过系列维度和类别指标的多少来选择合适的可视化图表。

以上为第三周的学习总结,如有大佬看到此篇,麻烦多多指教~

你可能感兴趣的:(数据可视化(学习笔记三))