数据可视化中图表的意义及其与数据的关系

目录

    • 折线图——趋势
    • 柱状图——比较
    • 杠铃图——端值
    • 饼图——比例
    • 散点图——关系
    • 地图——分布
    • K线图——涨跌
    • 雷达图——多维
    • 雷达回波图——分布
    • 盒须图——整体
    • 热力图——异常
    • 关系图——关系
    • 路径图——路线
    • 树图——关系
    • 矩形树图——占用
    • 旭日图——层级
    • 平行坐标系——多维
    • 桑基图——流动
    • 漏斗图——环节
    • 仪表盘——单一
    • 象形柱图——形象
    • 主题河流图——时间
    • 日历坐标系——直观
    • 3D柱状图——三维
    • 3D散点图——三维
    • 3D曲面图——模型
    • 3D地图——宏观
    • 3D折线图——三维
    • GL散点图——分布
    • GL路径图——路网
    • GL矢量场图——方向
    • GL关系图——关系

折线图——趋势

显示数据的变化趋势,极值所处的位置。
数据可视化中图表的意义及其与数据的关系_第1张图片

柱状图——比较

不同类型的数据比较。
数据可视化中图表的意义及其与数据的关系_第2张图片

杠铃图——端值

关注端值差异,杠铃图结果更直观。
数据可视化中图表的意义及其与数据的关系_第3张图片

饼图——比例

体现不同类型的数据在同一基准下的分布情况;可以直观的显示出各数据所占的比例关系。
数据可视化中图表的意义及其与数据的关系_第4张图片

散点图——关系

根据二维的数据集绘制散点图,揭示两个变量间的关系。
数据可视化中图表的意义及其与数据的关系_第5张图片

地图——分布

显示同一自变量在不同的地理位置的数值,以及自变量在地图上的分布情况。
数据可视化中图表的意义及其与数据的关系_第6张图片

K线图——涨跌

一个K线图能够反应四个值:起始值、终止值、最高值、最低值。
可以将一个折线图浓缩为一个K线图,如果一天产出一个k线图,则展示一个月的数据变化可以通过30个K线图来表示。
根据不同颜色表示不同类型的数据变化,如“上涨”与“下跌”。
数据可视化中图表的意义及其与数据的关系_第7张图片

雷达图——多维

表示多维数据,如KDA、性能数据。
数据可视化中图表的意义及其与数据的关系_第8张图片

雷达回波图——分布

可表示某一变量(如降雨量)在地图上的分布情况,根据不同颜色表示不同强度。
数据可视化中图表的意义及其与数据的关系_第9张图片

盒须图——整体

也称“箱型图”。
一个盒须图由5个数据构成:最大值、最小值、中位数、上四分位数和下四分位数。
显示数据分布特征。
识别数据异常值。
最大的特点是,不受异常值影响,能准确、稳定地描述数据的离散分布情况,同事也利于对数据进行清晰(异常值识别)。
四分位数:
一组数据按照从小到大顺序排列后,把该组数据四等分的数,称为四分位数。第一四分位数 (Q1)、第二四分位数 (Q2,也叫“中位数”)和第三四分位数 (Q3)分别等于该样本中所有数值由小到大排列后第25%、第50%和第75%的数字。第三四分位数与第一四分位数的差距又称四分位距(interquartile range, IQR)。
举个例子,以学生成绩为例,上四分位数表示成绩排名前1/4的学生,中位数表示排名中间的学生,下四分位数表示成绩排名后1/4的学生。我构造了三个班级的学生成绩,用于分析不同班级学生的成绩分布,过程如下:
数据可视化中图表的意义及其与数据的关系_第10张图片

最终结果:
数据可视化中图表的意义及其与数据的关系_第11张图片

盒须图
从盒须图明显可以看出:1、一班成绩整体好于二班、三班,75%的学生成绩高于80分,最高成绩满分,但出现了异常值,成绩没过60分,不符合一班的实际情况;
2、二班成绩整体最差,75%的学生成绩低于80分;
3、三班成绩良莠不齐,跨度最大,有将近50%的学生可以跟一班看齐,也有50%的成绩较差。
数据可视化中图表的意义及其与数据的关系_第12张图片

热力图——异常

可表示雷达数据,时间-高度的大气测量数据。
github提交情况日历图。
可结合地图使用,即雷达回波图。
数据可视化中图表的意义及其与数据的关系_第13张图片

关系图——关系

体现各个角色之间的各种关系。
数据可视化中图表的意义及其与数据的关系_第14张图片

路径图——路线

配合地图使用,显示路线。
数据可视化中图表的意义及其与数据的关系_第15张图片

树图——关系

向下分类
关系
数据可视化中图表的意义及其与数据的关系_第16张图片

矩形树图——占用

体现大类对于总体的占用情况,以及类的内部各个子类对于该类的占用情况,依次递归。
可与旭日图相转化。
数据可视化中图表的意义及其与数据的关系_第17张图片

旭日图——层级

又称“太阳图”
旭日图中每个级别的数据由一个圆环表示,离原点越近代表圆环级别越高,最内层的圆表示层次结构的顶级,然后一层一层去看数据的占比情况。越往外,级别越低,且分类越细。
因此,它既能像饼图一样表现局部和整体的占比,又能像矩形树图一样表现层级关系。
旭日图 = n张饼图
旭日图相当于多个饼图的组合,但饼图只能体现一层数据的比例情况,而旭日图不仅可以体现数据比例,还能体现数据层级之间的关系。
旭日图的本质是树状关系,因此也被称为极坐标下的矩形树图。
它可以在承载大量数据的同时,清晰的显示数据间的结构关系。
但二者也有一定的区别:
● 树状图更适合类别少、层级少的比例数据关系;
● 旭日图的更适合层级多的比例数据关系;
● 对于层级较多的数据,旭日图展示更直观。
数据可视化中图表的意义及其与数据的关系_第18张图片

平行坐标系——多维

适用于多维数据(尤其是维度大于3个时,3个以内的维度可以用散点图)的分析和比较。例如,多个学科、多个考核指标、多个关键参数等。
数据可视化中图表的意义及其与数据的关系_第19张图片
数据可视化中图表的意义及其与数据的关系_第20张图片

桑基图——流动

桑基图主要由边、流量和支点组成,其中边代表了流动的数据,流量代表了流动数据的具体数值,节点代表了不同分类。边的宽度与流量成比例地显示,边越宽,数值越大。
数据可视化中图表的意义及其与数据的关系_第21张图片

桑基图自被命名的那一刻起,就注定和能量分不开了。桑基图通常用于可视化能源或成本转移,也帮助我们确定各部分流量在总体中的大概占比情况。无论数据怎么流动,桑基图的总数值保持不变,坚持数据的“能量守能定理”。
展现数据流动的利器。
可用来表示账单,看看自己每一笔存款都花向哪里。
这张桑基图(Sankey Diagram)理清了法国公共管理部门的资金来源,以及他们是如何分配这些资金的。最左边的支点代表了不同的资金来源,包括社会、个人税收等。这些资金在汇总到法国的四大公共管理部门后,被再分配到交通、环境保护、住房、教育、文化等各个领域。
在描述收支情况时,桑基图能帮你捋清每一笔金钱的走向。钱都来自哪里,花在哪里,在一张桑基图上都能一目了然。
数据可视化中图表的意义及其与数据的关系_第22张图片

桑基图示例:
数据可视化中图表的意义及其与数据的关系_第23张图片

漏斗图——环节

● 漏斗图适用于业务流程比较规范 、周期长、环节多的单流程单向分析,通过漏斗各环节业务数据的比较能够直观地发现和说明问题所在的环节,进而做出决策。
● 漏斗图用梯形面积表示某个环节业务量与上一个环节之间的差异。
● 漏斗图从上到下,有逻辑上的顺序关系,表现了随着业务流程的推进业务目标完成的情况。
● 计算能力:自动进行转化率计算。
● 可视化效果:梯形、矩形样式,并自定义标签显示等。
数据可视化中图表的意义及其与数据的关系_第24张图片

例如,假设一家虚拟的电子商务公司,其目标是让访问该网站的用户进行购买。在网站上进行购买所需的步骤是:访问网站、将产品添加到购物车、点击结账并完成购买。
在给定的一周内,通过每个平均的用户数量是:
访问网站
1000
添加到购物车
500
点击查看
300
完成购买
200
像下面这样的典型漏斗图会转换这些数据,并可以通过漏斗中每个阶段的用户数量更轻松地看到。
数据可视化中图表的意义及其与数据的关系_第25张图片

可视化清楚地看到漏斗中最大的下降发生在开始时 - 只有我们的一半用户添加到购物车。

仪表盘——单一

常用来表示一个重要的数据。
数据可视化中图表的意义及其与数据的关系_第26张图片

象形柱图——形象

比较形象的柱状图。
数据可视化中图表的意义及其与数据的关系_第27张图片
数据可视化中图表的意义及其与数据的关系_第28张图片
数据可视化中图表的意义及其与数据的关系_第29张图片

主题河流图——时间

河流图(Streamgraph),有时候也叫做“主题河流图”(ThemeRiver),是堆积面积图的一种变形,通过“流动”的形状来展示不同类别的数据随时间的变化情况。但不同于堆积面积图,河流图并不是将数据描绘在一个固定的、笔直的轴上(堆积图的基准线就是x轴),而是将数据分散到一个变化的中心基准线上(该基准线不一定是笔直的)。
河流图常用于轴线为时间轴,显示多种类数据随着时间的变化而变化的数据。比如各大电影的票房变化、历史长河中载具的变化以及城市或国家的经济变化等。
数据可视化中图表的意义及其与数据的关系_第30张图片

日历坐标系——直观

查看一年中每天的变量数量(比如做题数量),可直观的看出一年内的变量情况。
最典型的就是github的表示提交次数的日历坐标系(leecode也有)。
数据可视化中图表的意义及其与数据的关系_第31张图片

3D柱状图——三维

三维显示数据。
数据可视化中图表的意义及其与数据的关系_第32张图片

3D散点图——三维

三维显示数据。
数据可视化中图表的意义及其与数据的关系_第33张图片

3D曲面图——模型

可展示一个模型。
数据可视化中图表的意义及其与数据的关系_第34张图片

3D地图——宏观

数据可视化中图表的意义及其与数据的关系_第35张图片

3D折线图——三维

数据可视化中图表的意义及其与数据的关系_第36张图片

GL散点图——分布

数据可视化中图表的意义及其与数据的关系_第37张图片

GL路径图——路网

数据可视化中图表的意义及其与数据的关系_第38张图片

GL矢量场图——方向

数据可视化中图表的意义及其与数据的关系_第39张图片

GL关系图——关系

你可能感兴趣的:(数据可视化,数据分析,数据可视化,数据仓库)