体现不同类型的数据在同一基准下的分布情况;可以直观的显示出各数据所占的比例关系。
显示同一自变量在不同的地理位置的数值,以及自变量在地图上的分布情况。
一个K线图能够反应四个值:起始值、终止值、最高值、最低值。
可以将一个折线图浓缩为一个K线图,如果一天产出一个k线图,则展示一个月的数据变化可以通过30个K线图来表示。
根据不同颜色表示不同类型的数据变化,如“上涨”与“下跌”。
可表示某一变量(如降雨量)在地图上的分布情况,根据不同颜色表示不同强度。
也称“箱型图”。
一个盒须图由5个数据构成:最大值、最小值、中位数、上四分位数和下四分位数。
显示数据分布特征。
识别数据异常值。
最大的特点是,不受异常值影响,能准确、稳定地描述数据的离散分布情况,同事也利于对数据进行清晰(异常值识别)。
四分位数:
一组数据按照从小到大顺序排列后,把该组数据四等分的数,称为四分位数。第一四分位数 (Q1)、第二四分位数 (Q2,也叫“中位数”)和第三四分位数 (Q3)分别等于该样本中所有数值由小到大排列后第25%、第50%和第75%的数字。第三四分位数与第一四分位数的差距又称四分位距(interquartile range, IQR)。
举个例子,以学生成绩为例,上四分位数表示成绩排名前1/4的学生,中位数表示排名中间的学生,下四分位数表示成绩排名后1/4的学生。我构造了三个班级的学生成绩,用于分析不同班级学生的成绩分布,过程如下:
盒须图
从盒须图明显可以看出:1、一班成绩整体好于二班、三班,75%的学生成绩高于80分,最高成绩满分,但出现了异常值,成绩没过60分,不符合一班的实际情况;
2、二班成绩整体最差,75%的学生成绩低于80分;
3、三班成绩良莠不齐,跨度最大,有将近50%的学生可以跟一班看齐,也有50%的成绩较差。
可表示雷达数据,时间-高度的大气测量数据。
github提交情况日历图。
可结合地图使用,即雷达回波图。
体现大类对于总体的占用情况,以及类的内部各个子类对于该类的占用情况,依次递归。
可与旭日图相转化。
又称“太阳图”
旭日图中每个级别的数据由一个圆环表示,离原点越近代表圆环级别越高,最内层的圆表示层次结构的顶级,然后一层一层去看数据的占比情况。越往外,级别越低,且分类越细。
因此,它既能像饼图一样表现局部和整体的占比,又能像矩形树图一样表现层级关系。
旭日图 = n张饼图
旭日图相当于多个饼图的组合,但饼图只能体现一层数据的比例情况,而旭日图不仅可以体现数据比例,还能体现数据层级之间的关系。
旭日图的本质是树状关系,因此也被称为极坐标下的矩形树图。
它可以在承载大量数据的同时,清晰的显示数据间的结构关系。
但二者也有一定的区别:
● 树状图更适合类别少、层级少的比例数据关系;
● 旭日图的更适合层级多的比例数据关系;
● 对于层级较多的数据,旭日图展示更直观。
适用于多维数据(尤其是维度大于3个时,3个以内的维度可以用散点图)的分析和比较。例如,多个学科、多个考核指标、多个关键参数等。
桑基图主要由边、流量和支点组成,其中边代表了流动的数据,流量代表了流动数据的具体数值,节点代表了不同分类。边的宽度与流量成比例地显示,边越宽,数值越大。
桑基图自被命名的那一刻起,就注定和能量分不开了。桑基图通常用于可视化能源或成本转移,也帮助我们确定各部分流量在总体中的大概占比情况。无论数据怎么流动,桑基图的总数值保持不变,坚持数据的“能量守能定理”。
展现数据流动的利器。
可用来表示账单,看看自己每一笔存款都花向哪里。
这张桑基图(Sankey Diagram)理清了法国公共管理部门的资金来源,以及他们是如何分配这些资金的。最左边的支点代表了不同的资金来源,包括社会、个人税收等。这些资金在汇总到法国的四大公共管理部门后,被再分配到交通、环境保护、住房、教育、文化等各个领域。
在描述收支情况时,桑基图能帮你捋清每一笔金钱的走向。钱都来自哪里,花在哪里,在一张桑基图上都能一目了然。
● 漏斗图适用于业务流程比较规范 、周期长、环节多的单流程单向分析,通过漏斗各环节业务数据的比较能够直观地发现和说明问题所在的环节,进而做出决策。
● 漏斗图用梯形面积表示某个环节业务量与上一个环节之间的差异。
● 漏斗图从上到下,有逻辑上的顺序关系,表现了随着业务流程的推进业务目标完成的情况。
● 计算能力:自动进行转化率计算。
● 可视化效果:梯形、矩形样式,并自定义标签显示等。
例如,假设一家虚拟的电子商务公司,其目标是让访问该网站的用户进行购买。在网站上进行购买所需的步骤是:访问网站、将产品添加到购物车、点击结账并完成购买。
在给定的一周内,通过每个平均的用户数量是:
访问网站
1000
添加到购物车
500
点击查看
300
完成购买
200
像下面这样的典型漏斗图会转换这些数据,并可以通过漏斗中每个阶段的用户数量更轻松地看到。
可视化清楚地看到漏斗中最大的下降发生在开始时 - 只有我们的一半用户添加到购物车。
河流图(Streamgraph),有时候也叫做“主题河流图”(ThemeRiver),是堆积面积图的一种变形,通过“流动”的形状来展示不同类别的数据随时间的变化情况。但不同于堆积面积图,河流图并不是将数据描绘在一个固定的、笔直的轴上(堆积图的基准线就是x轴),而是将数据分散到一个变化的中心基准线上(该基准线不一定是笔直的)。
河流图常用于轴线为时间轴,显示多种类数据随着时间的变化而变化的数据。比如各大电影的票房变化、历史长河中载具的变化以及城市或国家的经济变化等。
查看一年中每天的变量数量(比如做题数量),可直观的看出一年内的变量情况。
最典型的就是github的表示提交次数的日历坐标系(leecode也有)。