导读:史上最全图表类型术语&指南来了!
作者:斯科特·贝里纳托(Scott Berinato)
来源:大数据DT(ID:hzdashuju)
安德鲁·阿伯拉(Andrew Abela)制作的《这份指南》(This Guide)是思考图表类型的一个很好的起点,但不要把它用作决策引擎。并不是人人都同意他对图表类型的组织方式,层级结构也并未包含所有有效的图表类型。
事实上,这里显示的每个图表都有许多变体和混合,而且人们时时刻刻都在创建出新的图表类型。此外,当你想要拓展自己的思维,尝试多种方法时,这个工具可能缩小你的思考范围。
但是,它将帮助你理解各种形式的类别(例如,比较和分布),并且可能激发你尝试一些新东西。我已经对《这份指南》进行了调整,使之与“交谈-画草图-创建原型”的框架相适应。至于我是怎样调整的,请参见下图。
▲关注大数据DT(ID:hzdashuju),在后台对话框回复可视化,可获取无压缩高清大图。
01 2×2矩阵
也叫矩阵,水平和垂直平分的方框,形成了四个象限。它常用于说明基于两个变量的类型。
优点:针对元素分类和“区域”创建的易于使用的组织原则
缺点:在不同的空间间隔绘制象限内的项,暗示两者可能不存在统计关系
02 冲积图
也称为流图,显示值怎样从一个点移动到另一个点的节点和流。这通常用于展示值在一段时间内的变化,或者其组织方式的细节,例如,预算拨款如何逐月使用。
优点:在值的更改中公开详细信息,或者在广泛数据类别中公开地详细分解
缺点:流中的许多值和变化导致复杂而且交叉的视觉效果,虽然很漂亮,但可能很难解释
03 条形图
表示类别之间关系(“分类数据”)的高度或长度不等的条形。常用来比较同一指标下的不同群体,如10位不同CEO的薪酬。(当条形图垂直时也称为柱状图。)
优点:大家都熟悉的形式;非常适合于类别之间的简单比较
缺点:许多条形图可能会造成趋势线的印象,而不是突出离散值;多组条形可能变得难以解析
延伸阅读:手把手教你用直方图、饼图和条形图做数据分析(Python代码)
04 气泡图
散布在两次测量上的点,为数据增加了第三个维度(气泡大小),有时增加了第四个维度(气泡颜色),以显示几个变量的分布。常用来表示复杂的关系,如绘制不同国家的多个人口数据块。(也被错误地称为散点图。)
优点:合并“z轴”最简单的方法之一;气泡大小可以为分布式的可视化图表增加至关重要的上下文
缺点:按比例调整气泡大小是棘手的(面积与半径不成比例);从本质上说,三轴和四轴的图表需要更多的时间来解析,因此不太适合于一目了然的表示
延伸阅读:什么是气泡图?怎样用Python绘制?有什么用?终于有人讲明白了
05 凹凸图
也称为疙瘩图(bumps chart),显示随着时间推移的排名顺序变化的线条。常用来表示受欢迎程度,如每周的票房排名。
优点:表现受欢迎程度、赢家和输家的简单方式
缺点:变化没有统计学意义(值是序数,而不是基数);许多的等级和更多的变化使其具有引人注目的优势,但也可能使其难以追踪观察排名
06 点图
显示沿一根轴线的几个测量值。当重要的不是每根条形的高度而是条形之间的高度差时,常用于代替条形图。
优点:一种在垂直的或水平的狭小空间内都适用的紧凑形式;比传统的形式(条形图)更容易沿着单一的测试方法来进行比较
缺点:由于要绘制的点很多,很难有效地标记;如果这很重要,那就消除了所有类别之间的趋势感
07 流程图
用多边形和箭头表示流程或工作流。通常用于描绘决策,数据如何在系统中移动,或者人们如何与系统交互,例如用户在网上购买产品的过程。(也称为决策树,它是流程图的一种类型。)
优点:形式化的系统,被普遍接受,用于表示具有多个决策点的流程
缺点:必须理解已确定的语法(例如,菱形表示决策点;平行四边形表示输入或输出等规则)
08 地理图
也叫地图,用于表现属于现实世界中位置的值的地图。常用于比较国家或地区之间的值,如显示政治立场的地图。
优点:如果看图者熟悉地理,可以很容易地找到值并在多个层次上对它们进行比较(即同时按国家和地区比较数据)
缺点:使用位置的大小来表示其他值,可能会强化或弱化这些位置中编码的值
09 层次图
用来表示元素集合的关系和相对排名的线和点。通常用来表示某组织的结构,如家庭或公司。(也称为组织结构图、家谱或树形图,所有这些都是层次图的类型。)
优点:一种记录和说明关系与复杂结构的易于理解的方法
缺点:行与方框的方法在显示复杂性方面受到限制;更难显示不那么正式的关系,比如人们如何在公司的层级制度之外合作
10 直方图
基于范围内每个值的出现频率来显示分布情况的条形。常用于显示概率等结果的风险分析模拟。(也被错误地称为条形图,实际上,条形图用于比较类别之间的值,而直方图则显示一个变量的值的分布。)
优点:用来显示统计分布和概率的基本图表类型
缺点:看图者有时会把直方图误认为条形图
延伸阅读:手把手教你用Python画直方图:其实跟柱状图完全不同
11 折线图
显示值如何变化的一些相互连接的点,通常随时间的推移而变化(连续数据)。常用于通过把多条线画在一起来比较趋势,例如几家公司的收入。(也称为体温记录图或趋势线。)
优点:大家都熟悉的形式;非常适合于一目了然地表现趋势
缺点:如果我们重点关注趋势线,将更难看到和探讨离散的数据点;太多的趋势线使得人们很难看到任何单根的线
延伸阅读:什么是折线图?怎样用Python绘制?怎么用?终于有人讲明白了
12 棒棒糖图
类似于点图,但在单个测量值上绘制两个点,用一根线连接,以显示两个值之间的关系。绘制几个棒棒糖图,可以产生类似于浮动条形图的效果,其中的值并不全都固定在同一个点上。(它也被称为双棒棒糖图。)
优点:既适合水平又适合垂直的紧凑的图表形式;当两个变量之间的差异最重要时,非常适合在它们之间进行多次比较
缺点:当变量“翻转”(高值是前一个棒棒糖图中的低值)时,多个棒棒糖图之间的比较可能令人困惑;值相似的多个棒棒糖图,使得评估图中的单个项变得困难
13 隐喻图
箭头、金字塔、圆圈和其他公认的图形,用来表示非统计概念。通常用于表示抽象的想法和流程,如业务周期。
优点:能够简化复杂的想法;由于人们对隐喻的普遍认识,所以显得天生就能理解这种图
缺点:很容易混淆隐喻,误用隐喻,或者过度设计隐喻
14 网络图
连接在一起的节点和线,以显示一个群体中各元素之间的关系。通常用于表示实物之间的相互联系,如计算机或人。
优点:有助于说明节点之间的关系,这些关系在我们采用其他方式时可能很难看出来;突出显示集群和异常值
缺点:网络往往迅速变得复杂起来。有些网络图虽然漂亮,但可能很难解释
15 饼形图
被分成若干部分的圆,每个部分代表某个变量在整个值中所占的比例。通常用于显示简单的总数细分,如人口统计。(也称为甜甜圈图,它是一种以圆环形式显示的变化图。)
优点:无处不在的图表类型;显示主导份额和非主导份额
缺点:人们对扇形楔形块的面积估计得不是很好;如果楔形块过多,将使得值难以区分和量化
16 桑基图
显示值是如何分布和传输的箭头或条形。常用于显示物理量的流动,如能量或人。(也称为流图。)
优点:使人们易于发现系统流程中的细节;帮助识别主要的组成部分和低效的地方
缺点:是一种由包含许多组成部分和流动路径的复杂系统构成的图表
延伸阅读:怎样用Python绘制诱人的桑基图?
17 散点图
对照某一特定数据集的两个变量而绘制的点,表示这两个变量之间的关系。常用于检测和显示相关性,如年龄与收入的关系图。
优点:大多数人都熟悉的基本图表类型;这种空间方法可以很容易地看到相关、负相关、集群和异常值
缺点:很好地表现了相关性,以至于即使相关性并不意味着因果关系,人们也可能做出因果关系的推测
延伸阅读:Python数据可视化:5段代码搞定散点图绘制与使用,值得收藏
18 斜率图
表示值的简单变化的线。通常用来表示剧烈的变化,或与大多数斜率相反的异常值,例如某地区的收入下降,其他所有地区的收入都在上升。(也称为折线图。)
优点:创造了一种简单的之前和之后的叙事,无论是单个值还是许多值的总体趋势,都让人很容易看出和掌握
缺点:排除了两种状态之间值的所有细节;太多纵横交错的线条可能让人很难看到单个值中的变化
19 小型多图
一系列小图表,通常是线形图,显示在同一尺度上测量的不同类别。常用于多次显示简单的趋势,如按国家划分的GDP趋势。(也称为网格图或格状图。)
优点:和将所有的线都叠加在同一个图表中相比,更容易比较多个甚至几十个类别之间的差异
缺点:如果没有戏剧性的变化或差异,就很难在比较中发现其意义;你在单个图表中看到的一些“事件”就会丢失,例如变量之间的交点
20 叠加区域图
也称为区域图,描绘某一随着时间的推移而变化的变量的线条,线条之间的区域用颜色填充,以强调体积或累计总数。通常用于按时间比例显示多个值,例如一年中多个产品的销售量。
优点:能很好地显示出比例随时间的变化;强调体积感或积累感
缺点:太多的“层次”使得每一层都太薄了,以至于很难看到随时间的变化、差异,或者难以追踪观察值的情况
21 叠加条形图
被分成若干部分的矩形,每个部分代表某个变量在整体中的比例。通常用于显示简单的分类汇总,如各地区的销量。(也称为比例条形图。)
优点:有些人认为它是饼形图的一个更好的替代图表;很好地显示主导份额和非主导份额;可以有效地处理比饼形图更多的类别;水平和垂直都适用
缺点:包含太多的类别或者将多个堆积条形组合在一起,可能使你很难看到差异和变化
22 表格
按列和行排列的信息。通常用于跨多个类别显示单个值,如季度财务业绩。
优点:使每个单个的值都可用;与相同信息的单调版本相比,更容易阅读和比较值的情况
缺点:难以对趋势产生粗略的了解,也很难对几组值进行快速比较
23 树形图
被分割成更小矩形的矩形,每个更小矩形代表某个变量与整个值的比例。常用于表示等级比例,如按类别和子类别划分的预算。
优点:显示详细比例分解的紧凑形式;克服了饼形图的许多楔形块的限制
缺点:以细节为导向的形式,不适合快速理解;太多的类别会造成令人震惊但难以解析的视觉效果;通常需要能够精确排列正方形的软件
24 单位图
用于表示与分类变量相关的单个值的集合的点或图标。通常用于显示实物的记录,如花费的金额或者流行病中的患者。(也称为点图。)
优点:以比某些统计演示更加具体、更加形象的方式来表现值
缺点:太多的单元类别可能使你难以将精力集中在核心的意义上;要拥有强大的设计能力,才能使单位的安排最有效
关于作者:斯科特·贝里纳托(Scott Berinato),《哈佛商业评论》高级编辑和、数据分析师、视觉化专家,同时也是一位获奖作家、编辑和内容架构师。他自称为“可视化极客”,喜欢利用可视化的方法解决各类沟通问题。在《哈佛商业评论》任职时,他曾倡导使用视觉传达和讲故事的方法,成功推出了可视化语言。
本文摘编自《用图表说话:职场人士必备的高效表达工具》,经出版方授权发布。
延伸阅读《用图表说话》
点击上图了解及购买
转载请联系微信:DoctorData
推荐语:用图表说话:新的商业沟通语言,职场人士必备技能。《哈佛商业评论》数据可视化专家手把手教你轻松制作清晰简洁、有说服力的图表,沟通复杂问题,做出明智的商业计划和决策。
划重点????
干货直达????
为什么Spark能成为最火的大数据计算引擎?它是怎样工作的?
吐血整理:盘点19种大数据处理的典型工具
10道题搞懂色彩搭配的6大准则,让你的图表开口说话!
学习Numpy,看这篇文章就够啦
更多精彩????
在公众号对话框输入以下关键词
查看更多优质内容!
PPT | 读书 | 书单 | 硬核 | 干货 | 讲明白 | 神操作
大数据 | 云计算 | 数据库 | Python | 可视化
AI | 人工智能 | 机器学习 | 深度学习 | NLP
5G | 中台 | 用户画像 | 1024 | 数学 | 算法 | 数字孪生
据统计,99%的大咖都完成了这个神操作
????