数据可视化图表总结(一)

目录

一、点阵图表

二、点数图

 三、弧线图

 四、 折线图

五、平行坐标图 

六、网络图 

七、象形图 

八、直方图 

 九、密度图

 十、人口金字塔

十一、条形图

十二、多组条形图

 十三、堆叠式条形图

十四、不等宽柱状图     

 十五、面积图

十六、比例面积图

十七、堆叠式面积图 

 十八、量化波形图

十九、雷达图

二十、桑基图 

二十一、平行集合图

二十二、误差线 

二十三、树形结构图 

 二十四、圆堆积图

二十五、饼图 

二十六、圆环图 

 二十七、南丁格尔玫瑰图

二十八、旭日图

二十九、螺旋图

三十、径向条形图 


一、点阵图表

        点阵图表 (Dot Matrix Chart) 以点为单位显示离散数据,每种颜色的点表示一个特定类别,并以矩阵形式组合在一起。

        适合用来快速检视数据集中不同类别的分布和比例,并与其他数据集的分布和比例进行比较,让人更容易找出当中模式。

        数据可视化图表总结(一)_第1张图片

二、点数图

         点数图 (Point & Figure Charts)也称为「P&F 图」,使用由 X 和 O 符号组成的一系列方格来显示特定资产的供需关系。

        这种图表与时间无直接关系,主要集中看资产的过滤价格表现;它也不会显示交易量,其目的只是显示任何供需关系上的变化,称为「突破」(breakouts)。

        数据可视化图表总结(一)_第2张图片

 三、弧线图

        弧线图 (Arc Diagram) 是二维双轴图表以外另一种数据表达方式。在弧线图中,节点将沿着 X轴放置,然后再利用弧线表示节点与节点之间的连接关系。

        弧线图适合用来查找数据共同出现的情况。但缺点是:不能如其他双轴图表般清楚显示节点之间的结构和连接,而且过多连接也会使图表难于阅读。

        数据可视化图表总结(一)_第3张图片

 四、 折线图

        折线图用于在连续间隔或时间跨度上显示定量数值,最常用来显示趋势和关系。

        此外,折线图也能给出某时间段内的「整体概览」,看看数据在这段时间内的发展情况。

        数据可视化图表总结(一)_第4张图片

五、平行坐标图 

        平行坐标图 (Parallel Coordinates Plots) 能显示多变量的数值数据,最适合用来比较同一时间的多个变量,并展示它们之间的关系。

        当数据密集时,平行坐标图容易变得混乱、难以辨认。解决办法是通过互动技术,突出显示所选定的一条或多条线,同时淡化所有其他线条,让我们能更集中研究感兴趣的部分,并滤除干扰数据。

        数据可视化图表总结(一)_第5张图片

六、网络图 

        也称为「网络地图」或「节点链路图」,用来显示事物之间的关系类型。

         这些节点通常是圆点或小圆圈,但也可以使用图标。

        网络图主要有分别为「不定向」和「定向」两种。不定向网络图仅显示实体之间的连接,而定向网络图则可显示连接是单向还是双向(通过小箭头)。

        网络图数据容量有限,并且当节点太多时会形成类似「毛球」的图案,使人难以阅读。

        数据可视化图表总结(一)_第6张图片

七、象形图 

        象形图 (Pictogram Chart) 也称为「象形统计图」,使用图案来显示数据量。

        使用图案能克服语言、文化和教育水平方面的差异,是更具代表性的数据显示方法。举个例子,如果数据是「5 辆车」,图中便会显示 5 个汽车图案。

        数据可视化图表总结(一)_第7张图片

八、直方图 

        直方图适合用来显示在连续间隔或特定时间段内的数据分布,有助于估计数值集中位置、上下限值以及确定是否存在差距或异常值;也可粗略显示概率分布。

        数据可视化图表总结(一)_第8张图片

 九、密度图

        密度图 (Density Plot) 又称为「密度曲线图」,用于显示数据在连续时间段内的分布状况。

        这种图表是直方图的变种,使用平滑曲线来绘制数值水平,从而得出更平滑的分布,并且它们不受所使用分组数量的影响,所以能更好地界定分布形状 。

        数据可视化图表总结(一)_第9张图片

 十、人口金字塔

        人口金字塔 (Population Pyramid) 也称为「年龄性别金字塔」,是彼此背靠背的一对直方图,显示所有年龄组和男女人口的分布情况。

        人口金字塔最适合用来检测人口模式的变化或差异。多个人口金字塔放在一起更可用于比较各国或不同群体之间的人口模式。

        数据可视化图表总结(一)_第10张图片

十一、条形图

         条形图 (Bar Chart) 也称为「棒形图」或「柱形图」,采用水平或垂直条形(柱形图)来比较不同类别的离散数值。

        图表其中一条轴代表要比较的具体类别,另一条则用作离散数值的标尺。

        条形图的离散数据是分类数据,针对的是单一类别中的数量多少,而不会显示数值在某时间段内的持续发展。

        数据可视化图表总结(一)_第11张图片

十二、多组条形图

        多组条形图也称为「分组条形图」或「复式条形图」,是条形图的变种。

        多组条形图通常用来将分组变量或类别与其他数据组进行比较,也可用来比较迷你直方图,每组内的每个条形将表示变量的显著间隔。

        但缺点是,当有太多条形组合在一起时将难以阅读。

        数据可视化图表总结(一)_第12张图片 

 十三、堆叠式条形图

        跟多组条形图不同,堆叠式条形图 (Stacked Bar Graph) 将多个数据集的条形彼此重迭显示,适合用来显示大型类别如何细分为较小的类别,以及每部分与总量有什么关系。

        堆叠式条形图共分成两种:                   

                简单堆叠式条形图。将分段数值一个接一个地放置,条形的总值就是所有段值加在一起,适合用来比较每个分组/分段的总量。

                100% 堆叠式条形图。会显示每组占总体的百分比,并按该组每个数值占整体的百分比来绘制,可用来显示每组中数量之间的相对差异。

        数据可视化图表总结(一)_第13张图片

十四、不等宽柱状图     

        不等宽柱状图 (Marimekko Chart)也称为「马赛克图」,用来显示分类数据中一对变量之间的关系,原理类似双向的 100% 堆叠式条形图,但其中所有条形在数值/标尺轴上具有相等长度,并会被划分成段。

        不等宽柱状图的主要缺点在于难以阅读,特别是当含有大量分段的时候。此外,我们也很难准确地对每个分段进行比较,因为它们并非沿着共同基线排列在一起。

        因此,不等宽柱状图较为适合提供数据概览。

        数据可视化图表总结(一)_第14张图片

 十五、面积图

         面积图 (Area Graph) 是折线图的一种,但线下面的区域会由颜色或纹理填满

        跟折线图一样,面积图可显示某时间段内量化数值的变化和发展,最常用来显示趋势,而非表示具体数值。

        两种较常用的面积图是分组式面积图和堆叠式面积图。分组式面积图在相同的零轴开始,而堆叠式面积图则从先前数据系列的最后数据点开始。

        数据可视化图表总结(一)_第15张图片

十六、比例面积图

         非常适合用来比较数值和显示比例(尺寸、数量等),以便快速全面地了解数据的相对大小,而无需使用刻度。

        比例面积图通常使用正方形或圆形,常见技术错误是,使用长度来确定形状大小,而非计算形状中的空间面积,导致数值出现指数级的增长和减少。

        数据可视化图表总结(一)_第16张图片

十七、堆叠式面积图 

        堆叠式面积图 (Stacked Area Graph) 的原理与简单面积图相同,但它能同时显示多个数据系列,每一个系列的开始点是先前数据系列的结束点

        堆叠式面积图使用区域面积来表示整数,因此不适用于负值。总的来说,它们适合用来比较同一间隔内多个变量的变化。

        数据可视化图表总结(一)_第17张图片

 十八、量化波形图

        这种图表是堆叠式面积图的一种变体,但其数值并非沿着固定直线轴来绘制,而是围绕着不断变化的中心基线

        通过使用流动的有机形状,量化波形图 (Stream Graph) 可显示不同类别的数据随着时间的变化,这些有机形状有点像河流,因此量化波形图看起来相当美观。

        在量化波形图中,每个波浪的形状大小都与每个类别中的数值成比例。与波形图平行流动的轴用作时间刻度。我们也可以用不同颜色区分每个类别,或者通过改变色彩来显示每个类别的附加定量值。

        此外,当他们以互动形式展示时,比静态或印刷出来更有效率。

        数据可视化图表总结(一)_第18张图片

十九、雷达图

         雷达图 (Radar Chart) 又称为「蜘蛛图」、「极地图」或「星图」,是用来比较多个定量变量的方法,可用于查看哪些变量具有相似数值,或者每个变量中有没有任何异常值。

        此外,雷达图也可用于查看数据集中哪些变量得分较高/低,是显示性能表现的理想之选。

        每个变量都具有自己的轴(从中心开始)。所有的轴都以径向排列,彼此之间的距离相等,所有轴都有相同的刻度。轴与轴之间的网格线通常只作指引用途。每个变量数值会画在其所属轴线之上,数据集内的所有变量将连在一起形成一个多边形。

        数据可视化图表总结(一)_第19张图片

二十、桑基图 

        桑基图 (Sankey Diagram) 用来显示流向和数量。

        在每个流程阶段中,流向箭头或线可以组合在一起,或者往不同路径各自分开。我们可用不同颜色来区分图表中的不同类别,或表示从一个阶段到另一个阶段的转换。

        数据可视化图表总结(一)_第20张图片

二十一、平行集合图

        平行集合图与桑基图类似,都显示流程和比例,但平行集合图不使用箭头,它们在每个所显示的线集 (line-set) 划分流程路径。

        每个线集对应于一个维度/数据集,其数值/类别由该线集内的不同线段所表示。每条线的宽度和流程路径,均由类别总数的比例份数所决定。每条流程路径都可以用不同颜色代表,以显示和比较不同类别之间的分布。 

        数据可视化图表总结(一)_第21张图片

二十二、误差线 

        误差线可以作为一项增强功能来显示数据变化,通常用于显示范围数据集中的标准偏差、标准误差、置信区间或最小/最大值。

        误差线总是平行于定量标尺的轴线,可以是垂直或水平显示(取决于定量标尺是在 Y 轴还是 X 轴上)。

        数据可视化图表总结(一)_第22张图片

二十三、树形结构图 

        树状结构图 (Treemap) 是一种利用嵌套式矩形显示层次结构的方法,同时通过面积大小显示每个类别的数量。

        每个类别会获分配一个矩形区域,而其子类别则由嵌套在其中的小矩形代表。当不同数量被分配到各个类别时,这些矩形的面积大小会与此数量成正比显示。

        Ben Shneiderman 最初开发树状结构图用来在计算机上显示大量文件目录,而不会占用太多屏幕空间,因此树状结构图是一种紧凑而且节省空间的层次结构显示方式,可让人快速了解结构。

        数据可视化图表总结(一)_第23张图片

 二十四、圆堆积图

        圆堆积 (Circle Packing) 也称为「圆形树结构图」,是树形结构图的变体,使用圆形(而非矩形)一层又一层地代表整个层次结构。

        每个圆形的面积也可用来表示额外任意数值,如数量或文件大小。我们也可用颜色将数据进行分类,或通过不同色调表示另一个变量。

        虽然圆堆积看起来漂亮,但不及树形结构图般节省空间(因为圆圈内会有很多空白处),可是它实际上比树形结构图更能有效显示层次结构。

        数据可视化图表总结(一)_第24张图片

二十五、饼图 

        饼形图 (Pie Chart) 把一个圆圈划分成不同比例的分段,以展示各个类别之间的比例

        饼形图适合用来快速展示数据比例分布,但主要缺点是:不能显示太多项目、通常需要图例说明、不能准确比较。

        数据可视化图表总结(一)_第25张图片

二十六、圆环图 

        圆环图 (Donut Chart) 基本上就是饼形图,只是中间的部分被切掉

        不过,圆环图还是比饼形图略有优势,它让人不再只看「饼」的面积,反面更重视总体数值的变化:专注于阅读弧线的长度,而不是比较「饼与饼」之间的比例不同。

        另外,圆环图中间的空白处更可以用来显示其他信息,因此更能节省空间。

        数据可视化图表总结(一)_第26张图片

 二十七、南丁格尔玫瑰图

        南丁格尔玫瑰图 (Nightingale Rose Charts) 又称为「极面积图」

        在南丁格尔玫瑰图中,代表数值的是分段面积,而不是其半径。

        数据可视化图表总结(一)_第27张图片

二十八、旭日图

        也称为「多层饼形图」或「径向树图」,通过一系列的圆环显示层次结构,再按不同类别节点进行切割。 

        数据可视化图表总结(一)_第28张图片

二十九、螺旋图

        也称为「时间系列螺旋图」,沿阿基米德螺旋线 (Archimedean spiral) 画上基于时间的数据。

        图表从螺旋形的中心点开始往外发展。螺旋图十分多变,可使用条形、线条或数据点,沿着螺旋路径显示。

        螺旋图很适合用来显示大型数据集,通常显示长时间段内的数据趋势,因此能有效显示周期性的模式

        数据可视化图表总结(一)_第29张图片

三十、径向条形图 

        径向条形图是在极坐标系上绘制的条形图。

        虽然看起来很美观,但径向条形图上条形的长度可能会被人误解。

        数据可视化图表总结(一)_第30张图片

关注公众号:可以叫我才哥详解

数据可视化图表总结(一)_第31张图片

 

你可能感兴趣的:(#,读书笔记,数据分析,数据可视化)