人是地球上最有创造力的物种之一,从古到今,从旧石器时代的洞窟壁画到现代艺术,各种令人难忘的艺术形式。例如,比莫贝卡特石窟洞穴壁画为当时人们的生活提供了如此多的见解。视觉艺术的起源可以追溯到石器时代。
现在,身为第四代工业革命一员的我们,已经见证过关于领域不同、形式不同的艺术和创造力,这里有各种工具和编程语言来拯救我们,以使用可视化艺术解决复杂的业务问题。现代企业使用各种可视化技术来理解数据并从中获得洞察力,从而做出数据驱动的业务决策。如今市面有多种多样的可视化工具,如 Tableau、Power BI、python、Smartbi 等等。在本文中,我们将使用Smartbi智分析介绍各种类型的图表。
数据可视化的必要性
当数据以简单的可视化的形式呈现时,数据便更具有意义并且更容易理解,因为人眼很难从原始数据中得出重要的信息。因此,数据可视化成为了解读数据最重要的方式之一。
各种类型的图表及其用途
**\
**
1.条形图和柱形图
该图表是表现定量领域在各种类别中呈现最为简单的一种,它用于比较。
从上面的柱状图可以看出,技术类的销售额较高,办公用品的销售额最少。
上图是一个条形图,显示 L 类别的表现更好。
2.散点图和气泡图
散点图和气泡图帮助我们了解变量如何分布在所考虑的范围内。它可用于识别异常值的存在以及两个变量之间的关系。
我们可以看到,随着折扣的增加,利润也在减少。
上图是气泡图。
3.折线图
若要呈现出与时间数据相关时,就首选折线图表,它是最为适合分析趋势。
从上图中,我们可以看到销售额在几个月内呈上升趋势,但7月份突然下降,而 11 月份的销售额最高。
4.直方图
直方图是一种频率图,用于记录数据集中某个条目的出现次数,当您想了解某个系列的分布时,它很有用。
5.箱线图
箱线图可以有效地总结大数据的分布。他们使用百分位数来划分数据范围。这有助于我们了解低于或高于所选数据点的数据点。它帮助我们识别数据中的异常值。
箱线图将整个数据分为三类
- 中值——将数据分成相等的两半,取中间值。
*四分位距 – 将所有数值从小到大划分为四等数,在三个分割点上的数值是四分位。
- 离群值 – 该数据存在明显差异并且位于箱线之外。
上图中的圆圈显示了异常值的存在。
6.环形图、饼图和堆积柱形图
当我们要查找数据的组成时,上述图表是最好的。
上面的圆环图显示了不同产品类别的销售构成。
上面的饼图显示了不同年份的销售额百分比。
上面堆叠的柱状图显示了两种产品在不同季度的销售情况。
7.热力地图
当我们想要检查变量之间是否存在相关性时,它是最优选的图表。
这是正相关的,而负相关则是负的。颜色表示相关的强度,颜色越深正相关越高,颜色越浅负相关越高。
使用 Smartbi智分析理解数据可视化
智分析提供了各种图形以方便大家理解数据可视化,让我们开始进入可视化世界的旅程。
某公司是一家电商公司,销售不同种类的产品。让我们探索数据以找出其在一段时间内的销售额,哪个产品类别/子类别的销售额最高。
1、 我们先导入相关的Excel数据源
2、下一步是加载数据集,有了数据集,让我们开始去探索数据吧。
3、使用仪表盘,让便我们对数据集进行可视化的操作。
首先,探索近五年的销售额趋势情况,通过趋势图我们可以看到,2009年的销售额最高:
不同地区的销售额会有所不同。让我们来看看,地图可视化显示销售额最高的省份是广东:
销售数据中有很多大的产品类别,让我们看看不同的产品大类的表现如何。通过环形图我们可以看到,技术产品的销量最高,其次是家具产品等,办公用品的销量最差:
那么产品小类里哪个卖的最好呢?通过条形图并对销量进行排序,我们可以看出纸张的销量是最高的:
我们还可以通过更酷的词云图对产品小类的销量进行呈现:
对同类别的字段进行比较,柱形图是最好的选择了,从下图可以看出,中级客户的销售占比是最高的:
如果需要展示详细的明细数据,我们可以通过清单表的方式对明细表进行呈现:
因此,我们可以说可视化说了很多,它总会有一些故事可以讲述,这有助于企业做出数据驱动的决策。
结论
在本文中,我们讨论了各种图形及其用途。我们处理了一个数据集,以了解如何使用智分析来进行可视化的操作。因此,我们可以说,通过可视化,很容易破译数据中的隐藏模式或趋势。通过几个例子,我们看到图表有助于进行比较,最重要的是它很容易被理解。