python可视化是什么意思_数据可视化究竟是什么意思?

数据可视化可以理解为将单纯的数据通过适合的可视化图表类型表现出来,直观展现数据的变化趋势、峰值、对比等信息,目的是为了辅助决策。

为什么要做数据可视化

在企业的经营管理中,我们通过会遵循“二八原则”,重要的事情往往只占20%,剩下的80%都是次要的但是又不可或缺。

数据也是这样,现在企业做数据分析,动辄就要处理几千万甚至上亿的数据量,即使用再厉害的报表系统做出来,领导也不一定能抓住重点,这时,数据可视化就应运而生。通过可视化图形,可以让决策者抓住数据信息的重点。

不同类型的数据可是阿虎图表如何使用

数据可视化的图表类型包含:柱状图、条形图、折线图、饼环图等多种类型,而不同的类型所对应的应用场景也不尽相同。

01 柱状图

适用场景:适用场合是二维数据集(每个数据点包括两个值X和Y),但只有一个维度需要比较,多用于显示一段时间内的数据变化或显示各项之间的比较情况。

局限性:适用于中小规模的数据集。

优点:能够利用柱子的高度,反映数据的差异;

肉眼对高度差异很敏感,辨识效果非常好。(柱状图合理的用法)

(柱状图不合理的用法)

使用建议:通常来说,柱状图的X轴是时间维度,用户习惯性认为存在时间发展趋势。

如果遇到X轴不是时间维的情况,建议用颜色区分每根柱子,改变用户对时间趋势的关注。

02 条形图

适用场景:二维数据集中有一个维度需要比较。

局限性:分类过多则无法展示数据特点。

优点:对各个时期或时点的数据有直接对比的作用,对其数值大小,一目了然。(按照销量从大到小排序)

(按照时间顺序排序)

使用建议:一般由最大排到最小值,当绘制一段时间内的条形图时,应该从最新的数据点开始排序,然后按时间顺序向后推移。

03 折线图

适用场景:用来观察数据随时间变化的趋势或规律。数据在一个有序的因变量上的变化。特点是反应事物随类别而变化的趋势,可以清晰展现数据的增减趋势、增减的速率、增减的规律、峰值等特征。

局限性:每张图上不适合展示太多折线,否则会容易造成混乱和复杂。

优点:折线图适合二维的大数据集,尤其是那些趋势比单个数据点更重要的场合;

适合多个二维数据集的比较。

04 饼图

适用场景:适用于二维数据,关注简单占比。

局限性:不适合较大的数据集、较多分类的展现;

数据项中不能有负值;

肉眼对面积大小敏感,比如30%和35%在饼图是难以分辨出区别的。

优点:适用于反映某个部分占整体的比重,比如贫穷人口占总人口的百分比。(饼图合理的用法)

(饼图不合理的用法)

(上图的饼图换成柱状图会更清晰)

使用建议:建议饼图分类不超过5个,如果有多个占比小的分类,可以统一归类成“其他”。

05 雷达图

适用场景:适用于展现多维数据集,例如人、货、场、财等多项指标,用于企业经营状况,收益性、生产性、流动性、安全性和成长性等评价分析、或者对客户或员工的评估分析等。

优点:优势是可以同时展示多个指标,从而判断值同一对象指标间的强弱或不同对象相同指标的对比,具有完整、清晰和直观的优点。

使用建议:雷达图只有一个坐标轴,不可能同时显示量纲不同的指标,所以在展示不同量纲或数量级的指标时,需要先去量纲,先标准化处理;

指标不能太多,一般4~8个;

比较的记录条数不宜太多;

指标的排列顺序可以按照值的大小顺序或将相关性高的指标放在一起展

06 地图

适用场景:用于展现数据和空间之间的关系。适合带有地理位置信息的数据集展现,展现的通常是以某个地区为单位的汇总的连续信息。

局限性:必须有地理信息;

地理面积大小和度量值无关,容易误读;

如果用行政气泡图,气泡容易叠加。

优点:和地图向结合,对数据的地理分步显示直观;

可以通过颜色深浅、气泡大小等容易判断度量的大小。

07 漏斗图

概念解释:有多个梯形从上而下叠加而成。从上到下的项有逻辑上的顺序关系,梯形面积表示某个业务量与上一个环节之间的差异。

适用场景:适用于业务流程比较规范、周期长、环节多的单流程单向分析。通过漏斗各环节业务数据的比较能够直观的发现和说明问题所在的环节,进而做出决策。

使用建议:漏斗图总是开始于一个100%的数量,结束于一个较小的数量;

在开始和结束之间由N个流程环节组成,每个环节用一个梯形来表示;

梯形的上底宽度表示当前环节的输入情况,下底表示当前环节的输出,上底与下底之间的差异表现了在当前环节业务量的减小量,当前梯形边的斜率表现了当前环节的减小率;

漏斗图的所有环节的流量都应该使用同一个度量。

08 仪表板图

概念解释:像一个钟表或者可读盘,有刻度和指针,其中刻度表示度量,指针表示维度,指针角度表示数值,指针指向当前数值。

适用场景:管理报表或报告,直观的表现出某个指标的进度或实际情况。

也不宜过多,展示信息有限。

优点:适用于场景比较窄,主要用于进度或占比的展现。

使用建议:适用于场景比较窄,主要用于进度或占比的展现;

只能一个维度,指标也不宜过多,展示信息有限。

09 散点图

适用场景:主要解释数据之间的规律,将数据以点的形式展现,以显示变量间的相互关系或者影响程度,点的位置由变量的数值决定。

局限性:散点图看上去比较乱,基本上只能看相关、分布和聚合,其他信息均不能很好展现。

优点:可以展示数据的分布和聚合情况;

适合展示较大的数据集。

10 桑基图

适用场景:主要解释数据之间的规律。揭示数据复杂变化趋势,可以一对多或者多对一;它常表示信息的变化和流动状态。比如,用于电商与营销有关的分析:分析购物网站中,哪些商品最畅销或者哪一个时间段是访问高峰。

局限性:应用面很窄,只能显示三级维度的流程数据;

对显示的度量要求严格。

优点:特别适合分析展现网站流量的运营数据;

显示结果直观,可以清晰的看到各个维度指标变化的情况;

支持以某个节点查看该节点所在流程的情况。

多讲一点:桑基图主要由边和节点组成,边代表了流动的数据,流量代表了流动数据的具体数值,节点代表了不同分类。边的宽度与流量成比例的显示,边越宽标示数值越大。桑吉图的特点是“能量守恒”,数据从开始到结束,总量都保持不变。

11 词云

适用场景:做用户画像,对用户进行聚类,实现精细化营销。适合用于描述网站上的关键字(即标签),或可视化自由格式文本,可以对比文字的重要程度。其本质是点图,是在相应坐标点绘制具有特定样式的文字的结果。

局限性:不适合展现数据太少的数据集;

不适展现区分度不大的数据,即无重点关键词。

优点:快速感知最突出的文字,或区别权重不同的文字;

可展示大量文本。

12 矩形树图

适用场景:适合展现具有层级关系的数据,能够直观体现同级之间的比较。比如各类电商的SKU。

局限性:不够直观、明确、不像树图那么清晰

分类占比太小时不容易排布

优点:图形更紧凑,同样大小的画布可以展现更多的信息;

可以展现类别间的权重。

你可能感兴趣的:(python可视化是什么意思)