统计学--1.基础图形

简述

统计最终需要以图形的形式来向别人展示数据结果,常用的展示数据的图形有饼图,条形图,直方图,线图(里面包含很多图,我不规范的统称为线图,以后再补充)。每个图在下面会有一个模块,来说明这个图形的优点和缺点。这样在数据的展示时,我们可以有依据的选择图形来让别人更直观的看出结果。

饼图

当我们对不同组,或者类所占比例进行比较的时候,我们可以选择用饼图。饼图的优点是可以很快的看出数据占比的多少。缺点是当占比很均匀时,不建议用饼图,因为很难看出占比的多少。例子如下:

优质的饼图

在上图中,提到了频数,频数的概念也给出来。频数就是特定数组中对象的数目,例如体育模块的频数就是27,500
劣质的饼图

以上有两个饼图,一个优质,一个劣质。优质的饼图很容易看出比例,劣质的饼图无法一眼看出比例。接下来是条形图。

条形图

条形图相比饼图,更加方便比较大小并且更加精确,有水平和垂直两种。刚刚劣质饼图所不能看出的数据,可以用条形图充分的显示出来,如下图。条形图每一条是一个类,长方形的长度可以是频数也可以是百分数,下图就是用的百分数。另外当种类的名称很长时,推荐用水平条形图,可以有大量的位置去显示每个类的名称。

条形图

P.S只有百分数或者只有频数,都可能隐藏数据的真实性,例如占比90%,其实数据总共才调查了5人,完全无法说明问题。再例如只有频度,有10000人喜欢电子游戏,如果没有占总体百分比,是无法知道这一万人在总体数据中是大多数还是少数。

直方图

当我们需要分组统计数据的时候例如我想看到玩家玩儿游戏的时间,下图为玩家的游戏时间:

玩家游戏时间

此时我们可以应用直方图来显示结果。直方图可以看到频数密度,即某个区间中的数据密集度。直方图的高度为:频数/长方形宽度
在这个例子里,长方形宽度就是每个组的小时数,频数代表有多少玩家。所以我们计算出相应的直方图的高度,如下图:
image.png

然后绘制相应的直方图:
直方图

基础图形就先写这些,以后慢慢补,也算是自己的笔记了。文章参考深入浅出统计学,图也是从里面拿的,希望别再忘了,所以就整理成笔记了。

你可能感兴趣的:(统计学--1.基础图形)