Excel操作:分析工具库

Excel数据分析工具,相比于主流的专业统计分析软件SPSS、SAS,
其优势如下:

  • 与Excel无缝结合,操作简单,容易上手;
  • 聚合多种统计函数,其中部分工具在生成输出结果表格时,同时还能生成相应图表,有助于对统计结果的理解;
  • 使用这个现成的数据分析工具,不尽快与提高分析效率,还能够大幅度降低出错的概率。

劣势如下:

  • 数据处理量有限;
  • 只能处理简单的统计分析,如果是大型数据或复杂的统计分析,还是需要使用专业的统计分析软件。

一、安装分析工具库

  1. 在Excel选项,中,选择加载项,在管理下拉框中,选择“Excel加载项”;
  2. 在弹出的【Excel选项】对话框中,单击【加载项】,在【管理】下拉框中,选择“Excel加载项”;

Excel操作:分析工具库_第1张图片
3.单击【转到】按钮,Excel会弹出【加载宏】对话框,勾选需要安装的加载宏——【分析工具库】,若要包含分析工具库的VBA函数,则同事勾选【分析工具库——VBA】,单击【确认】按钮,即可完成加载按照;
Excel操作:分析工具库_第2张图片
4. 安装 成功后,在【数据】选项卡中,即可看到【数据分析】按钮,单击此按钮,即可提出【数据分析】对话框。
Excel操作:分析工具库_第3张图片

如之前所述,实现数据分析三大作用的分析方法归纳起来主要有两大类:

  • 描述性统计分析
  • 推断性预测分析

Excel操作:分析工具库_第4张图片

数据分析的三大作用:

  • 现状分析
  • 原因分析
  • 预测分析

二、描述性统计分析

描述性统计分析是统计分析的第一步,描述统计分析的常用指标主要有平均数、中位数、众数、标准差、方差等,提供分析对象数据的集中程度和离散程度等信息。

我们以某公司“用户消费数据”为例,利用用户消费金额这个变量来描述用户消费行为特征,分析了解用户消费分布。通过Excel分析工具库——描述统计

操作步骤如下:

  1. 单击【数据】选项卡中的【数据分析】按钮,选择【描述统计】;
    Excel操作:分析工具库_第5张图片
  2. 在弹出【描述统计】对话框中,对各类参数分别进行如下设置:
    Excel操作:分析工具库_第6张图片

针对对话框的各个选项说明如下:

  • 输入区域:输入需要分析的数据源区域(对话框参数虎自动设置为单元格绝对引用);
  • 分组方式:选择分组方式,如果需要指出【输入区域】中的数据是按行还是案列排列,根据需要选择“逐行”或“逐列”;
  • 标志位于第一行:若数据源区域第一行含有标志(字段名、变量名),则应勾选;
  • 输出区域:可选当前工作表的某个活动单元格、新工作表组或新工作簿;
  • 汇总统计:包含平均值、标准误差、中位数、众数、标准差、方差、峰度、偏度、区域、最小值、最大值、求和、观测数等相关指标;
  • 平均数置信度:置信度也成为可靠度,或置信水平、置信系数,是指总体参数值落在样本统计值某一区内的概率,常用的置信度为95%或90%;
  • 第K大(小)值:表示输入数据组的第几位最大(小)值。

输出结果如下:

Excel操作:分析工具库_第7张图片
通过以上分析,我们可以得知用户的消费能力,例如这些用户平均消费金额为5097.96元,用户的最高消费金额达到8886元,最低消费金额仅为1044元。

接下来可以对用户消费能力详细解析:

  1. 表现数据集中趋势的指标有:平均值、中位数、众数。
    • 平均值是N个数据相加除以N,所得到的结果;
    • 中位数是一组数据按大小排序,排在中间位置的数据;
    • 众数是该组数据中次数出现最多的那个数值。
  2. 描述数据离散程度的指标有:方差与标准差,他们反映的是与平均值之间的离散程度。
  3. 呈现数据分布形状的指标有:峰度系数于偏度系数。

峰度系数是描述对称分布曲线峰顶尖峭程度的指标,是相对于正态分布而言的。峰度系数>0,两侧极端数据较少,比正态分布更高更瘦,呈尖峭峰分布;峰度系数<0,表示两侧极端数据较多,比正态分布更矮更胖,呈平阔峰分布。如下图所示:
![在这里插入图片描述](https://img-blog.csdnimg.cn/20200516182213745.png?
偏度系数是以正态分布为标准来描述数据对称性的指标。偏度系数=0,就是分布对称;如果频数分布的高峰向左偏移(偏度系数>0),长尾向右侧眼神称为正偏态分布;同样的,如果频数分布的高峰向右偏移(偏度系数<0),长尾向左眼神则称为负偏态分布。偏度系数大于1或小于-1,被称为高度偏态分布;偏度系数在0.5-1或-0.5~-1范围内,被认为是中等偏态分布;偏度系数越接近0,偏斜程度就月底。如下图所示:

你可能感兴趣的:(数据分析,excel)