数据分析-spss5.10

今日课程内容

  • 内容回顾

  • 作业讲解

  • 描述分析

    描述性统计

    交叉表制作

    异常值检验

  • 推断统计

内容回顾

描述性统计
1.统计数据的基本概念
   统计数据的分类:分类数据、顺序数据、数值型数据
   统计量:
        集中趋势:均值、众数、中位数、四分位数
        离散程度:极差、四分位差、异众比率、方差、标准差
        分布描述:峰度、偏度
             左偏
             右偏
             平坦
             尖峰
2.频率、频数分析                

作业讲解

1.对员工信息表的学历和级别做交叉表分析,查看结果(收入)。
  描述分析-交叉表(学历-级别)
    对收入进行个案加权
2.分析公司网络数据报表按照每旬的日消费和主产品收入,查看结果
   先对数据按照月旬进行分组
   再对日消费和主产品收入进行描述分析

描述性统计

1、Z-标准化
	公式:数据与平均数的差值除以标准差的过程。z=(数据-均值)/标准差
    作用:对比数据,发现数据的异常(-3 ~ 3

推断统计

推断统计是研究如何利用样本数据来推断总体特征的统计方法:
    1.假设检验
    2.参数检验
    3.非参数检验


基本概念:
    总体
    样本
    总体参数:包括总体均值、总体标准差...
    统计量:样本统计量
    通过样本统计量推断出总体参数。
    
推断统计数:
   参数估计
       利用样本统计量推断总体参数,总体参数在推断之前是未知的。
   假设检验
       总体参数已知,通过样本结果来验证总体参数的正确性。
   假设检验分为:
       T检验
       非参数检验

参数估计:
   点估计:统计量代表总体参数
   区间估计:在点估计的基础上,给出范围,该范围称为置信范围,通过参照总体数据在置信范围的
比例,称为置信水平,或置信度(置信系数)

参数检验VS非参数检验
  参数检验是已知分布,对参数进行假设
  非参数检验总体分布未知,对分布进行假设

假设检验:
    零假设:H0(你想反对的结果)
    对立假设:Ha(你想看到的结果)
   # 案例:中国人的身高为180
    零假设:H0=180
    对立假设:Ha不等于180
    对立假设分为:单尾检验、双尾检验
    
    # 中国人的平均工资是3500
    H0 = 3500
    Ha不等于3500
    
假设检验的操作
1.先提出零假设
2.计算发生的概率P值
3.p值在(1-5)%之间,假设不成立,推翻原命题。
#############################
1、假设检验-平均值检验
案例:检验数据-9月和10月的数据有没有差异。

练习:检验数据上旬-中旬-下旬的数据是否有差异

2、单样本T检验
推断样本与指定检验值是否有差异

3、两独立样本T检验
检验2个样本之间是否存在显著差异

作业

1.检验大悦城数据,通过单样本T检验,检验今年的数据值。
推断样本与检验值是否有差异
2.通过样本数据检验,新药对比常药要是否有效。
检验新药与旧药之间是否存在显著差异,判断新药的有效性

你可能感兴趣的:(笔记)