商业数据分析【七】数理统计与SPSS统计

T检验

  单样本t检验
  前提条件:
  1)数据是连续变量,不可以是离散的;
  2)相互独立;
  3)不存在显著的异常值;
  4)变量接近正态分布。

  检验是否是正态分布
商业数据分析【七】数理统计与SPSS统计_第1张图片
  在实际问题中,更关心偏度。
在这里插入图片描述
在这里插入图片描述

下图中可发现不是正态分布商业数据分析【七】数理统计与SPSS统计_第2张图片
  正态性检验,一般关注显著性,小于0.05,就表示异常,不是正态检验
在这里插入图片描述
  Q-Q图(150个数据以下,不建议看QQ图)
商业数据分析【七】数理统计与SPSS统计_第3张图片
  不是正态分布,需要整理数据,去除异常值,进行单样本t检验
商业数据分析【七】数理统计与SPSS统计_第4张图片
  检验平均值是否是4
商业数据分析【七】数理统计与SPSS统计_第5张图片
商业数据分析【七】数理统计与SPSS统计_第6张图片

  独立样本T检验
  1. 样本是连续变量
  2. 样本分为2组;
  3. 每组是独立分布的;
  4. 没有异常值;
  5. 组内接近正态分布;
  6. 2组的方差相等

  检验正态分布
商业数据分析【七】数理统计与SPSS统计_第7张图片
观察峰度和偏度,满足正态分布
商业数据分析【七】数理统计与SPSS统计_第8张图片
  独立样本T检验
商业数据分析【七】数理统计与SPSS统计_第9张图片
  莱文方差等同性检验,只要看显著性,显著性大于0.05,即可接受通过,认为两组样本的方差是一致的;平均值等同性t检验,Sig的值小于0.05,拒绝原假设
商业数据分析【七】数理统计与SPSS统计_第10张图片

  配对样本t检验

  对同一个运动员服用某种能量前后的运动成绩,先计算前后的差值,检验是否满足正态分布
商业数据分析【七】数理统计与SPSS统计_第11张图片
商业数据分析【七】数理统计与SPSS统计_第12张图片
商业数据分析【七】数理统计与SPSS统计_第13张图片
  检验通过正态检验

商业数据分析【七】数理统计与SPSS统计_第14张图片
商业数据分析【七】数理统计与SPSS统计_第15张图片
  成对样本T检验
商业数据分析【七】数理统计与SPSS统计_第16张图片
商业数据分析【七】数理统计与SPSS统计_第17张图片
  相关性的显著性小于0.05,表示两组数据相关;配对样本检验中Sig小于0.05,拒绝原假设
商业数据分析【七】数理统计与SPSS统计_第18张图片

方差分析

  1. 因变量连续;
  2. 组数在2组以上,组内,组件相互独立;
  3. 无明显异常值;
  4. 每组是否满足正态分布;
  5. 方差齐性检验。
  单因素方差分析

  检验员工抗压能力与个人运动习惯的关系
商业数据分析【七】数理统计与SPSS统计_第19张图片  显著性都大于0.05,满足正态分布
商业数据分析【七】数理统计与SPSS统计_第20张图片
  单因素ANOVA检验
商业数据分析【七】数理统计与SPSS统计_第21张图片商业数据分析【七】数理统计与SPSS统计_第22张图片
商业数据分析【七】数理统计与SPSS统计_第23张图片
商业数据分析【七】数理统计与SPSS统计_第24张图片
商业数据分析【七】数理统计与SPSS统计_第25张图片  显著性小于0.05,说明其中至少两组间存在显著差异
商业数据分析【七】数理统计与SPSS统计_第26张图片
商业数据分析【七】数理统计与SPSS统计_第27张图片

  两因素方差分析

   调查男女性别以及受教育程度,对其政治兴趣关注度的影响
商业数据分析【七】数理统计与SPSS统计_第28张图片
商业数据分析【七】数理统计与SPSS统计_第29张图片
商业数据分析【七】数理统计与SPSS统计_第30张图片
商业数据分析【七】数理统计与SPSS统计_第31张图片
  利用残差,将数据分为6组,SPPS平台只能对分组的数据进行正态检验
商业数据分析【七】数理统计与SPSS统计_第32张图片
商业数据分析【七】数理统计与SPSS统计_第33张图片
  拆分数据
商业数据分析【七】数理统计与SPSS统计_第34张图片
  根据性别和受教育程度分组
商业数据分析【七】数理统计与SPSS统计_第35张图片
  利用残差做因变量
商业数据分析【七】数理统计与SPSS统计_第36张图片
  满足正态分布
商业数据分析【七】数理统计与SPSS统计_第37张图片
  多因素分析
商业数据分析【七】数理统计与SPSS统计_第38张图片
商业数据分析【七】数理统计与SPSS统计_第39张图片

  报告一般需要的内容
  1. 均值 ± \pm ± 标准差;
  2. 箱式图检测异常值;
  3. 夏皮洛检验正态性;
  4. 莱文方差齐性检验检测是否等方差
  5. 观察数据,给出分析

示例

药物 生存 死亡 合计 病死率(%)
A 187 11 198 5.56
B 36 6 42 14.29
合计 223 17 240  

  新建数据集,输入变量视图
商业数据分析【七】数理统计与SPSS统计_第40张图片
在这里插入图片描述
  输入数据视图
在这里插入图片描述
  进行个案加权
商业数据分析【七】数理统计与SPSS统计_第41张图片
商业数据分析【七】数理统计与SPSS统计_第42张图片
  使用交叉表
商业数据分析【七】数理统计与SPSS统计_第43张图片
商业数据分析【七】数理统计与SPSS统计_第44张图片
商业数据分析【七】数理统计与SPSS统计_第45张图片
商业数据分析【七】数理统计与SPSS统计_第46张图片
  卡方检验
  1. 总例数≥40,期望频数≥5,pearson结果;
  2. 总例数≥40,期望频数≥1且<5, χ 2 \chi^2 χ2检验,需要进行连续性校正,continuity correction 结果;
  3. 总例数≥40,至少两个期望频数≥1且<5,Fishers exact Test结果;
  4. 总例数<40或有期望频数<1,Fishers exact Test结果。
  观察A,B两种药物,1<3<5,看连续性修正的结果,0.095>0.05,即A,B两药无显著差异。
商业数据分析【七】数理统计与SPSS统计_第47张图片
  结论:A,B效果不同,但差异无统计学意义。

线性回归

  判断2个变量之间的关系,一个预测另一个;
  1. 自变量和因变量是连续的;
  2. 自变量和因变量之间存在线性关系;
  3. 观测值相互独立⇿残差不存在自相关;
  4. 因变量没有显著异常值;
  5. 残差满足方差齐;
  6. 残差近似正态分布。

  线性回归
商业数据分析【七】数理统计与SPSS统计_第48张图片
商业数据分析【七】数理统计与SPSS统计_第49张图片
商业数据分析【七】数理统计与SPSS统计_第50张图片
  德宾沃森是检测残差是否存在自相关;其分布在0~4之间,越接近2,观测值相互独立的可能性越大;
商业数据分析【七】数理统计与SPSS统计_第51张图片
  异常值检测,标准残差一般在3以下;删除异常值
商业数据分析【七】数理统计与SPSS统计_第52张图片
  报告内容:
  1. 绘制散点图,粗略判断线性关系;
  2. 残差散点图,直方图,残差方差齐,近似正态分布;
  3. 修正异常值

你可能感兴趣的:(商业数据分析,数据分析,统计学,python,spss,fisher精确检验)