数据分析-多因子探索分析理论铺垫

多因子探索分析理论铺垫

  • 假设检验与方差检验
  • 相关系数:皮尔逊、斯皮尔曼
  • 回归:线性回归
  • PCA与奇异值分解

假设检验: 

  • 1.建立原假设Ho(包括等号),Ho的反命题为H1,也叫备择假设
  • 2.选择检验统计量
  • 3.根据显著水平(一般为0.05),确定拒绝域
  • 4.计算P值或样本统计值,作出判断

数据分析-多因子探索分析理论铺垫_第1张图片

卡方检验:一个样本样本内部比较

假设化妆这个行为不分男女,用卡方检验检验该假设

数据分析-多因子探索分析理论铺垫_第2张图片 数据分析-多因子探索分析理论铺垫_第3张图片
129.3 > 3.841 ,在拒绝区,故假设不成立,即化妆分性别

方差检验(F检验):

现有三种电池,假设三种电池之间平均值没有差异

数据分析-多因子探索分析理论铺垫_第4张图片

数据分析-多因子探索分析理论铺垫_第5张图片

数据分析-多因子探索分析理论铺垫_第6张图片

数据分析-多因子探索分析理论铺垫_第7张图片

结论,假设不成立,三种电池之间均值是有差异的。



相关系数(越大越接近于1,数据变大的趋势正向同步;越小越接近于负1,数据一个变大,另一个变小;趋近于0,则两者没有关系)(均价与订单量):

皮尔逊(Pearson)相关系数:

数据分析-多因子探索分析理论铺垫_第8张图片

斯皮尔曼相关系数(运用于相对比较的情况):

数据分析-多因子探索分析理论铺垫_第9张图片



线性回归:

回归:确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。

数据分析-多因子探索分析理论铺垫_第10张图片

数据分析-多因子探索分析理论铺垫_第11张图片


PCA(主成分分析:可用来降维):

  • 1.求特征协方差矩阵
  • 2.求协方差的特征值和特征向量
  • 3.将特征值按照从大到小的顺序排序,选择其中最大的k个
  • 4.将样本点投影到选取的特征向量上
数据分析-多因子探索分析理论铺垫_第12张图片

奇异值分解(SVD):

数据分析-多因子探索分析理论铺垫_第13张图片


你可能感兴趣的:(数据分析)