统计学基础13-回归分析

文章目录

  • 一. 相关系数
    • 1.1 关系
    • 1.2 相关系数概述
    • 1.3 相关系数公式
    • 1.4 相关系数r的性质
    • 1.5 可解释变异 r 2 r^2 r2
    • 1.6 常见错误
    • 1.7 相关系数
  • 二. 回归模型
    • 2.1 一元线性回归模型
      • 2.1.1 如何确定参数
      • 2.1.2 回归系数显著性检验
      • 2.1.3 回归诊断-残差图
    • 2.2 多元线性回归模型
  • 三. 虚拟变量
  • 参考:

一. 相关系数

1.1 关系

关系分为两种:

  1. 函数关系
    确定关系,例如: y=3+10*x

  2. 相关关系
    非确定关系
    统计学基础13-回归分析_第1张图片

1.2 相关系数概述

我们使用相关系数这一指标去衡量两个变量之间的线性关系程度。
统计学基础13-回归分析_第2张图片

统计学基础13-回归分析_第3张图片

1.3 相关系数公式

要求:

  1. 成为数据(x,y)组成的样本是一个随机样本
  2. 数据对(x,y)的散点图要呈现出近视线性相关性
  3. 要把离群值排除

相关系数计算公式:
统计学基础13-回归分析_第4张图片

1.4 相关系数r的性质

r的性质:

  1. r的范围是-1到1

  2. 如果某个变量的所有值都转换为一个不同的度量单位,r值不变。

  3. r值不受x、y的选择影响。交换所有的x值与y值,r不便。

  4. r是线性相关性的强度的度量,不适用于非线性相关的关系。

  5. r非常容易受到离群值的影响,当有离群值存在的时候,r可能变得非常不一样

1.5 可解释变异 r 2 r^2 r2

Y变异的来源:

  1. x变异造成的-可解释变异
  2. 除x外的因素变异造成的,如随机抽样引起的误差

r 2 r^2 r2放映了y变异中由x变异引起的变异所占总变异的比例,也就是 r 2 r^2 r2的值是由x和y之间的线性相关性说解释的y的变异变异比例。

1.6 常见错误

  1. 误将相关关系认为是因果关系
  2. 局部求平均数后再用于计算会使变异减少,相关性增大
  3. 不存在线性相关性,不意味着两个变量没有关系,可能会存在其他非线性关系

1.7 相关系数

统计学基础13-回归分析_第5张图片

例子:
统计学基础13-回归分析_第6张图片
统计学基础13-回归分析_第7张图片
统计学基础13-回归分析_第8张图片

二. 回归模型

统计学基础13-回归分析_第9张图片

2.1 一元线性回归模型

统计学基础13-回归分析_第10张图片

统计学基础13-回归分析_第11张图片

2.1.1 如何确定参数

统计学基础13-回归分析_第12张图片
统计学基础13-回归分析_第13张图片

例子:
统计学基础13-回归分析_第14张图片

2.1.2 回归系数显著性检验

统计学基础13-回归分析_第15张图片
统计学基础13-回归分析_第16张图片
统计学基础13-回归分析_第17张图片

例子:
统计学基础13-回归分析_第18张图片

2.1.3 回归诊断-残差图

统计学基础13-回归分析_第19张图片

2.2 多元线性回归模型

统计学基础13-回归分析_第20张图片

参数估计:
统计学基础13-回归分析_第21张图片

R 2 R^2 R2
统计学基础13-回归分析_第22张图片

统计学基础13-回归分析_第23张图片

例子:
统计学基础13-回归分析_第24张图片

三. 虚拟变量

统计学基础13-回归分析_第25张图片

参考:

  1. http://www.dataguru.cn/article-4362-1.html

你可能感兴趣的:(数据分析,+,机器学习,回归,相关系数)