回归分析-线性相关强度

回归分析-线性相关强度

什么是回归分析呢?

回归分析:通过建立模型来研究变量之间相互关系的密切程度、结构状态及进行模型预测的一种有效工具

这里,给出回归分析的结构图:
回归分析-线性相关强度_第1张图片
可以看出回归分析的内容实际上非常多。

今天我们进行一个回归分析的大致流程的讲解
首先对于因变量和自变量,我们有两个定义

  1. 函数关系:确定性关系,此时因变量和自变量之间呈现线性关心诸如 y = x ∗ 3 + 4 y=x*3+4 y=x3+4,像这样,x和y是线性关系
  2. 相关关系:不确定关系,此时,因变量和自变量不呈现线性关系
    往往当现实中真正的去做一些回复分析的任务时,往往因变量和自变量都不会是函数关系,而是不确定关系,即不是先标准的线性关系
    下图左边是函数关系,左边是相关关系。
    回归分析-线性相关强度_第2张图片

那么对于在做回归分析之前,应该去做什么?
在做回归分析之前,我们往往需要需要对因变量和自变量进行相关系数计算,这决定了,是否该问题可以使用回归分析去解决。

对于回归分析,相关系数计算,要区分一下,如果只有一个自变量,可以直接套用下面公式计算相关系数
回归分析-线性相关强度_第3张图片
但如果自变量是多个的,计算因变量和自变量之间的相关系数就要进行一下变换
回归分析-线性相关强度_第4张图片即我们先对多个自变量先做回归,计算出预测结果之后,用预测结果和真是结果计算相关系数。

相关系数越大,可以认为,因变量和自变量之间的线性相关越强,那么使用回归分析预测时,结果就会越好。

那么当我们通过计算发现因变量和自变量的线性相关很强时,我们就可以使用回归分析中的算法,像一元线性回归,多元线性回归等去进行回归预测。

这个在之后,我应该还会做一些讲解,对回归分析中的相关算法进行详细介绍。

你可能感兴趣的:(数据分析,机器学习,机器学习)