关于预测问题(回归分析)

最近需要做
已知的是日期,时间,地点,人数。
需要知道下一个时间点的人数。

网上查了资料以后觉得可以使用回归分析。
回归分析大概是给了自变量( x = x 1 , x 2 , x 3 , . . . \bf x={x_1,x_2,x_3,...} x=x1,x2,x3,...)和因变量,推测出它们的模型 f f f
y = f ( x ) \bf y=f(\bf x) y=f(x)
这样再给自变量以后,就可以计算出 y \bf y y


列一些找到的资料慢慢读 。

mablab分析

https://ww2.mathworks.cn/discovery/predictive-analytics.html

百度百科

https://baike.baidu.com/item/回归分析

  • 步骤
  1. 确定变量
    明确预测的具体目标,也就确定了因变量。如预测具体目标是下一年度的销售量,那么销售量Y就是因变量。通过市场调查和查阅资料,寻找与预测目标的相关影响因素,即自变量,并从中选出主要的影响因素。
  2. 建立预测模型
    依据自变量和因变量的历史统计资料进行计算,在此基础上建立回归分析方程,即回归分析预测模型。
  3. 进行相关分析
    回归分析是对具有因果关系的影响因素(自变量)和预测对象(因变量)所进行的数理统计分析处理。只有当自变量与因变量确实存在某种关系时,建立的回归方程才有意义。因此,作为自变量的因素与作为因变量的预测对象是否有关,相关程度如何,以及判断这种相关程度的把握性多大,就成为进行回归分析必须要解决的问题。进行相关分析,一般要求出相关关系,以相关系数的大小来判断自变量和因变量的相关的程度。
  4. 计算预测误差
    回归预测模型是否可用于实际预测,取决于对回归预测模型的检验和对预测误差的计算。回归方程只有通过各种检验,且预测误差较小,才能将回归方程作为预测模型进行预测。
  5. 确定预测值
    利用回归预测模型计算预测值,并对预测值进行综合分析,确定最后的预测值。
  • 注意问题
    应用回归预测法时应首先确定变量之间是否存在相关关系。如果变量之间不存在相关关系,对这些变量应用回归预测法就会得出错误的结果。
    正确应用回归分析预测时应注意:
    ①用定性分析判断现象之间的依存关系;
    ②避免回归预测的任意外推;
    ③应用合适的数据资料;

wiki

https://en.wikipedia.org/wiki/Multivariate_statistics

###相关分析和回归分析
http://faculty.zuel.edu.cn/_upload/article/files/fb/58/f3956232492ea839a38025de7bb4/7b1d3251-634a-44bd-867b-6d86081ad76a.pdf
做回归分析之前,似乎要先确定因变量和自变量是否有(相关)关系。以及,在计算出回归方程之后,还要做显著性检验。

当我们建立了一个实际问题的经验回归方程之后,还不能马上用于分析和预测。因为得到的经验回归方程是否真正 描述了变量之间的统计规律性,还需要运用统计方法对回 归方程进行检验。 回归分析中的显著性包括两方面的内容: 一是对各回归系数的显著性检验(t检验); 二是对整个回归方程的显著性检验(F检验)

csdn(回归分析的steps)

https://blog.csdn.net/yangzhongblog/article/details/47133727


自己总结下:

  • 列出自变量,因变量
  • 计算相关性
    #https://blog.csdn.net/oh5W6HinUg43JvRhhB/article/details/78389809
  • 数据预处理,计算回归方程
    #https://blog.csdn.net/HHTNAN/article/details/78843722
    #https://blog.csdn.net/LULEI1217/article/details/49386295
    #https://zhuanlan.zhihu.com/p/38178150
  • 显著性检验(其他检验?)

多重共线性

多重共线性是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。 一般来说,由于经济数据的限制使得模型设计不当,导致设计矩阵中解释变量间存在普遍的相关关系。

你可能感兴趣的:(数据分析)