岭回归算法

回归分析方法是利用数理统计方法分析数据,建立自变量和因变量间的回归模型,用于预测因变量变化的分析方法。其中比较经典的是HoerI和Kennard提出的岭回归算法。岭回归算法是在最小二乘法的基础上引|入正则项,使回归模型具有较好泛化能力和稳定性,但岭回归算法并不能处理自变量间非线性相关的情况。

岭回归,又称脊回归,是对不适定问题进行回归分析时经常使用的一种正则化方法 ,是对最小二乘回归的一种补充,岭回归通过损失无偏性来换取高的数值稳定性。从而得到较高的计算精度。[1]


岭回归是一种经过改良的最小二乘法.通过在代价函数中添加正则化项,而放弃无偏性。虽然损失了一定量的原始信息特征.但较易获得更优的拟合效果,岭回归算法比较适用于变量间存在一定共线性的问题[2]。 

岭回归,又被称为吉洪诺夫正则化(Tikhonov Regularizat ion)。回归问题中常用的方法为最小二乘法,而当自变量存在多重共线性关系时,均方误差将变得很大,导致最小二乘法无法使用,减少均方误差的方法就是用岭回归估计替代最小二乘估计。岭回归是一种专用 于共线性数据分析的有偏估计回归方法,实质上是一种改良的最小二乘估计法,通过放弃最小=乘法的无偏性,以损失部分信息、降低精度为代价获得回归系数更为符合实际、更可靠的回归方法,对病态数据的拟合要强于最小二乘法。在回归分析里,输入是任意离散或连续的、单一或多个的变 量。而输出是连续的数值。例如,将某公司某一月财报数据抽取出若干特征,如营收总额、支出总额以及是否有负面报道,利用回归分析预测下个月该公司股票价格。回归分析在长期大量的实际应用中出现了特殊情况:建立回归方程后,因为自变量(回归变量)存在高度相关性,使得回归方程变得不稳定:有些自变量对因变量(指标)影响的显著性被隐藏;某些回归系数的符号与实际意义不符合等。出现这些问题的原因就在于自变量之间的共线性,而岭回归是处理这种自变量多重共线性的重要方法[3]。
 

[1]白青华,殷雪莲,王静等.基于岭回归的河西走廊中部日光温室低温预测模型[J].农学学报,2023,13(05):96-100.

[2]方鑫,刘通,程亚萍等.基于GA-岭回归分析的机车车轮踏面磨耗量预测算法研究[J].机车电传动,2023(06):71-78.DOI:10.13890/j.issn.1000-128X.2023.06.009.

[3]程平,郭奕君,辜榕容.基于岭回归机器学习算法的项目成本预测研究——以A风景园林规划研究院规划设计项目为例[J].财会通讯,2021(12):101-105.DOI:10.16144/j.cnki.issn1002-8072.2021.12.022.

你可能感兴趣的:(回归,数据挖掘,人工智能)