作者丨丹丹
来源丨医数思维云课堂(ID:Datamedi)
在许多实际问题分析中,回归分析的应用十分广泛,它是处理变量之间相关关系最常用的一种统计方法。回归分析可分为线性回归和非线性回归。
线性回归分析相信大家都已经非常熟悉了,它主要分析有线性回归趋势的两个变量间的关系。
但是在处理许多实际问题时,变量间的关系并非直线关系,例如细菌生长曲线、药物动力学、毒物剂量与动物死亡率的关系等等。此时,若采用线性回归分析将丢失大量信息,甚至得出错误结论。因此,就需要我们采用非线性回归模型来处理此类问题。
非线性回归有多种形式,包括双曲线、二次曲线、三次曲线、幂函数曲线、指数函数曲线、S形曲线、对数曲线、指数曲线等。非线性回归分析的关键是确定函数的具体形式。通常需要根据科学研究或生产实际中的具体问题或试验数据的特征做出合适的选择。
下面小编将向大家介绍如何用R软件实现非线性回归中的多项式回归。
实例:某种合金中的主要成分为元素A和B,试验发现这两种元素之和x与合金膨胀系数y之间有一定的数量关系。试根据表给出的试验数据找出y与x之间的回归关系。
多项式回归分析的步骤:
①确定变量间的关系函数
当变量间的关系函数为多项式方程时,可进行多项式回归分析。
多项式方程是指若在一次方程中引入x的二次、三次,甚至是更高次项,直线方程就成为一般多项式方程,如为某曲线型数据拟合多项式函数:
②根据试验数据,画出散点图,观察两者之间的关系。
#输入数据
x<-c(37.0,37.5,38.0,38.5,39.0,39.5,40.0,40.5,41.0,41.5,42.0,42.5,43.0)
y<-c(3.40,3.00,3.00,2.27,2.10,1.83,1.53,1.70,1.80,1.90,2.35,2.54,2.90)
alloy.data<-data.frame(x,y)#将数据形成数据框
plot(y~x,data = alloy.data)#画散点图
从散点图中可以看出,图中的点连成的曲线是一个二次函数,y与x之间可用二次多项式来描述:
该二次多项式的系数可以采用偏最小二乘法来计算。我们可以使用R语言中的lm( )函数来计算二次多项式的系数并建立回归模型。使用anova( )函数进行回归模型的方差分析。
alloy.model<-lm(y~x+I(x^2),data = alloy.data)
summary(alloy.model)
anova(alloy.model)
从模型的输出结果中可以看出,二次多项式回归方程为:
从回归模型的方差分析结果可以看出,x的一次项和二次项对y都有显著性。
今天大家和小编一起学习如何使用R语言实现多项式回归分析,下一期我们继续学习非线性回归模型中的多元非线性回归分析,期待大家与小编共同进步!!!
怎么样?是不是挺简单的,希望大家多多练习。如果你有关于回归分析方面的问题,可以及时联系小编,小编一定不遗余力哟,期待我们的再次相约。