R中的线性回归分析

回归分析(regression analysis)

回归分析是研究自变量与因变量之间关系形式的分析方法,它主要是通过建立因变量Y与影响它的自变量Xi(i=1,2,3...)之间的回归模型,来预测因变量Y的发展趋势。

简单线性回归模型
Y=a+b*X+e
Y——因变量
X——自变量
a——常数项,是回归直线在纵轴上的截距
b——回归系数,是回归直线的斜率
e——随机误差,即随机因素对因变量所产生的影响
回归分析函数
lm(formula)
formula:回归表达式y~x+1
lm类型的回归结果,一般使用summary函数进行查看

预测函数
predic(lmModel,predictData,level=置信度)
参数说明:
lmModel:回归分析得到的模型
predictData:需要预测的值
level:置信度

返回值:预测结果

data <- read.table('data.csv', header=T, sep=',');

#第一步,根据预测目标,确定自变量和因变量;

#第二步,绘制散点图,确定回归模型类型;
plot(data$广告费用, data$购买用户数)

#第三步,估计模型参数,建立回归模型;
lmModel <- lm(formula = 购买用户数 ~ 1 + 广告费用, data=data)

#第四步,对回归模型进行检测;
summary(lmModel)

#第五步,利用回归模型进行预测。
pData <- read.table('newData.csv', header=T, sep=',', fileEncoding = 'utf8');
fix(pData)
predict(lmModel, pData, level=0.95)

多重线性回归,是同样的道理:

#第一步,根据预测目标,确定自变量和因变量;

#第二步,绘制散点图,确定回归模型类型;
plot(data$广告费用, data$购买用户数)
plot(data$渠道数, data$购买用户数)

#第三步,估计模型参数,建立回归模型;
lmModel <- lm(formula = 购买用户数 ~ 1 + 广告费用 + 渠道数, data=data)

#第四步,对回归模型进行检测;
summary(lmModel)

#第五步,利用回归模型进行预测。
pData <- read.table('newData.csv', header=T, sep=',', fileEncoding = 'utf8');

predict(lmModel, pData, level=0.95)




你可能感兴趣的:(R数据分析篇)