数据分析之线性回归分析

一、回归算法:
(1)机器学习监督学习算法分为分类算法和回归算法;回归算法运用于连续型分布预测,针对的是数值型的样本
(2)回归分析中包括因变量和自变量
(3)回归分析分为一元线性回归分析和多元线性回归分析
二、一元线性回归:
(1)、线性回归,是利用数理统计中回归分析,
来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法
一元线性回归通用公式为:
在这里插入图片描述
(2)实例:
导入模块:
from sklearn import linear_model
import numpy as np
import matplotlib.pyplot as plt
数据集:—披萨的尺寸–价格:
x=[[6],[8],[10],[14],[18]]
y=[[7],[9],[13],[17.5],[18]]
创建线性回归对象:
lr=linear_model.LinearRegression()
指定数据集:
lr.fit(x,y)
拟合:
预测一个x=12的y的值:
x=12
y=lr.predict(np.array([x]).reshape(-1,1))

使用绘图查看结果:
x轴:
x2=[[0],[10],[14],[25]]
y轴:
y2=lr.predict(x2)
绘图:训练集—测试集:
plt.figure()
plt.plot(x,y,’.k’)
plt.plot(x2,y2,‘g-’)
plt.grid(True)
plt.show()

你可能感兴趣的:(数据分析之线性回归分析)