机器学习之线性回归之第一课

回归模型:根据已有数据,预测结果,根据不同的特征有不同的权重比

线性回归:

线性回归可以处理多标签问题,只需要在fit里输入多维标签
找出特征与特征权重之间的一种组合,从而来预测对应的结果
无论怎么预测,误差值始终是存在,我们该如何将误差最小
回归算法是一种迭代方法,迭代就类似系统版本的迭代,新版本比旧版本更好
	当开始寻线性回归模型的时候,是逐步的将样本数据带入模型对其进行训练的
	训练开始时先用部分的样本数据训练模型生成一组w和b,对应的直线和数据对应散点的误差比较大,通过不断地带入样本数据训练模型会逐步地迭代不好地w和b从而是使w和b值更加地精准
迭代:就是重复反馈过程的活动,其目的通常就是为了逼近所需目标或者结果。每次对过程的重复称为一次“迭代”,每一次迭代得到的结果会作为下一次迭代的初始值。
Y=XWT,公式里的T是转置符号,可以看成权重值与变量的乘法,两个矩阵乘积得到的结果
如何表示预测误差呢,用损失函数来表示
范式:
L0指的是向量中非0的元素的个数
L1指的是向量中各个元素绝对值之和
L2指的是向量个元素的平方和然后求平方根

损失函数
最小二乘法

最小二乘法需要用到的api如下:

 from sklearn.linear_model import LinearRegression

线性回归评价模型:

损失函数不适合用来直接评价回归模型
我们从两个角度来看待回归的效果:
	1、我们是否你和到了足够的信息
	2、我们是否拟合到了足够的信息
    1的角度需要用到的api是:
		from sklearn.metrics import mean_squared_error as MSE
		需要对MSE(x_test,y_pred)传入几个参数,第一个测试集特征,第二个预测值结果
		找到测试结果的最小值,最大值,与测试集的最大值最小值进行对比

对线性回归进行评估需要知道r^2的值

需要调用的api:
	第一种:直接从metrics中导入r2_score,输入预测值和真实值后进行打分
		1、from sklearn.metrics import r2_score
	第二种:直接从线性回归LinearRegression的接口Score来进行调用
	第三种:在交叉验证中,输入r2来调用

你可能感兴趣的:(1024程序员节)