机器学习包含监督学习、非监督学习、以及强化学习三大部分。监督学习又分为分类和回归两大类。线性回归模型
就属于监督学习里的回归模型
。
向量形式为: f(x)=wT∗x+b
其中 w=(w1,w2,w3,...,wn)
令 x0=1,w0=b ,则
f(x)=wT∗x
其中 w=(w0,w1,w2,w3,...,wn)
作为目标函数进行优化,使其函数值最小化。在线性模型中,损失函数为:
J(w0,w1,w2,...,wn)=12m∗∑mi=1{fw(xi)−yi}2
损失函数为一个凸函数
我们模型的优化目标为最小化损失函数。要最小化损失函数,需要沿下降速度最快的方向走,使目标函数最小化。
2.梯度下降算法的伪代码描述:
repeat until convergence{
wi+1=wi+α∗dJ(w)d(w)
}
完整代码下载
# 数据加载
data = np.loadtxt('linear_regression_data1.txt', delimiter=',')
X = np.c_[np.ones(data.shape[0]),data[:,0]]
y = np.c_[data[:,1]]
# 对数据绘制散点图
plt.scatter(X[:,1], y, s=30, c='r', marker='x', linewidths=1)
plt.xlim(4,24)
plt.xlabel('Population of City in 10,000s')
plt.ylabel('Profit in $10,000s');
# 计算损失函数
def computeCost(X, y, theta=[[0],[0]]):
m = y.size
J = 0
h = X.dot(theta)
J = 1.0/(2*m)*(np.sum(np.square(h-y)))
return J
# 梯度下降
def gradientDescent(X, y, theta=[[0],[0]], alpha=0.01, num_iters=1500):
m = y.size
J_history = np.zeros(num_iters)
for iter in np.arange(num_iters):
h = X.dot(theta)
theta = theta - alpha*(1.0/m)*(X.T.dot(h-y))
J_history[iter] = computeCost(X, y, theta)
return(theta, J_history)
# 得到模型的参数和损失
theta , Cost_J = gradientDescent(X, y)
线性回归-模型简单,可解释性高,在一定程度上可以防止过拟合,用途广泛,可作为各个系统的基线模型。
线性模型形式简单、易于建模。但是却蕴含着机器学习中一些重要的基本思想。许多功能更为强大的非线性模型可以在线性模型的基础上通过引入层级结构或高维映射而得。此外,由于w直观表达了各属性在预测中的重要性,因此线性模型有很好的可解释性。
本章代码下载 https://github.com/yanwosky4/MLNotebookProject/tree/master/note1-LinearModel/code
邮箱: [email protected]
github地址: https://github.com/yanwosky4 ,欢迎Star