单变量线性回归是监督学习中的一种算法,通常用于解决回归问题。在单变量线性回归中,我们有一个训练数据集,其中包括一组输入特征(通常表示为)和相应的输出目标(通常表示为)。这个算法的目标是学习一个线性函数,通常表示为ℎ(),其中是要学习的参数,以便将输入特征映射到输出目标。
具体地,对于单变量线性回归,通常使用以下形式的线性函数:
其中:
- ℎ() 表示通过算法学习到的假设(或预测)函数。
- 0 和 1 是要学习的模型参数,分别表示假设的截距和斜率。
- 是输入特征,通常表示单个特征。
- 是输出目标,表示要预测的结果。
单变量线性回归的目标是通过训练数据集学习出最佳的模型参数0和1,使得假设ℎ()能够最好地拟合训练数据集中的输入特征和输出目标。一旦学习到了合适的参数,就可以使用模型来进行预测,根据给定的输入特征,预测相应的输出目标。
在单变量线性回归问题中,我们通常通过最小化成本函数(例如均方误差)来找到最佳的参数0和1,以使模型与训练数据尽可能接近。这就是单变量线性回归的基本思想,它可用于估计输入特征与输出目标之间的线性关系,例如根据房屋尺寸来估计房屋价格。
参考资料:
[中英字幕]吴恩达机器学习系列课程
黄海广博士 - 吴恩达机器学习个人笔记