【机器学习(李宏毅)】 二、Regression: Case Study

回归问题:

  • The output of the target function f is “scalar”.

【机器学习(李宏毅)】 二、Regression: Case Study_第1张图片

课程用例说明:

  • 针对的问题:估计pokemon进化之后的CP值

【机器学习(李宏毅)】 二、Regression: Case Study_第2张图片

Step1:选择模型

  • 注意:现只考虑一个参数即当前CP值

【机器学习(李宏毅)】 二、Regression: Case Study_第3张图片

Step2:模型好坏

【机器学习(李宏毅)】 二、Regression: Case Study_第4张图片

【机器学习(李宏毅)】 二、Regression: Case Study_第5张图片

  • 模型的好坏用损失函数来评价,公式见下图:

【机器学习(李宏毅)】 二、Regression: Case Study_第6张图片

【机器学习(李宏毅)】 二、Regression: Case Study_第7张图片

Step3:最佳函数/模型

  • 即是求使得损失函数最小时,参数wb的值

【机器学习(李宏毅)】 二、Regression: Case Study_第8张图片

  • 使用梯度下降法来求解
  • 以只考虑一个参数w为例:

【机器学习(李宏毅)】 二、Regression: Case Study_第9张图片

【机器学习(李宏毅)】 二、Regression: Case Study_第10张图片

【机器学习(李宏毅)】 二、Regression: Case Study_第11张图片

  • 考虑w和b两个参数:

【机器学习(李宏毅)】 二、Regression: Case Study_第12张图片

【机器学习(李宏毅)】 二、Regression: Case Study_第13张图片

【机器学习(李宏毅)】 二、Regression: Case Study_第14张图片

  • 计算梯度实例:

【机器学习(李宏毅)】 二、Regression: Case Study_第15张图片

结果评价:

  • 从训练集得出最好的模型,将此模型用在测试集上,得出误差。
  • 一次模型:

【机器学习(李宏毅)】 二、Regression: Case Study_第16张图片

【机器学习(李宏毅)】 二、Regression: Case Study_第17张图片

  • 二次模型:更好了

【机器学习(李宏毅)】 二、Regression: Case Study_第18张图片

  • 三次模型:稍微变好一点

【机器学习(李宏毅)】 二、Regression: Case Study_第19张图片

  • 四次模型:开始变差

【机器学习(李宏毅)】 二、Regression: Case Study_第20张图片

  • 五次模型:太差,爆炸

【机器学习(李宏毅)】 二、Regression: Case Study_第21张图片

模型的选择

  • 在训练集上,越复杂的模型当然能产生更低的误差

【机器学习(李宏毅)】 二、Regression: Case Study_第22张图片

  • 但是一个更复杂的模型,在测试集上,并不总是得到更好的结果。
  • 原因是过拟合,所以要选择合适的模型

【机器学习(李宏毅)】 二、Regression: Case Study_第23张图片

搜集更多的数据:

【机器学习(李宏毅)】 二、Regression: Case Study_第24张图片

其他隐藏的因素:

  • 首先,当然是将物种因素考虑进来:

【机器学习(李宏毅)】 二、Regression: Case Study_第25张图片

Back to step 1:重新设计模型

  • 对于物种因素,当其为不同的物种,其函数也不同。
  • 但可写成一个线性模型(继续往下看)。

【机器学习(李宏毅)】 二、Regression: Case Study_第26张图片

  • 利用 δ 函数,将模型写成了一个线性函数的形式:

【机器学习(李宏毅)】 二、Regression: Case Study_第27张图片

  • 举例:当物种为Pidgey时,无关项都变为了0:

【机器学习(李宏毅)】 二、Regression: Case Study_第28张图片

结果评价:

  • 可以看出,测试集上的误差为14.3,与之前相比,确实变好:

【机器学习(李宏毅)】 二、Regression: Case Study_第29张图片

其他隐藏因素?

  • 重量、高度、HP值(这些在示例的pokemon卡片上都能看到)

【机器学习(李宏毅)】 二、Regression: Case Study_第30张图片

Back to step 1:重新设计模型

【机器学习(李宏毅)】 二、Regression: Case Study_第31张图片

Back to step 2: 正则化

  • 想要更小的 wi
  • 原因:因为在测试上测试时,当一些噪音作为输入时,更平滑的函数受到的影响会更小。

【机器学习(李宏毅)】 二、Regression: Case Study_第32张图片

  • 要多平滑?通过 λ 来得到最佳模型
  • 对于训练误差: λ 越大,考虑训练误差越少
  • 我们要平滑的函数,但不能太平滑

【机器学习(李宏毅)】 二、Regression: Case Study_第33张图片

结论:

【机器学习(李宏毅)】 二、Regression: Case Study_第34张图片

  • 课程地址:http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML16.html

你可能感兴趣的:(机器学习)