台湾国立大学机器学习基石.听课笔记(第十六讲一):Three Learning Principle

台湾国立大学机器学习基石.听课笔记(第十六讲一):
Three Learning Principle

一,Occam's Razor


相对简单的模型,也许对数据的训练和测试得出来的结果更好。

1,从数学理论说


2,从逻辑上来说

台湾国立大学机器学习基石.听课笔记(第十六讲一):Three Learning Principle_第1张图片

二, Sampling Biase

根据数据的特点,我们做测试和训练时采的数据也要有特点。
台湾国立大学机器学习基石.听课笔记(第十六讲一):Three Learning Principle_第2张图片

所以:1,训练和测试的数据要独立同分布


2,根据数据的特点,选取训练数据


三,Data Snooping(数据窥测)




我们以货币交易为例子,前两年是做训练,后两年做测试。
台湾国立大学机器学习基石.听课笔记(第十六讲一):Three Learning Principle_第3张图片
我们以前6年和后2年做训练,得出的结果很好,但是结果并不一定真实;然而以前6年做测试,后两年做训练,结果不会很好,但是结果会更加真实。
那我们要如何解决数据窥视呢?

你可能感兴趣的:(机器学习,听课笔记,台湾国立大学机器学习基石)