《机器学习》(周志华)学习笔记(二)模型评估与选择

一、经验误差与过拟合


误差:学习器的实际预测输出与样本的真实输出之间的差异。


训练误差:学习器在训练集上的误差。


泛化误差:在新样本上的误差。


过拟合与欠拟合问题

P.S NP问题为非确定性多项式(non-deterministic polynomial),只可用一定数量的运算解决多项式时间内可解决的问题(多项式时间:在计算复杂度理论中,指的是一个问题的计算时间m(n)不大于问题大小n的多项式倍数)

参考博文:http://blog.csdn.net/u014295667/article/details/47090639

二、评估方法

1、留出法

将数据集D划分成两个互斥的集合,其中一个集合作为训练集S,另一个作为测试集T,即D=S∪T,S∩T=Φ

你可能感兴趣的:(《机器学习》(周志华)学习笔记(二)模型评估与选择)