结构风险(Structural risk minimization,SRM)是为了防止过拟合而提出来的策略,结构风险最小化等价于正则化(regularization)。在经验风险上加上表示模型复杂度的正则化项(regularizer)或罚项(penalty term)。在假设空间、损失函数以及训练集确定的情况下,结构风险的定义是
贝叶斯估计中的最大后验概率估计就是结构风险最小化的一个例子。当模型是条件概率分布、损失函数是对数损失函数、模型复杂度由模型的先验概率表示时,结构风险最小化就等价于最大后验概率估计。
结构风险最小化的策略认为结构风险最小的模型是最优的模型。所以求解最优模型就是求解最优化问题。
监督学习问题就变成经验风险或结构风险函数的最优化问题。
假设学习到的模型是Y= f̂ (X) ,训练误差是模型Y= f̂ (X) 关于训练数据集的平均损失:
测试误差是模型Y= f̂ (X) 关测试数据集的平均损失:
例如当损失函数是0-1损失时,测试误差就变成了常见测试数据集上的误差率。
相应地准确率是
当假设空间含有不同复杂度(如不同的参数个数)的模型时,就需要面临模型选择的问题。
模型选择的典型方法是正则化(regularization)。正则化是结构风险最小化策略的实现,是经验风险上加一个正则化项或罚项。
正则化一般具有如下形式: