约束优化方法

在机器学习中,常常需要对损失函数进行优化,但是我们可能希望在给定的集合中来搜索函数的最大值或者最小值,这就是约束优化。一个简单的方法是考虑约束条件后进行修改后的梯度下降,或者直接设计一个不同的、无约束的优化问题,其解可以转化为原始优化问题的解。

对于等式约束,可以直接采用拉格朗日方法,而对于不等式约束,可以使用KKT方法转换到广义的朗格朗日乘子中求解。

Karush-Kuhn-Tucker(KKT)方法是一种针对约束优化的通用的解决方案,假设优化目标存在等式约束和不等式约束
S = { x ∣ ∀ i , g ( i ) ( x ) = 0   a n d   ∀ j , h ( j ) ( x ) ≤ 0 } S = \left \{ x|\forall i,g^{(i)}(x)=0 \space and \space \forall j,h^{(j)}(x) \leq 0 \right \} S={xi,g(i)(x)=0 and j,h(j)(x)0}

可以定义广义lagangian函数为
L ( x , λ , α ) = f ( x ) + ∑ i λ i g ( i ) ( x ) + ∑ j α j h ( j ) ( x ) L(x,\lambda,\alpha)=f(x)+\sum_i \lambda_{i} g^{(i)}(x) + \sum_{j} \alpha_{j} h^{(j)}(x) L(x,λ,α)=f(x)+iλig(i)(x)+jαjh(j)(x)
其中, α ≥ 0 , λ \alpha \geq 0,\lambda α0,λ是KKT乘子。

则约束可以转换为约束最小化问题,则为
min ⁡ x max ⁡ λ max ⁡ α , α ≥ 0 L ( x , λ , α ) \min_{x} \max_{\lambda} \max_{\alpha,\alpha \geq 0} L(x,\lambda,\alpha) xminλmaxα,α0maxL(x,λ,α)
如果是要求约束最大化,则可以取上式的f(x)为负或者把整个式子设为负号,上式的等式约束所对应的符号并不重要。

可以用一组性质来描述约束优化问题的最优点,称为KKT条件,这是确定一个点的必要条件,而非充分条件。这些条件是

  1. 广义lagrangian函数的梯度为0。
  2. 满足所有关于 x x x和KKT乘子的约束。(其中 α ≥ 0 \alpha \geq 0 α0)
  3. 不等式约束满足: α ⊙ h ( x ) = 0 \alpha \odot h(x) = 0 αh(x)=0 .(即两个中至少一个为0)

对不等式约束的直观解释,这个解为不等式强加的边界,可以通过KKT乘子影响最优解,或者消除不等式对解的影响。

欢迎大家关注公众号“计算机视觉与机器学习”
约束优化方法_第1张图片

你可能感兴趣的:(机器学习)