Lagrange乘子法

简单讲下拉格朗日乘子法

考虑标准形式的优化问题:

minimize f_0(x)

subject to f_i(x) \leqslant 0, i = 1, ... , m,

h_i(x) = 0, i = 1, ... , p,

x定义域为所有f_i(x)h_i(x)的定义域交集,记为D。

首先定义Lagrange函数L:

L(x,\lambda , \upsilon ) = f_0(x) + \sum_{i=1}^{m}\lambda _i f_i(x) + \sum_{i=1}^{p}\upsilon _i h_i(x)

然后定义Lagrange对偶函数g:

g(\lambda , \upsilon ) = \inf_{x\in D}L(x,\lambda, \upsilon) = \inf_{x\in D}\left ( f_0(x) + \sum_{i=1}^{m}\lambda _i f_i(x) + \sum_{i=1}^p\upsilon _i h_i(x)]\right )

结论1:注意上面的对偶函数g,其参数为\lambda\upsilon。它的定义域规定为\lambda \in R_+^m=\{(\lambda_1, ..., \lambda_m)| \lambda_i \geqslant 0,i=1, ..., m\}, \upsilon \in R^p, inf的括号内的函数,若把x看作常数,其实是关于\lambda\upsilon线性函数。而线性函数既是凸函数又是凹函数,且一系列凹函数的逐点下确界函数仍然是凹函数(见《凸优化》第3.2.3)。故函数g一定是凹函数。

结论2:设上面的优化问题最优值为p^*,则g(\lambda , \upsilon ) \leqslant p^*对任意\lambda \in R_+^m,\upsilon \in R^p都成立。

证明:设\widetilde{x}是上面优化问题的一个可行点(即\widetilde{x} \in D\widetilde{x}满足等式约束和不等式约束),则

L(\widetilde{x}, \lambda , \upsilon ) = f_0(\widetilde{x}) + \sum_{i=1}^{m}\lambda _i f_i(\widetilde{x}) + \sum_{i=1}^{p}\upsilon _i h_i(\widetilde{x}) \leqslant f_0(\widetilde{x}).

这是因为\lambda _i \geqslant 0, f_i(\widetilde{x}) \leqslant 0, h_i(\widetilde{x}) = 0,因此有

g(\lambda , \upsilon ) = \inf_{x \in D} L(x, \lambda , \upsilon ) \leqslant L(\widetilde{x}, \lambda , \upsilon ) \leqslant f_0(\widetilde{x}).

由于每个可行点\widetilde{x}都满足g(\lambda , \upsilon ) \leqslant f_0(\widetilde{x}),因此g(\lambda , \upsilon ) \leqslant p^*得证。

 由上面两个结论,即可把一个普通问题转换为求下面的对偶问题:

maximize g(\lambda , \upsilon )

subject  to  \lambda \geqslant 0.

该问题被称为Lagrange对偶问题。有一个很好的性质就是函数g为凹函数且定义域为凸集,即对偶问题是凸问题。凸问题是很容易求解的,设其最优解为(\lambda ^*, \upsilon ^*),并设d^* = g(\lambda ^*, \upsilon ^*),则由结论2有

d^* \leqslant p^*

也就是说对偶问题的解是原问题的解的下界。由下界最多只能粗略估计原问题解的范围,并不好用。《凸优化》说有很多研究成果表面,当原问题满足一定条件时,有d^* = p^*。比如:

Slater条件:当原问题是凸问题时:(下面就是凸问题的定义,里面fi均为凸函数)

minimize f_0(x)

subject to f_i(x) \leqslant 0, i= 1, ... , m

                Ax = b,

若存在某点x,使得f_i(x) < 0 , i= 1, ..., m, Ax=b.则有d^* = p^*

此外,还有不少定理,当满足一定条件时就有d^* = p^*。太复杂了,这里就不写了。

 

 

你可能感兴趣的:(算法,机器学习,支持向量机,人工智能)