变量分裂法(Variable Splitting)

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/DoctorCuiLab/article/details/83051359

变量分裂法

变量分裂方法可以解决目标函数是两个函数之和的优化问题:
(1) min ⁡ u ∈ K n f 1 ( u ) + f 2 ( g ( u ) ) \min_{u\in K^n} f_1(u)+f_2(g(u))\tag{1} uKnminf1(u)+f2(g(u))(1)

其中 g g g n n n维向量到 d d d维向量的一个映射。所谓的变量分裂就是将上式变为:

(2) min ⁡ u ∈ K n , v ∈ R d f 1 ( u ) + f 2 ( v ) s . t . g ( u ) = v \min_{u\in K^n,v\in R^d} f_1(u)+f_2(v)\quad s.t.\quad g(u)=v\tag{2} uKn,vRdminf1(u)+f2(v)s.t.g(u)=v(2)

显然(1)和(2)是一样的。变量分裂之所以会有用的主要原因就是问题(2)可能比(1)更容易或高效的解决。比如说,如果问题(2)是凸的话,我们就可以使用增广拉格朗日的方法来高效的求解。
另一种解释:
考虑 (3) min ⁡ x f ( L x ) + g ( x ) \min_{x} f(Lx)+g(x)\tag{3} xminf(Lx)+g(x)(3)其中, L L L是一个线性算子。
引入 y = L x y=Lx y=Lx,得到:

(4) min ⁡ x , y f ( y ) + g ( x ) s . t . L x − y = 0 \min_{x,y} f(y)+g(x)\quad s.t.\quad Lx-y=0\tag{4} x,yminf(y)+g(x)s.t.Lxy=0(4)

利用增广拉格朗日方法,得到:

(5) L ( x , y ; λ ) = f ( y ) + g ( x ) + < λ , L x − y > + 1 2 ∣ ∣ L x − y ∣ ∣ 2 2 L(x,y;λ)=f(y)+g(x)+<λ,Lx−y>+\frac{1}{2}||Lx−y||_2^2\tag{5} L(x,y;λ)=f(y)+g(x)+<λ,Lxy>+21Lxy22(5)

以上内容编辑:任月

你可能感兴趣的:(变量分裂法(Variable Splitting))