【运筹学笔记】 第二章 对偶理论

第二章 对偶问题

对偶问题的提出

我们可以先通过一个常识来理解“对偶”的含义和特征:

矩形中,周长一定,正方形的面积最大;面积一定,正方形的周长最小。

在许多课本中,都用如下的例子来引出对偶理论:

​ 企业A拥有m种资源(有m 个约束),可以消耗资源生产n 种产品(有n 个变量),目标是最大化总收入;那么对偶问题就是,企业B想要收购这些资源,需要确定m 种资源的报价(有m 个变量),目标是最小化总成本,但企业A只有在卖资源的收益不低于卖产品的时候才会同意卖资源(n个约束)。

而从数学角度,对偶问题可以被理解为寻找原问题目标函数上界或下界的问题。

对偶问题用途

  • 原问题约束多、变量少时,求解对偶问题能够降低计算时间
    使用单纯形法时,如果原问题约束多变量少,转换成对偶问题,就是约束少变量多。回顾单纯形法的原理,约束的减少能够有效降低计算时间。

  • 帮助证明原问题无解
    类似“证明无罪比证明有罪更难”,要证明原问题有解,只需要找出一个满足约束的点,但是想证明原问题无解,总不能遍历所有的点来证明吧?而对偶问题的出现为证明原问题无解提供了思路。

  • 便于进行敏感度分析
    除了得到最优解,我们可能还关注"如果某些已知条件发生变化,对最优解的影响程度如何",这就是敏感度分析。对偶问题和敏感性分析息息相关。一是增加敏感度分析的直观程度(例如,对偶问题的最优解就是原问题约束的影子价格),二是在改变某些条件导致原问题无可行解时,可以借助仍然有可行解的对偶问题来分析。

对偶问题的一般形式

若原问题为   L P 1 ~LP_1  LP1
m a x   z = C X s . t . { A X ≤ b X ≥ 0 \begin{aligned} max~z=CX\\s.t. \left\{\begin{aligned} AX\le b\\X\ge0 \end{aligned}\right. \end{aligned} max z=CXs.t.{AXbX0
则其对偶问题定义为   L P 2 ~LP_2  LP2
m i n   w = Y T b s . t . { A T Y ≥ C T Y ≥ 0 \begin{aligned} min~w=Y^Tb\\s.t. \left\{\begin{aligned} &A^TY\ge C^T\\&Y\ge0 \end{aligned}\right. \end{aligned} min w=YTbs.t.{ATYCTY0
若原问题并非   L P 1   ~LP_1~  LP1 形式,则我们可以首先将其转化为   L P 1   ~LP_1~  LP1 形式,然后按照前面定义即可计算出其对偶问题。

∑ i = 1 n a i j x j = b i    ⇒    { ∑ i = 1 n a i j x j ≤ b i ∑ i = 1 n − a i j x j ≤ − b i ∑ i = 1 n a i j x j ≥ b i    ⇒    ∑ i = 1 n − a i j x j ≤ − b i \sum_{i=1}^{n} a_{ij}x_j= b_i~~\Rightarrow~~\left\{\begin{aligned}\sum_{i=1}^{n} a_{ij}x_j\le b_i\\\sum_{i=1}^{n} -a_{ij}x_j\le -b_i\end{aligned}\right.\\ \displaystyle\sum_{i=1}^{n} a_{ij}x_j\ge b_i~~\Rightarrow~~\sum_{i=1}^{n} -a_{ij}x_j\le -b_i i=1naijxj=bi    i=1naijxjbii=1naijxjbii=1naijxjbi    i=1naijxjbi

也可以用如下方法进行变换:

【运筹学笔记】 第二章 对偶理论_第1张图片

举个例子:

原问题
m i n   z =         7 x 1 + 4 x 2 − 3 x 3 s . t . = { − 4 x 1 + 2 x 2 − 6 x 3 ≤ 24 − 3 x 1 − 6 x 2 − 4 x 3 ≥ 15              5 x 2 +    x 3 = 30 x 1 ≤ 0 , x 2 无 约 束 , x 3 ≥ 0 \begin{aligned} min~z=&~~~~~~~7x_1+4x_2-3x_3\\ s.t.=&\left\{ \begin{matrix} -4x_1+2x_2-6x_3\le24\\ -3x_1-6x_2-4x_3\ge15\\ ~~ ~~ ~~ ~~ ~~ ~~5x_2+~~x_3=30\\ x_1\le0,x_2无约束,x_3\ge0 \end{matrix} \right. \end{aligned} min z=s.t.=       7x1+4x23x34x1+2x26x3243x16x24x315            5x2+  x3=30x10,x2,x30
首先把   C   ~C~  C    b   ~b~  b 互换, A   A~ A 转置
m a x   w =       24       15     30 s . t . { − 4 − 3 0 7 2 − 6 5 4 − 6 − 4 1 − 3 \begin{aligned} max~w=&~~~~~24~~~~~15~~~30\\ s.t.&\left\{ \begin{matrix} -4&-3&0&&7\\ 2&-6&5&&4\\ -6&-4&1&&-3 \end{matrix} \right. \end{aligned} max w=s.t.     24     15   30426364051743
因为是最小化转为最大化问题,所以约束条件和原问题变量的符号相反(也就是表格中从右往左),变量和原问题约束条件符号相同:
m a x   w =         24 y 1 + 15 y 2 + 30 y 3 s . t . { − 4 y 1 − 3 y 2          ≥ 7 2 y 1 − 6 y 2 + 5 y 3 = 4 − 6 y 1 − 4 y 2 + y 3 ≤ 3 y 1 ≤ 0 , y 2 ≥ 0 , y 3 无 约 束 \begin{aligned} max~w=&~~~~~~~24y_1+15y_2+30y_3\\ s.t.&\left\{ \begin{matrix} -4y_1-3y_2~~~~~~~~\ge7\\ 2y_1-6y_2+5y_3=4\\ -6y_1-4y_2+y_3\le3\\ y_1\le0,y_2\ge0,y_3无约束 \end{matrix} \right. \end{aligned} max w=s.t.       24y1+15y2+30y34y13y2        72y16y2+5y3=46y14y2+y33y10,y20,y3
如果原问题改为最大化,那么相应的对偶问题是:
m i n   w =         24 y 1 + 15 y 2 + 30 y 3 s . t . { − 4 y 1 − 3 y 2          ≤ 7 2 y 1 − 6 y 2 + 5 y 3 = 4 − 6 y 1 − 4 y 2 + y 3 ≥ 3 y 1 ≥ 0 , y 2 ≤ 0 , y 3 无 约 束 \begin{aligned} min~w=&~~~~~~~24y_1+15y_2+30y_3\\ s.t.&\left\{ \begin{matrix} -4y_1-3y_2~~~~~~~~\le7\\ 2y_1-6y_2+5y_3=4\\ -6y_1-4y_2+y_3\ge3\\ y_1\ge0,y_2\le0,y_3无约束 \end{matrix} \right. \end{aligned} min w=s.t.       24y1+15y2+30y34y13y2        72y16y2+5y3=46y14y2+y33y10,y20,y3

对偶问题的基本性质

1.弱对偶性:如果 X X X是原问题的可行解, Y Y Y是对偶问题的可行解,则   C X ≤ Y T b ~CX\le Y^Tb  CXYTb

证明:(注意这些矩阵乘积都是标量) Y T b ≥ Y T A X = ( Y T A X ) T = X T A T Y ≥ X T C T = C X Y^Tb\ge Y^TAX=(Y^TAX)^T=X^TA^TY\ge X^TC^T=CX YTbYTAX=(YTAX)T=XTATYXTCT=CX

推论:

  • 最优性:如果 X X X是原问题的可行解, Y Y Y是对偶问题的可行解, 且   C X = Y T b ~CX=Y^Tb  CX=YTb,则 X X X Y Y Y分别为原问题和对偶问题的最优解.

  • 无界性:如果原问题(对偶问题) 具有无界解, 则其对偶问题(原问题) 无可行解.

2.强对偶性:如果原问题有最优解,则其对偶问题也一定具有最优解,且   m a x   z = m i n   w ~max~z=min~w  max z=min w

证明:设 B B B为原问题标准形式的可行解基,且其基解为最优解,则由最优性条件应有检验数全部小于零:

  − C B B − 1 ≤ 0 , θ = C − C B B − 1 A ≤ 0 ~-C_BB^{-1}\le0, \theta=C-C_BB^{-1}A\le0  CBB10,θ=CCBB1A0

从而可得

  A T B − T C B T ≥ C T , B − T C B T ≥ 0 ~A^TB^{-T}C_B^T\ge C^T,B^{-T}C_B^T\ge0  ATBTCBTCT,BTCBT0

所以   B T C B T ~B^TC_B^T  BTCBT是对偶问题的一个可行解,且

( B − T C B T ) T b = C B B − 1 b = m a x   z (B^{-T}C_B^T)^Tb=C_BB^{-1}b=max~z (BTCBT)Tb=CBB1b=max z

由最优性可知, B − T C B T B^{-T}C_B^T BTCBT为对偶问题的最优解,且   m a x   z = m i n   w ~max~z=min~w  max z=min w

3.互补松弛性:在线性规划问题的最优解中,如果某一约束条件的对偶变量值非零,则该约束条件严格取等,反之,如果约束条件取不等式,则对应的对偶变量一定为0,可以表示为   Y T ( b − A X ) = 0 ~Y^T(b-AX)=0  YT(bAX)=0

证明:由强对偶性可知   C X = Y T b ~CX=Y^Tb  CX=YTb,又因为   C X = X T C T ≤ X T A T Y = Y T A X ≤ Y T b ~CX=X^TC^T\le X^TA^TY=Y^TAX\le Y^Tb  CX=XTCTXTATY=YTAXYTb

可得 Y T A X = Y b Y^TAX=Y^b YTAX=Yb,于是   Y T ( b − A X ) = 0 ~Y^T(b-AX)=0  YT(bAX)=0

4.基解互补性 原问题及其对偶问题之间存在一对互补的基解,其中原问题的松弛变量对应对偶问题的变量对偶问题的剩余变量对应原问题的变量.这些互相对应的变量如果在一个问题的解中是基变量则在另一个问题的解中是非基变量;将这对互补的集解分别带入原问题和对偶问题的目标函数中有   z = w   ~z=w~  z=w 

影子价格

我们考查如下对偶问题:
m a x   z = C X m i n   w = Y T b P { A X ≤ b X ≥ 0 D { A T Y ≤ C T Y ≥ 0 \begin{aligned} &max~z=CX&&min~w=Y^Tb\\ &P\left\{\begin{aligned} &AX\le b\\&X\ge0 \end{aligned}\right. &&D\left\{\begin{aligned} &A^TY\le C^T\\&Y\ge0 \end{aligned}\right. \end{aligned} max z=CXP{AXbX0min w=YTbD{ATYCTY0
​ 定义:若 P P P 的某个约束条件的右端项常数 b i b_i bi (第 i 种资源的拥有量)增加一个单位时,所引起目标函数最优值 z ∗ z^* z 的改变量称为第 i i i 种资源的影子价格,其值等于 D D D 问题中对偶变量 y i y_i yi

假设 ( x 1 ∗ , x 2 ∗ , … , x n ∗ ) (x_1^*,x_2^*,\dots,x_n^*) (x1,x2,,xn) ( y 1 ∗ , y 2 ∗ , … , y n ∗ ) (y_1^*,y_2^*,\dots,y_n^*) (y1,y2,,yn) 分别为原问题和对偶问题的最优解,由对偶问题的基本性质有 z ∗ = ∑ c j x j ∗ = ∑ b i y i ∗ z^*=\sum c_jx_j^*=\sum b_iy_i^* z=cjxj=biyi,因为某个 Δ b i = 1 \Delta b_i=1 Δbi=1,所以最优解的的变化 Δ z ∗ = y i ∗ \Delta z^*=y_i^* Δz=yi,也就是对偶变量 y i y_i yi就是第 i i i 个产品的影子价格 ∂ z ∗ ∂ b i = y i ∗ \displaystyle\frac{\partial z^*}{\partial b_i}=y_i^* biz=yi

影子价格是在资源最优利用条件下对单位资源的估价,这种估价不是资源实际的市场价格。影子价格是一种机会成本

我们假设某种资源的单位市场价是   m i ~m_i  mi,则

  • y i ∗ > m i y_i^*>m_i yi>mi 时,企业购进这种资源后增加的利润多于资源收购价,单位纯利为 y i ∗ − m i y_i^*-m_i yimi,有利可图;
  • 如果 y i ∗ < m i y_i^*yi<mi ,则企业会选择有偿转让这种资源,可获单位纯利 y i ∗ − m i y_i^*-m_i yimi ,否则,企业无利可图,甚至亏损。

我们根据互补松弛性 Y T ( b − A X ) = 0 Y^T(b-AX)=0 YT(bAX)=0,可以进一步得出:

  • 如果生产过程中如果某种资源未得到充分利用时(资源约束不严格取等),该种资源的影子价格为0(对偶问题的最优解对应变量为0);
  • 若当资源的影子价格不为0时,表明该种资源在生产中已耗费完(资源约束严格取等)。

影子价格对单纯形表计算的解释

​ 在单纯性表中的检验数为 θ j = c j − C B B − 1 P j = c j − ∑ a i j y i \theta_j=c_j-C_BB^{-1}P_j=c_j-\sum a_{ij}y_i θj=cjCBB1Pj=cjaijyi,其中 c j c_j cj 表示第 j j j 种产品的出售价; ∑ a i j y i \sum a_{ij}y_i aijyi 表示生产该种产品所消耗的各项资源的影子价格的总和,即产品的隐含成本

当产值大于隐含成本时,即 θ j > 0 \theta_j>0 θj>0,表明生产该项产品有利,可在计划中安排。

当产值小于隐含成本时,即 θ j < 0 \theta_j<0 θj<0,表明用这些资源生产别的产品更有利,不应生产这些产品。

对偶单纯形法

​ 对偶单纯形法是求解线性规划的另一个基本方法。它是根据对偶原理和单纯形法原理而设计出来的,因此称为对偶单纯形法。对偶单纯性法提高了对求解线性规划问题的效率,它通常具有以下优点:

  • 初始基解可以是非可行解, 当检验数都为负值时, 就可以进行基的变换, 不需加入人工变量, 从而简化计算;
  • 对于变量多于约束条件的线性规划问题,用对偶单纯形法可以减少计算量,在灵敏度分析及求解整数规划的割平面法中,有时适宜用对偶规划单纯形法。

回顾我们在用单纯形法解决线性规划问题时的方法:

​ 我们需要先找到一组基可行解,这就要求 b ≥ 0 b\ge0 b0,然后在保持   b ≥ 0 ~b\ge0  b0的前提下不断转换可行解直到最优。

​ 而在对偶单纯形方法中,我们要求:所有检验数 θ < 0 \theta<0 θ<0,但是 b b b 无要求。这时我们希望通过转化可行解使得 b = ( b 1 , b 2 , … , b m ) T b=(b_1,b_2,\dots,b_m)^T b=(b1,b2,,bm)T 更接近 ≥ 0 \ge0 0,同时保持 θ ≤ 0 \theta\le0 θ0,直到 b ≥ 0 b\ge0 b0,找到最优解。

对偶单纯形法的计算步骤

  1. 确定换出基变量

    对于小于零的 b i b_i bi,令 b r = m i n { b i } b_{r}=min\{b_i\} br=min{bi} 所对应的变量 x r x_{r} xr 为换出基变量。

  2. 确定换入基变量

    • 为使迭代后的表中第 r r r 行基变量为正值,因而只有对应 a r j < 0   ( j = m + 1 , … , n ) a_{rj}<0~(j=m+1,\dots,n) arj<0 (j=m+1,,n)(也就是系数均为负数)的非基变量才可以考虑。
    • 为使迭代后表中对偶问题的解仍为可行解,令   θ = m i n { θ j a r j ∣   a r j < 0 } = θ s a r s ~\displaystyle\theta=min\left\{ \left.\frac{\theta_j}{a_{rj}}\right|~ a_{rj}<0\right\}=\frac{\theta_s}{a_{rs}}  θ=min{arjθj arj<0}=arsθs,称 a r s a_{rs} ars为主元素, x s x_s xs 为换入基变量
  3. 用换入基变量替换换出基变量,得到一个新的基

    进行初等行变换后,检查所有 b i b_i bi是否 ≥ 0 \ge0 0

  4. 重复上述三步,直到 b ≥ 0 b\ge0 b0

单纯形表如下:

c c c c 1   …   …   c m     c m + 1   …   …   c n c_1~\dots~\dots~c_m~~~c_{m+1}~\dots~\dots~ c_n c1   cm   cm+1   cn
C B C_B CB X B X_B XB x 1   …   …   x m     x m + 1   …   …   x n x_1~\dots~\dots~x_m~~~x_{m+1}~\dots~\dots~ x_n x1   xm   xm+1   xn b b b
c 1 c_1 c1 x 1 x_1 x1 1    …   …    0     a 1 , m + 1   … …   a 1 n 1~~\dots~\dots~~0~~~a_{1,m+1}~\dots\dots~ a_{1n} 1     0   a1,m+1  a1n b 1 b_1 b1
⋮ \vdots ⋮ \vdots ⋮ \vdots ⋮ \vdots
⋮ \vdots ⋮ \vdots ⋮ \vdots ⋮ \vdots
c m c_m cm x m x_m xm 0    …   …    1     a m , m + 1   … …   a m n 0~~\dots~\dots~~1~~~a_{m,m+1}~\dots\dots~ a_{mn} 0     1   am,m+1  amn b m b_m bm
σ \sigma σ 0    …   …    0      σ j = c j − ∑ c i a i j 0~~\dots~\dots~~0~~~~\sigma_j=c_j-\sum c_ia_{ij} 0     0    σj=cjciaij
θ = θ j a r j \displaystyle\theta=\frac{\theta_j}{a_{rj}} θ=arjθj if    a r j < 0 ~~ a_{rj}<0   arj<0 −    …   …    −     θ m + 1 a r , m + 1   … …   θ n a r n -~~\dots~\dots~~-~~~\frac{\theta_{m+1}}{a_{r,m+1}}~\dots\dots~\frac{\theta_n}{a_{rn}}         ar,m+1θm+1  arnθn

单纯形法与对偶单纯形法

单纯形法 对偶单纯形法
原理 保证原问题是可行解的情况下向对偶问题可行的方向迭代 保证对偶问题是可行解的情况下向原问题可行的方向迭代
限制条件 单纯形表的 b ≥ 0 b\ge0 b0(找到基可行解) 检验数 σ ≤ 0 \sigma\le0 σ0
最优解判断 看非基变量的检验数是否都 ≤ 0 \le0 0 看对偶单纯形表的 b b b是否都 ≥ 0 \ge0 0
变量替换 先确定换入基变量,最小换最大;
检验数 σ j \sigma_j σj最大的非基变量为换入变量;
b j a j k \displaystyle\frac{b_j}{a_{jk}} ajkbj最小的基变量为换出变量。
先确定换出变量,最小换最小
b j b_j bj 最小的对应的基变量为换出变量;
θ j a r j \displaystyle\frac{\theta_j}{a_{rj}} arjθj 最小非基变量为换入变量。

灵敏度分析

​ 在前面的线性规划问题中,我们都是假定问题中的 A , b , C A,b,C A,b,C是已知的。但是实际上这些参数往往是一些估计和预测的数字,如市场条件发生变化, C C C 的值就会变化, A A A 会随着工艺技术条件的改变而改变,而 b b b 则是根据资源投入后能产生多大经济效果来决定的一种决策选择。

​ 因而一个自然的问题就是当这些参数中的一个或者几个发生变化时,问题的最优解会有什么变化,或者这些参数在一个多大的范围内变化时,问题的最优解或者最优基不变,这就是灵敏度分析所要解决的问题。

在使用单纯形法解决线性规划问题时,我们需要先通过初等行变换基变量对应的子矩阵化为单位矩阵,因此存在一个方阵 D D D 使得 D ( A    b ) = ( A ′    b ′ ) D(A~~b)=(A'~~b') D(A  b)=(A  b),易得 D = B − 1 D=B^{-1} D=B1,一般来讲,我们考虑如下几种问题的变化:

  1. 当某个 c j c_j cj 变化时, A ′   b ′ A'~b' A b无变化,非基变量的检验数 Δ σ j = − a i j Δ c j \Delta \sigma_j=-a_{ij}\Delta c_j Δσj=aijΔcj,要让最优解不发生变化,我们要求所有 σ j ∗ = σ j + Δ σ j ≤ 0 \sigma_j^*=\sigma_j+\Delta\sigma_j\le0 σj=σj+Δσj0
  2. 当某个 b j b_j bj 变化时, Δ b ′ = B − 1 Δ b \Delta b'=B^{-1}\Delta b Δb=B1Δb,要让最优解不发生变化,我们要求 b ∗ = b + B − 1 Δ b ≥ 0 b^*=b+B^{-1}\Delta b\ge0 b=b+B1Δb0
  3. 增加某个变量 x j x_j xj,对应的系数列向量为 P j P_j Pj,则单纯形表中需要新添加一列 P j ′ = B − 1 P j P_j'=B^{-1}P_j Pj=B1Pj,然后计算相应的检验数,继续用单纯形法计算最优解
  4. 增加一个约束条件,新产生一个剩余变量或者松弛变量,或者用前面学过的方法添加人工变量,将新变量加入基变量,重整单纯性表,根据 b b b σ \sigma σ 的情况选择方法求出最优解。

例题

有空再补

你可能感兴趣的:(运筹学)