该文章为对上述论文的阅读笔记,一点戳见,不吝赐教。
FP是一类包含比例项的优化问题,经济学、管理学、信息科学、光学、图论和计算机科学等广泛领域都对它进行了广泛的研究。
本文档是目的是将FP的应用扩展到通信系统设计中更广泛的优化问题,特别是功率控制、波束形成和用户调度等通常不能直接用比例形式表示的优化问题。
通常关注的是数据速率计算为 log ( 1 + SINR ) \text{log}(1 + \text{SINR}) log(1+SINR)的通信系统,SINR表示的是信干噪比(signal-to-interference-plus-noise ratio)。SINR在通信系统中的突出作用使得FP是网络设计和优化的宝贵工具,整个讨论集中在无线蜂窝网络,但它可以很容易地适应许多其他网络(例如,光网络或数字用户线路)。
尽管存在大多数关于FP的工作,但大多数工作是针对的单比问题(single-ratio)问题。而少数研究多比问题的工作(mltiple-ratio)的工作,它们又被限定在特定的形式(如,max-min问题)。而对于系统级通信网络设计,通常不得不应对多比问题,因为整个系统的性能通常是来自多个干扰链路的多个分数阶参数(如SINRs)的函数。求解多比的FP问题,是一个NP-hard问题,找到一个全局最优解十分耗费时间,甚至不可承担。对于求多比问题的驻点解,已知的方法只有连续凸逼近等通用方法。因此研究针对多比问题的FP十分有意义。
给定一个非空约束集合( d ∈ N d \in \mathbb{N} d∈N,即: d d d为严格的正整数): X ⊆ R d \mathcal{X} \subseteq \mathbb{R}^{d} X⊆Rd,一个非负函数: A ( x ) : R d → R + A(\mathbf{x}):\mathbb{R}^{d} \rightarrow \mathbb{R}_{+} A(x):Rd→R+,一个正函数: B ( x ) : R d → R + + B(\mathbf{x}): \mathbb{R}^{d} \rightarrow \mathbb{R}_{++} B(x):Rd→R++,一个单比问题(maximizing)可以表示为:
maximize x A ( x ) B ( x ) subject to x ∈ X \begin{array}{ll} \underset{\mathrm{x}}{\operatorname{maximize}} & \frac{A(\mathrm{x})}{B(\mathrm{x})} \\ \text { subject to } & \mathrm{x} \in \mathcal{X} \end{array} xmaximize subject to B(x)A(x)x∈X
上述的单比问题通常是非凸的。传统的FP方法通常是把该单比形式转化为分子分母解耦的形式,联合优化 A ( x ) A(\mathbf{x}) A(x)和 B ( x ) B(\mathbf{x}) B(x),特别是对于: A ( x ) A(\mathbf{x}) A(x)为凸函数, B ( x ) B(\mathbf{x}) B(x)为凹函数, X \mathcal{X} X为凸集的形式,称为concave-convex FP问题。
引入一个新的变量:
z = 1 B ( x ) a n d q = x B ( x ) z=\frac{1}{B(\mathrm{x})} \quad and \quad \mathbf{q}=\frac{\mathbf{x}}{B(\mathbf{x})} z=B(x)1andq=B(x)x
单比问题变为:
maximize z , q z A ( q z ) subject to z B ( q z ) ≤ 1 z ∈ Z q ∈ Q \begin{array}{ll} \underset{z, \mathbf{q}}{\operatorname{maximize}} & z A\left(\frac{\mathbf{q}}{z}\right) \\ \text { subject to } & z B\left(\frac{\mathbf{q}}{z}\right) \leq 1 \\ & z \in \mathcal{Z} \\ & \mathbf{q} \in \mathcal{Q} \end{array} z,qmaximize subject to zA(zq)zB(zq)≤1z∈Zq∈Q
其中, Z \mathcal{Z} Z和 Q \mathcal{Q} Q分别是 z z z和 q \mathbf{q} q的范围,且 x ∈ X \mathrm{x} \in \mathcal{X} x∈X原始的解 x \mathbf{x} x可以由 z z z和 q \mathbf{q} q恢复。
注意,这种方法通过将 B ( x ) B(\mathbf{x}) B(x)移动到约束 z B ( q z ) ≤ 1 z B\left(\frac{\mathbf{q}}{z}\right) \leq 1 zB(zq)≤1,而将 A ( x ) A(\mathbf{x}) A(x)留在目标中来解耦分母和分子。如果原始问题是concave-convex FP问题,那么通过该转换构造的凸问题可以被很好的解决。
针对Charnes-Cooper Transform需要注意的两个点:
该方法对于单比问题可以很好的解决,对于oncave-convex 单比FP问题事实上还能够收敛到全局最优。但拓展到多比问题(sum-of-ratios 问题)是十分困难的。
该方法将单比问题转化为:
maximize x A ( x ) − y B ( x ) subject to x ∈ X \begin{array}{ll} \underset{\mathrm{x}}{\operatorname{maximize}} & A(\mathrm{x})-y B(\mathrm{x}) \\ \text { subject to } & \mathrm{x} \in \mathcal{X} \end{array} xmaximize subject to A(x)−yB(x)x∈X
用一个新的辅助变量 y y y进行迭代更新,具体表示为:
y [ t + 1 ] = A ( x [ t ] ) B ( x [ t ] ) y[t+1]=\frac{A(\mathbf{x}[t])}{B(\mathbf{x}[t])} y[t+1]=B(x[t])A(x[t])
其中, t t t是迭代的index。可以证明,通过交替更新 y y y和求解转换后的单比问题中的 x \mathbf{x} x可以证明收敛性是有保证的,因为y在每次迭代后都是非递减的。
该方法同样对于单比问题可以很好的解决,对于concave-convex 单比FP问题,固定 y y y优化 x \mathbf{x} x是一个凸问题,其能够收敛到原始单比问题的全局最优。
Dinkelbach’s Transform相较于Charnes-Cooper Transform没有额外的约束被引入。
利用这种二次变换,希望新的函数有一些性质:
二次转换:
g ( x , y ) = 2 y A ( x ) − y 2 B ( x ) g(\mathrm{x}, y)=2 y \sqrt{A(\mathrm{x})}-y^{2} B(\mathrm{x}) g(x,y)=2yA(x)−y2B(x)
满足:C1-C4。进一步地,如果C4被加强,其要求: ∂ 2 g / ∂ y 2 \partial^{2} g / \partial y^{2} ∂2g/∂y2是独立于 y y y的,则任何一个满足C1-C4的 g ( x , y ) g(\mathrm{x}, y) g(x,y)必须满足如下形式:
g ( x , y ) = 2 ( t 1 y + t 2 ) A ( x ) − ( t 1 y + t 2 ) 2 B ( x ) g(\mathrm{x}, y)=2\left(t_{1} y+t_{2}\right) \sqrt{A(\mathrm{x})}-\left(t_{1} y+t_{2}\right)^{2} B(\mathrm{x}) g(x,y)=2(t1y+t2)A(x)−(t1y+t2)2B(x)
对于多比FP问题的二次转化:
sum-of-ratios问题表示为:
maximize x ∑ m = 1 M A m ( x ) B m ( x ) subject to x ∈ X \begin{array}{ll} \underset{\mathbf{x}}{\operatorname{maximize}} & \sum_{m=1}^{M} \frac{A_{m}(\mathbf{x})}{B_{m}(\mathbf{x})} \\ \text { subject to } & \mathbf{x} \in \mathcal{X} \end{array} xmaximize subject to ∑m=1MBm(x)Am(x)x∈X
注:此时如果强行直接将Dinkelbach’s Transform应用到多比问题,对于原始多比问题是不能够保证等价性的。
应用理论1可以将单比问题很容易的推广到多比问题,并且由于C3的性质可以很好地保证等价性
sum-of-ratios问题等价于:
maximize x , y ∑ m = 1 M ( 2 y m A m ( x ) − y m 2 B m ( x ) ) subject to x ∈ X , y m ∈ R \begin{array}{ll} \underset{\mathbf{x}, \mathbf{y}}{\operatorname{maximize}} & \sum_{m=1}^{M}\left(2 y_{m} \sqrt{A_{m}(\mathbf{x})}-y_{m}^{2} B_{m}(\mathbf{x})\right) \\ \text { subject to } & \mathbf{x} \in \mathcal{X}, y_{m} \in \mathbb{R} \end{array} x,ymaximize subject to ∑m=1M(2ymAm(x)−ym2Bm(x))x∈X,ym∈R
y \mathbf{y} y表示变量 { y 1 , … , y M } \left\{y_{1}, \ldots, y_{M}\right\} {y1,…,yM}的集合。
推广为更一般的sum-of-ratios问题和max-min-ratio问题,具体如下:
给定一个非递减函数,以及一系列的 A m / B m A_{m} / B_{m} Am/Bm( m = 1 , . . . , M m=1,...,M m=1,...,M),sum-of-functions-of-ratio问题可以表示为:
maximize x ∑ m = 1 M f m ( A m ( x ) B m ( x ) ) subject to x ∈ X \begin{aligned} &\operatorname{maximize}_{\mathbf{x}} \sum_{m=1}^{M} f_{m}\left(\frac{A_{m}(\mathbf{x})}{B_{m}(\mathbf{x})}\right)\\ &\text { subject to } \quad x \in \mathcal{X} \end{aligned} maximizexm=1∑Mfm(Bm(x)Am(x)) subject to x∈X
其等价为:
maximize x , y ∑ m = 1 M f m ( 2 y m A m ( x ) − y m 2 B m ( x ) ) subject to x ∈ X , y m ∈ R , m = 1 , … , M \begin{array}{ll} \underset{\mathbf{x}, \mathbf{y}}{\operatorname{maximize}} & \sum_{m=1}^{M} f_{m}\left(2 y_{m} \sqrt{A_{m}(\mathbf{x})}-y_{m}^{2} B_{m}(\mathbf{x})\right) \\ \text { subject to } & \mathbf{x} \in \mathcal{X}, y_{m} \in \mathbb{R}, m=1, \ldots, M \end{array} x,ymaximize subject to ∑m=1Mfm(2ymAm(x)−ym2Bm(x))x∈X,ym∈R,m=1,…,M
证明思路:首先将原问题写为最大化 z z z约束条件为: x ∈ X x \in \mathcal{X} x∈X和 z ≤ A m ( x ) / B m ( x ) z \leq A_{m}(\mathbf{x}) / B_{m}(\mathbf{x}) z≤Am(x)/Bm(x)。根据C3,最后一个约束条件可以写为: z ≤ max y m ( 2 y m A m ( x ) − y m 2 B m ( x ) ) z \leq \max _{y_{m}}\left(2 y_{m} \sqrt{A_{m}(\mathbf{x})}-y_{m}^{2} B_{m}(\mathbf{x})\right) z≤maxym(2ymAm(x)−ym2Bm(x)),由于这个新的约束是一个less-than-max不等式,那么 max y m \max _{y_{m}} maxym可以退化为 max x , y \max _{\mathbf{x}, \mathbf{y}} maxx,y
C3在等价问题转化中扮演了一个重要的角色!
进一步考虑分子为向量,分母为矩阵的多维复数情况下的FP。这类FP是在处理多天线通信系统时产生的。考虑一系列函数: a m ( x ) : C d 1 → C d 2 \mathbf{a}_{m}(\mathbf{x}): \mathbb{C}^{d_{1}} \rightarrow \mathbb{C}^{d_{2}} am(x):Cd1→Cd2和 B m ( x ) : C d 1 → S + + d 2 × d 2 \mathbf{B}_{m}(\mathbf{x}): \mathbb{C}^{d_{1}} \rightarrow \mathbf{S}_{++}^{d_{2} \times d_{2}} Bm(x):Cd1→S++d2×d2( m = 1 , . . . , M m=1,...,M m=1,...,M),约束集为: X ⊆ C d 1 \mathcal{X} \subseteq \mathbb{C}^{d_{1}} X⊆Cd1且 d 1 , d 2 ∈ N d_{1}, d_{2} \in \mathbb{N} d1,d2∈N,多维单比FP问题定义为:
maximize x ∑ m = 1 M a m † ( x ) B m − 1 ( x ) a m ( x ) subject to x ∈ X \begin{aligned} &\underset{\mathbf{x}}{\operatorname{maximize}} \sum_{m=1}^{M} \mathbf{a}_{m}^{\dagger}(\mathbf{x}) \mathbf{B}_{m}^{-1}(\mathbf{x}) \mathbf{a}_{m}(\mathbf{x})\\ &\text { subject to } \quad x \in \mathcal{X} \end{aligned} xmaximizem=1∑Mam†(x)Bm−1(x)am(x) subject to x∈X
该问题等价为:
maximize x , y ∑ m = 1 M ( 2 Re { y m † a m ( x ) } − y m † B m ( x ) y m ) subject to x ∈ X , y m ∈ C d 2 \begin{array}{ll} \underset{\mathbf{x}, \mathbf{y}}{\operatorname{maximize}} & \sum_{m=1}^{M}\left(2 \operatorname{Re}\left\{\mathbf{y}_{m}^{\dagger} \mathbf{a}_{m}(\mathbf{x})\right\}-\mathbf{y}_{m}^{\dagger} \mathbf{B}_{m}(\mathbf{x}) \mathbf{y}_{m}\right) \\ \text { subject to } & \mathbf{x} \in \mathcal{X}, \mathbf{y}_{m} \in \mathbb{C}^{d_{2}} \end{array} x,ymaximize subject to ∑m=1M(2Re{ym†am(x)}−ym†Bm(x)ym)x∈X,ym∈Cd2
y \mathbf{y} y表示变量 { y 1 , … , y M } \left\{y_{1}, \ldots, y_{M}\right\} {y1,…,yM}的集合。
简单的证明思路:将新的等价问题重新表示为 y m † a m + a m † y m − y m † B m y m \mathbf{y}_{m}^{\dagger} \mathbf{a}_{m}+\mathbf{a}_{m}^{\dagger} \mathbf{y}_{m}-\mathbf{y}_{m}^{\dagger} \mathbf{B}_{m} \mathbf{y}_{m} ym†am+am†ym−ym†Bmym,进一步可以写为: a m † B m − 1 a m − ( y m † − a m † B m − 1 ) B m ( y m − B m − 1 a m ) {\mathbf{a}}_m^\dag {\mathbf{B}}_m^{ - 1}{{\mathbf{a}}_m} - \left( {{\mathbf{y}}_m^\dag - {\mathbf{a}}_m^\dag {\mathbf{B}}_m^{ - 1}} \right){{\mathbf{B}}_m}\left( {{{\mathbf{y}}_m} - {\mathbf{B}}_m^{ - 1}{{\mathbf{a}}_m}} \right) am†Bm−1am−(ym†−am†Bm−1)Bm(ym−Bm−1am)(原文有笔误!),可以很容易的看出其最优解为 y m 1 ⋆ = B m − 1 ( x ) a m ( x ) \mathbf{y}_{m_{1}}^{\star}=\mathbf{B}_{m}^{-1}(\mathbf{x}) \mathbf{a}_{m}(\mathbf{x}) ym1⋆=Bm−1(x)am(x),此时其最优值恰好就是 a m † B m − 1 a m \mathbf{a}_{m}^{\dagger} \mathbf{B}_{m}^{-1} \mathbf{a}_{m} am†Bm−1am,因此等价性被建立。
之前讨论是假设分子非负,分母为正,现在讨论特殊类型的Concave-Convex FP问题,其在通信系统设计中尤为重要。
满足Concave-Convex FP问题需要如下条件:
对于single-ratio concave-convex FP问题,前面的几种转化都可以很好地解决。现在主要关注multiple-ratio concaveconvex FP 问题。为了说明问题,以标量形式为例,同样可以更根据理论2很容易地拓展到多维形式。
考虑sum-of-ratios、sum-of-functions-of-ratio、max-min-ratio问题。同时假设,每个 A m ( x ) A_{m}(\mathrm{x}) Am(x)是凹的,每个 B m ( x ) B_{m}(\mathrm{x}) Bm(x)是凸的, X \mathcal{X} X是具有标准形式的凸集。假设函数 f m ( ⋅ ) f_{m}(\cdot) fm(⋅)是非递减的。应用二次转换,交替迭代优化原始变量 B m ( x ) B_{m}(\mathrm{x}) Bm(x)和辅助变量 y m y_{m} ym。
当 x \mathrm{x} x固定时,最优 y m y_{m} ym存在闭式解:
y m ⋆ = A m ( x ) B m ( x ) , ∀ m = 1 , … , M y_{m}^{\star}=\frac{\sqrt{A_{m}(\mathrm{x})}}{B_{m}(\mathrm{x})}, \forall m=1, \ldots, M ym⋆=Bm(x)Am(x),∀m=1,…,M
当 y m y_{m} ym固定时,由于每个 A m ( x ) A_{m}(\mathrm{x}) Am(x)的凹性,每个 B m ( x ) B_{m}(\mathrm{x}) Bm(x)的凸性,以及平方根函数是凹的并且是递增的,二次变化函数:
g ( x , y m ) = 2 y m A m ( x ) − y m 2 B m ( x ) g\left(\mathrm{x}, y_{m}\right)=2 y_{m} \sqrt{A_{m}(\mathrm{x})}-y_{m}^{2} B_{m}(\mathrm{x}) g(x,ym)=2ymAm(x)−ym2Bm(x)
对于固定 y m y_{m} ym时的 x \mathrm{x} x是凸的。进一步,由于 f m ( ⋅ ) f_{m}(\cdot) fm(⋅)是凸的且非递减,因此 f m ( g ( x , y m ) ) f_{m}\left(g\left(\mathbf{x}, y_{m}\right)\right) fm(g(x,ym))对于 x \mathrm{x} x是凸的。因此,通过数值凸优化可以有效地得到最优 x \mathrm{x} x。
整个算法总结为:
算法1是能够保证concave-convex FP收敛到一个驻点的。
对于concave-convex sum-of-functions-of-ratio问题,即:每个 A m ( x ) A_{m}(\mathrm{x}) Am(x)是凹的,每个 B m ( x ) B_{m}(\mathrm{x}) Bm(x)是凸的, X \mathcal{X} X是具有标准形式的凸集,函数 f m ( ⋅ ) f_{m}(\cdot) fm(⋅)是非递减的凸函数。算法1包含了一些列的凸优化问题,其可以收敛到原始sum-of-functions-of-ratio问题的一个驻点,且每次迭代的都是非减的。
证明:算法1本质上是重新表述问题的块坐标上升算法(block coordinate ascent algorithm),因此其可以收敛到二次转换后的函数的一个驻点。由于解的等价性(C2)和目标函数值的等价性(C3),在最优 y ⋆ \mathbf{y}^{\star} y⋆下,二次问题和原始的问题是等价的。因此,算法能够收敛到原始问题的一个驻点,而C3则又保证了sum-of-functions-of-ratio 的值是非递减的。
文中证明了:关于可微 A ( x ) , B ( x ) A(\mathbf{x}), B(\mathbf{x}) A(x),B(x)的单比问题和max-min-ratio concave-convex FP问题,算法1是可以收敛到一个全局最优。
文中给了一个具体的单比问题,
maximize x x x 2 + 1 subject to x ≥ 0 \begin{array}{cl} \underset{x}{\operatorname{maximize}} & \frac{x}{x^{2}+1} \\ \text { subject to } & x \geq 0 \end{array} xmaximize subject to x2+1xx≥0
收敛速度,以 lim t → ∞ ∣ y ⋆ − y t + 1 ∣ ∣ y ⋆ − y t ∣ \lim _{t \rightarrow \infty} \frac{\left|y^{\star}-y_{t+1}\right|}{\left|y^{\star}-y_{t}\right|} limt→∞∣y⋆−yt∣∣y⋆−yt+1∣进行衡量。
对于该例子,最后计算发现算法1的收敛速度是慢于Dinkelbach’s transform的。
虽然传统的Dinkelbach变换比二次变换具有更快的收敛速度,但前者的应用仅限于单比问题,而后者可以处理多比问题。
金句:
For multiple-ratio FP problems where global convergence is not guaranteed, slower convergence can sometime be advantageous as it allows the algorithm to more fully explore the solution space.
考虑一个带有一组单天线基站(BSs) B \mathcal{B} B的下行SISO蜂窝网络。具体参数:
则,第 i i i用户的下行速率可以表示为:
R i = log ( 1 + ∣ h i , i ∣ 2 p i ∑ j ≠ i ∣ h i , j ∣ 2 p j + σ 2 ) R_{i}=\log \left(1+\frac{\left|h_{i, i}\right|^{2} p_{i}}{\sum_{j \neq i}\left|h_{i, j}\right|^{2} p_{j}+\sigma^{2}}\right) Ri=log(1+∑j=i∣hi,j∣2pj+σ2∣hi,i∣2pi)
考虑weighted sum rate:
f o ( p ) = ∑ i ∈ B w i R i f_{o}(\mathbf{p})=\sum_{i \in \mathcal{B}} w_{i} R_{i} fo(p)=i∈B∑wiRi
其中 w i w_{i} wi代表第 i i i个BS-user下行链路的优先权, p \mathbf{p} p表示集合 { p i } i ∈ B \left\{p_{i}\right\}_{i \in \mathcal{B}} {pi}i∈B。整个功率控制问题可以表示为:
maximize p f o ( p ) subject to 0 ≤ p i ≤ P max , ∀ i ∈ B , ( 30 ) \begin{array}{ll} \underset{\mathbf{p}}{\operatorname{maximize}} & f_{o}(\mathbf{p}) \\ \text { subject to } & 0 \leq p_{i} \leq P_{\max }, \forall i \in \mathcal{B},\quad(30) \end{array} pmaximize subject to fo(p)0≤pi≤Pmax,∀i∈B,(30)
住:该问题非凸十分难以结局,可以使用用多块近似方法得到全局解,但不是多项式时间。此外,当所有的SINR都足够高,使得 log ( 1 + SINR ) \log (1+\operatorname{SINR}) log(1+SINR)可以近似为 log ( SINR ) \log (\operatorname{SINR}) log(SINR)时,该问题可以通过几何规划来全局求解。本文的目的是用一种有效的方法找到至少一个驻点。
log函数是非凸的且不减的,利用二次转换,其可以表示为如下的问题:
maximize p , y f q D I R ( p , y ) subject to 0 ≤ p i ≤ P max , ∀ i ∈ B y i ∈ R , ∀ i ∈ B \begin{array}{ll} \underset{\mathbf{p}, \mathbf{y}}{\operatorname{maximize}} & f_{q}^{\mathrm{DIR}}(\mathbf{p}, \mathbf{y}) \\ \text { subject to } & 0 \leq p_{i} \leq P_{\max }, \forall i \in \mathcal{B} \\ & y_{i} \in \mathbb{R}, \forall i \in \mathcal{B} \end{array} p,ymaximize subject to fqDIR(p,y)0≤pi≤Pmax,∀i∈Byi∈R,∀i∈B
其中:
f q D I R ( x , y ) = ∑ i ∈ B w i log ( 1 + 2 y i ∣ h i , i ∣ 2 p i − y i 2 ( ∑ j ≠ i ∣ h i , j ∣ 2 p j + σ 2 ) ) f_{q}^{\mathrm{DIR}}(\mathbf{x}, \mathbf{y})=\sum_{i \in \mathcal{B}} w_{i} \log \left(1+2 y_{i} \sqrt{\left|h_{i, i}\right|^{2} p_{i}}\right.\left.-y_{i}^{2}\left(\sum_{j \neq i}\left|h_{i, j}\right|^{2} p_{j}+\sigma^{2}\right)\right) fqDIR(x,y)=i∈B∑wilog(1+2yi∣hi,i∣2pi−yi2⎝⎛j=i∑∣hi,j∣2pj+σ2⎠⎞⎠⎞
y i y_{i} yi是由每个下行链路 i i i的二次变换引入的。
根据算法1,交替优化 y i y_{i} yi和 p i p_{i} pi。对于固定的 p i p_{i} pi,最优 y i y_{i} yi表示为:
y i ⋆ = ∣ h i , i ∣ 2 p i ∑ j ≠ i ∣ h i , j ∣ 2 p j + σ 2 y_{i}^{\star}=\frac{\sqrt{\left|h_{i, i}\right|^{2} p_{i}}}{\sum_{j \neq i}\left|h_{i, j}\right|^{2} p_{j}+\sigma^{2}} yi⋆=∑j=i∣hi,j∣2pj+σ2∣hi,i∣2pi
然后,固定 y i y_{i} yi寻找最优的 p i p_{i} pi是一个凸问题,整个功率控制方法可以被总结为算法2。
根据理论3,算法2是可以保证收敛到一个驻点的。
算法2可以很容易的延伸到多波段系统,频段被分为 T T T个子频段,用户速率可以被计算为:
R i = ∑ t = 1 T 1 T log ( 1 + ∣ h i , i t ∣ 2 p i t ∑ j ≠ i ∣ h i , j t ∣ 2 p j t + σ 2 ) R_{i}=\sum_{t=1}^{T} \frac{1}{T} \log \left(1+\frac{\left|h_{i, i}^{t}\right|^{2} p_{i}^{t}}{\sum_{j \neq i}\left|h_{i, j}^{t}\right|^{2} p_{j}^{t}+\sigma^{2}}\right) Ri=t=1∑TT1log(1+∑j=i∣∣hi,jt∣∣2pjt+σ2∣∣hi,it∣∣2pit)
h i , j t h_{i, j}^{t} hi,jt和 p j t p_{j}^{t} pjt分别代表第 t t t个子频段的信道和传输功率水平。整个功率约束表示为:
∑ t = 1 T p i t ≤ P max , ∀ i ∈ B , p i t ≥ 0 , ∀ i ∈ B , t = 1 , … , T \sum_{t=1}^{T} p_{i}^{t} \leq P_{\max }, \forall i \in \mathcal{B}, \quad p_{i}^{t} \geq 0, \forall i \in \mathcal{B}, t=1, \ldots, T t=1∑Tpit≤Pmax,∀i∈B,pit≥0,∀i∈B,t=1,…,T
要修改算法2以在这个多波段场景中工作:步骤1保持不变;步骤2通过解决凸问题更新 p p p。
功率控制的直接FP方法可以适应无线网络中一般速率效用函数的最大化。
进一步的,直接FP方法可以被用于解决最大化最小速率问题
闭式FP的方法是基于拉格朗日对偶重塑问题。这将导致重构的新问题在每次迭代中均是以闭式解执行,而不是用数值方法解决一个凸优化问题。原始的功率问题通过拉格朗日对偶可以等价为:
maximize x , γ f r C F ( x , γ ) subject to x ∈ X \begin{array}{ll} \underset{\mathbf{x},\mathbf{\gamma}}{\operatorname{maximize}} & f_{r}^{\mathrm{CF}}(\mathbf{x}, \gamma) \\ \text { subject to } & \mathbf{x} \in \mathcal{X} \end{array} x,γmaximize subject to frCF(x,γ)x∈X
其中 γ \mathbf{\gamma} γ是一系列辅助变量 { γ i } i ∈ B \left\{\gamma_{i}\right\}_{i \in \mathcal{B}} {γi}i∈B的集合,新的目标函数为:
f r C F ( p , γ ) = ∑ i ∈ B w i log ( 1 + γ i ) − ∑ i ∈ B w i γ i + ∑ i ∈ B w i ( 1 + γ i ) ∣ h i , i ∣ 2 p i ∑ j ∈ B ∣ h i , j ∣ 2 p j + σ 2 f_{r}^{\mathrm{CF}}(\mathbf{p}, \gamma)=\sum_{i \in \mathcal{B}} w_{i} \log \left(1+\gamma_{i}\right)-\sum_{i \in \mathcal{B}} w_{i} \gamma_{i} +\sum_{i \in \mathcal{B}} \frac{w_{i}\left(1+\gamma_{i}\right)\left|h_{i, i}\right|^{2} p_{i}}{\sum_{j \in \mathcal{B}}\left|h_{i, j}\right|^{2} p_{j}+\sigma^{2}} frCF(p,γ)=i∈B∑wilog(1+γi)−i∈B∑wiγi+i∈B∑∑j∈B∣hi,j∣2pj+σ2wi(1+γi)∣hi,i∣2pi
当 p i p_i pi固定时,最优 γ i \gamma_{i} γi通过 ∂ f r C F / ∂ γ i \partial f_{r}^{\mathrm{CF}} / \partial \gamma_{i} ∂frCF/∂γi置0得到,有:
γ i ⋆ = ∣ h i , i ∣ 2 p i ∑ j ≠ i ∣ h i , j ∣ 2 p j + σ 2 , ∀ i ∈ B , ( 42 ) \gamma_{i}^{\star}=\frac{\left|h_{i, i}\right|^{2} p_{i}}{\sum_{j \neq i}\left|h_{i, j}\right|^{2} p_{j}+\sigma^{2}}, \forall i \in \mathcal{B},\quad(42) γi⋆=∑j=i∣hi,j∣2pj+σ2∣hi,i∣2pi,∀i∈B,(42)
可以看出,最优的 γ i \gamma_{i} γi等价于BS i i i的下行SINR。当 γ i \gamma_{i} γi固定时, f r C F f_{r}^{\mathrm{CF}} frCF的最后一项,是一个sum-of-ratio项,其包含了 p i p_i pi的优化。利用二次转换, f r C F f_{r}^{\mathrm{CF}} frCF可以重铸为:
f q C F ( p , γ , y ) = ∑ i ∈ B 2 y i w i ( 1 + γ i ) ∣ h i , i ∣ 2 p i − ∑ i ∈ B y i 2 ( ∑ j ∈ B ∣ h i , j ∣ 2 p j + σ 2 ) + const ( γ ) f_{q}^{\mathrm{CF}}(\mathbf{p}, \gamma, \mathbf{y}) =\sum_{i \in \mathcal{B}} 2 y_{i} \sqrt{w_{i}\left(1+\gamma_{i}\right)\left|h_{i, i}\right|^{2} p_{i}} - \sum_{i \in \mathcal{B}} y_{i}^{2}\left(\sum_{j \in \mathcal{B}}\left|h_{i, j}\right|^{2} p_{j}+\sigma^{2}\right)+\operatorname{const}(\gamma) fqCF(p,γ,y)=i∈B∑2yiwi(1+γi)∣hi,i∣2pi−i∈B∑yi2⎝⎛j∈B∑∣hi,j∣2pj+σ2⎠⎞+const(γ)
其中, y \mathbf{y} y表示集合 { y i } i ∈ B \left\{y_{i}\right\}_{i \in \mathcal{B}} {yi}i∈B, const ( γ ) \operatorname{const}(\gamma) const(γ)表示当 γ \mathbf{\gamma} γ时的一些常数项。而 p i p_i pi和 y i y_i yi关于最大化 f q C F f_{q}^{\mathrm{CF}} fqCF,均存在闭式解为:
p i ⋆ = min { P max , y i 2 w i ( 1 + γ i ) ∣ h i , i ∣ 2 ( ∑ j ∈ B y j 2 ∣ h j , i ∣ 2 ) 2 } , ∀ i ∈ B , ( 44 ) p_{i}^{\star}=\min \left\{P_{\max }, \frac{y_{i}^{2} w_{i}\left(1+\gamma_{i}\right)\left|h_{i, i}\right|^{2}}{\left(\sum_{j \in \mathcal{B}} y_{j}^{2}\left|h_{j, i}\right|^{2}\right)^{2}}\right\}, \forall i \in \mathcal{B},\quad(44) pi⋆=min⎩⎪⎨⎪⎧Pmax,(∑j∈Byj2∣hj,i∣2)2yi2wi(1+γi)∣hi,i∣2⎭⎪⎬⎪⎫,∀i∈B,(44)
y i ⋆ = w i ( 1 + γ i ) ∣ h i , i ∣ 2 p i ∑ j ∈ B ∣ h i , j ∣ 2 p j + σ 2 , ∀ i ∈ B , , ( 45 ) y_{i}^{\star}=\frac{\sqrt{w_{i}\left(1+\gamma_{i}\right)\left|h_{i, i}\right|^{2} p_{i}}}{\sum_{j \in \mathcal{B}}\left|h_{i, j}\right|^{2} p_{j}+\sigma^{2}}, \forall i \in \mathcal{B},,\quad(45) yi⋆=∑j∈B∣hi,j∣2pj+σ2wi(1+γi)∣hi,i∣2pi,∀i∈B,,(45)
整个交替迭代更新的步骤可以总结为步骤3。
算法3可以解释为一阶条件下的不动点迭代。获得功率控制问题的不动点解等价于找到(30)的一阶条件的解,即:
∂ f o ( p ) ∂ p i = 0 , ∀ i ∈ B , ( 46 ) \frac{\partial f_{o}(\mathbf{p})}{\partial p_{i}}=0, \forall i \in \mathcal{B},\quad (46) ∂pi∂fo(p)=0,∀i∈B,(46)
其具体表示为:
1 p i ⋅ w i γ i ( p ) 1 + γ i ( p ) ⏟ T 1 i ( p ) − ∑ j ≠ i w j γ i 2 ( p ) ∣ h j , i ∣ 2 ( 1 + γ i ( p ) ) ∣ h j , j ∣ 2 p j ⏟ T 2 i ( p ) = 0 , ( 47 , 作 者 存 在 笔 误 ) \frac{1}{p_{i}} \cdot \underbrace{\frac{w_{i} \gamma_{i}(\mathbf{p})}{1+\gamma_{i}(\mathbf{p})}}_{T_{1 i}(\mathbf{p})}-\underbrace{\sum_{j \neq i} \frac{w_{j} \gamma_{i}^{2}(\mathbf{p})\left|h_{j, i}\right|^{2}}{\left(1+\gamma_{i}(\mathbf{p})\right)\left|h_{j, j}\right|^{2} p_{j}}}_{T_{2 i}(\mathbf{p})}=0,\quad (47,作者存在笔误) pi1⋅T1i(p) 1+γi(p)wiγi(p)−T2i(p) j=i∑(1+γi(p))∣hj,j∣2pjwjγi2(p)∣hj,i∣2=0,(47,作者存在笔误)
为了找到一个满足上述一阶条件条件的功率集合,一个策略是在方程的一边孤立 p i p_i pi,这自动产生一个功率更新方程,如果收敛,将至少实现功率控制问题的一个平稳点。但是,为了保证不动点迭代的收敛性,一般不容易确定(46)左边的哪一部分应该固定,一些文章建议固定 T 1 i T_{1i} T1i和 T 2 i T_{2i} T2i,并达到如下功率控制的定点方法:
p i [ t + 1 ] = min { P max , T 1 i ( p [ t ] ) T 2 i ( p [ t ] ) } , ∀ i ∈ B p_{i}[t+1]=\min \left\{P_{\max }, \frac{T_{1 i}(\mathbf{p}[t])}{T_{2 i}(\mathbf{p}[t])}\right\}, \forall i \in \mathcal{B} pi[t+1]=min{Pmax,T2i(p[t])T1i(p[t])},∀i∈B
其中index i i i表示迭代次数。然而,这种不动点迭代并不一定收敛。(事实上,有文章证明了当得到的SINR值都足够高时,这种迭代保证收敛。)
对于闭式FP方法,把 γ ⋆ \gamma^{\star} γ⋆和 y ⋆ \mathrm{y}^{\star} y⋆带入到(44),更新式子(44)也可以看作是功率控制的第一阶条件的不动点迭代,它和(47)非常相似,如下:
1 p i ⋅ w i γ i ( p ) p i ⏟ T ~ 1 i ( p ) − ∑ j w j γ i 2 ( p ) ∣ h j , i ∣ 2 ( 1 + γ i ( p ) ) ∣ h j , j ∣ 2 p j ⏟ T ~ 2 i ( p ) = 0. \frac{1}{\sqrt{p_{i}}} \cdot \underbrace{\frac{w_{i} \gamma_{i}(\mathbf{p})}{\sqrt{p_{i}}}}_{\widetilde{T}_{1 i}(\mathbf{p})}-\underbrace{\sum_{j} \frac{w_{j} \gamma_{i}^{2}(\mathbf{p})\left|h_{j, i}\right|^{2}}{\left(1+\gamma_{i}(\mathbf{p})\right)\left|h_{j, j}\right|^{2} p_{j}}}_{\tilde{T}_{2 i}(\mathbf{p})}=0 . pi1⋅T 1i(p) piwiγi(p)−T~2i(p) j∑(1+γi(p))∣hj,j∣2pjwjγi2(p)∣hj,i∣2=0.
在这种情况下,发射功率变量 p i p_i pi更新变为:
p i [ t + 1 ] = min { P max , ( T ~ 1 i ( p [ t ] ) T ~ 2 i ( p [ t ] ) ) 2 } , ∀ i ∈ B p_{i}[t+1]=\min \left\{P_{\max },\left(\frac{\widetilde{T}_{1 i}(\mathbf{p}[t])}{\widetilde{T}_{2 i}(\mathbf{p}[t])}\right)^{2}\right\}, \forall i \in \mathcal{B} pi[t+1]=min⎩⎨⎧Pmax,(T 2i(p[t])T 1i(p[t]))2⎭⎬⎫,∀i∈B
再加上一个附加的投影步骤到约束集上,经过一些代数运算,可以看到是(44)。因此,算法3的功率控制部分只是一个不动点迭代,但其具有保证收敛性的关键优势。
图3显示了各种功率控制算法在平坦衰落信道中的性能。闭型FP需要最大的迭代次数来收敛,但是它每次迭代的计算量是最低的,因为每次迭代它有闭式解的形式更新。相比之下,SCALE和直接FP都需要在每次迭代中解决一个凸问题。闭式FP的在迭代的基础上,该方法也比牛顿法的复杂度低。闭式FP最快
图4仿真了频率选择性衰落场景,其中带宽分为4个子频带,每个频带调度一个下行用户。由此产生的功率控制不同于平坦衰落情况,因为子带之间存在功率和约束,即: ∑ n p i n ≤ P max \sum_{n} p_{i}^{n} \leq P_{\max } ∑npin≤Pmax。 p i p_i pi`表示BS i i i在第 n n n个频段的功率水平。
结论:
基于FP的方法在功率控制方面与最先进的算法具有竞争优势。FP由于其较低的迭代成本而具有较低的总体复杂度。需要注意的是,不同算法的收敛值可能会因起始点的不同而不同,因为在所有情况下只保证平稳收敛。
考虑多维FP在波束形成优化问题中的应用。考虑下行一组BSs B \mathcal{B} B的MIMO蜂窝网络。具体参数如下:
数据流 ( i , m ) (i,m) (i,m)的速率表示为:
R i m ( V ) = log ( 1 + v i m † H i m , i † ( σ 2 I + ∑ ( j , n ) ≠ ( i , m ) H i m , j v j n v j n † H i m , j † ) − 1 H i m , i v i m ) R_{i m}(\mathbf{V})=\log \left(1+\mathbf{v}_{i m}^{\dagger} \mathbf{H}_{i m, i}^{\dagger}\left(\sigma^{2} \mathbf{I}+\sum_{(j, n) \neq(i, m)} \mathbf{H}_{i m, j} \mathbf{v}_{j n} \mathbf{v}_{j n}^{\dagger} \mathbf{H}_{i m, j}^{\dagger}\right)^{-1} \mathbf{H}_{i m, i} \mathbf{v}_{i m}\right) Rim(V)=log⎝⎜⎛1+vim†Him,i†⎝⎛σ2I+(j,n)=(i,m)∑Him,jvjnvjn†Him,j†⎠⎞−1Him,ivim⎠⎟⎞
设 w i w_i wi表示表示在BS i i i第 m m m个数据流被调度用户的优先级。寻求最大化波束形成矢量的加权和速率问题为:
maximize V ∑ i , m w i m R i m ( V ) subject to ∑ m = 1 M ∥ v i m ∥ 2 2 ≤ P max , ∀ i ∈ B \begin{array}{ll} \underset{\mathbf{V}}{\operatorname{maximize}} & \sum_{i, m} w_{i m} R_{i m}(\mathbf{V}) \\ \text { subject to } & \sum_{m=1}^{M}\left\|\mathbf{v}_{i m}\right\|_{2}^{2} \leq P_{\max }, \forall i \in \mathcal{B} \end{array} Vmaximize subject to ∑i,mwimRim(V)∑m=1M∥vim∥22≤Pmax,∀i∈B
引用多维二次转换于每个SINR项,新的问题可以表示为:
maximize V , Y f q D I R ( V , Y ) subject to ∑ m = 1 M ∥ v i m ∥ 2 2 ≤ P max , ∀ i ∈ B y i m ∈ C N , ( 52 ) \begin{array}{ll} \underset{\mathbf{V}, \mathbf{Y}}{\operatorname{maximize}} & f_{q}^{\mathrm{DIR}}(\mathbf{V}, \mathbf{Y}) \\ \text { subject to } & \sum_{m=1}^{M}\left\|\mathbf{v}_{i m}\right\|_{2}^{2} \leq P_{\max }, \forall i \in \mathcal{B} \\ & \mathbf{y}_{i m} \in \mathbb{C}^{N},\quad(52) \end{array} V,Ymaximize subject to fqDIR(V,Y)∑m=1M∥vim∥22≤Pmax,∀i∈Byim∈CN,(52)
其中:
f q D I R ( V , Y ) = ∑ ( i , m ) w i m log ( 1 + 2 Re { y i m † H i m , i v i m } − y i m † ( σ 2 I + ∑ ( j , n ) ≠ ( i , m ) H i m , j v j n v j n † H i m , j † ) y i m ) f_{q}^{\mathrm{DIR}}(\mathbf{V}, \mathbf{Y})=\sum_{(i, m)} w_{i m} \log \left(1+2 \operatorname{Re}\left\{\mathbf{y}_{i m}^{\dagger} \mathbf{H}_{i m, i} \mathbf{v}_{i m}\right\}-\mathbf{y}_{i m}^{\dagger}\left(\sigma^{2} \mathbf{I}+\sum_{(j, n) \neq(i, m)} \mathbf{H}_{i m, j} \mathbf{v}_{j n} \mathbf{v}_{j n}^{\dagger} \mathbf{H}_{i m, j}^{\dagger}\right) \mathbf{y}_{i m}\right) fqDIR(V,Y)=(i,m)∑wimlog⎝⎛1+2Re{yim†Him,ivim}−yim†⎝⎛σ2I+(j,n)=(i,m)∑Him,jvjnvjn†Him,j†⎠⎞yim⎠⎞
$ \mathbf{Y} 表 示 为 每 个 数 据 流 表示为每个数据流 表示为每个数据流(i,m) 辅 助 变 量 集 合 辅助变量集合 辅助变量集合\left{\mathbf{y}{i m}\right} ( ( (\mathbf{y}{i m} \in \mathbb{C}^{N}$)。
解耦后的函数对于 v i m \mathbf{v}_{i m} vim是一个凹函数,由于log函数不减凹的函数,新的优化问题对于 y i m \mathbf{y}_{i m} yim固定时的 v i m \mathbf{v}_{i m} vim是一个凸问题。
应用算法1在 y i m \mathbf{y}_{i m} yim和 v i m \mathbf{v}_{i m} vim之间交替迭代,当 v i m \mathbf{v}_{i m} vim固定时最优 y i m \mathbf{y}_{i m} yim表示为:
y i m ⋆ = ( σ 2 I + ∑ ( j , n ) ≠ ( i , m ) H i m , j v j n v j n † H i m , j † ) − 1 H i m , i v i m \mathbf{y}_{i m}^{\star}=\left(\sigma^{2} \mathbf{I}+\sum_{(j, n) \neq(i, m)} \mathbf{H}_{i m, j} \mathbf{v}_{j n} \mathbf{v}_{j n}^{\dagger} \mathbf{H}_{i m, j}^{\dagger}\right)^{-1} \mathbf{H}_{i m, i} \mathbf{v}_{i m} yim⋆=⎝⎛σ2I+(j,n)=(i,m)∑Him,jvjnvjn†Him,j†⎠⎞−1Him,ivim
对于固定的 y i m \mathbf{y}_{i m} yim,最优 v i m \mathbf{v}_{i m} vim可以通过凸优化得到。整个交替迭代更具理论3是可以收敛到一个驻点的。整个算法4总结如下:
应用拉格朗日对偶转换,原问题可以表示为 f r C F ( V , γ ) f_{r}^{\mathrm{CF}}(\mathbf{V}, \mathbf{\gamma}) frCF(V,γ):
f r C F ( V , γ ) = ∑ ( i , m ) w i m ( log ( 1 + γ i m ) − γ i m + ( 1 + γ i m ) v i m † H i m , i † ( σ 2 I + ∑ ( j , n ) H i m , j v j n v j n † H i m , j † ) − 1 H i m , i v i m ) f_{r}^{\mathrm{CF}}(\mathbf{V}, \gamma)=\sum_{(i, m)} w_{i m}\left(\log \left(1+\gamma_{i m}\right)-\gamma_{i m}+\left(1+\gamma_{i m}\right) \mathbf{v}_{i m}^{\dagger} \mathbf{H}_{i m, i}^{\dagger}\left(\sigma^{2} \mathbf{I}+\sum_{(j, n)} \mathbf{H}_{i m, j} \mathbf{v}_{j n} \mathbf{v}_{j n}^{\dagger} \mathbf{H}_{i m, j}^{\dagger}\right)^{-1} \mathbf{H}_{i m, i} \mathbf{v}_{i m}\right) frCF(V,γ)=(i,m)∑wim⎝⎜⎛log(1+γim)−γim+(1+γim)vim†Him,i†⎝⎛σ2I+(j,n)∑Him,jvjnvjn†Him,j†⎠⎞−1Him,ivim⎠⎟⎞
其中 γ \mathbf{\gamma} γ为 { γ i m } \left\{\gamma_{i m}\right\} {γim}`集合。
固定 v i m \mathbf{v}_{i m} vim,最优 γ \mathbf{\gamma} γ通过 ∂ f r C F / ∂ γ i m \partial f_{r}^{\mathrm{CF}} / \partial \gamma_{i m} ∂frCF/∂γim求导置0而得,其表示为:
γ i m ⋆ = v i m † H i m , i † ( σ 2 I + ∑ ( j , n ) ≠ ( i , m ) H i m , j v j n v j n † H i m , j † ) − 1 H i m , i v i m \gamma_{i m}^{\star}=\mathbf{v}_{i m}^{\dagger} \mathbf{H}_{i m, i}^{\dagger}\left(\sigma^{2} \mathbf{I}+\sum_{(j, n) \neq(i, m)} \mathbf{H}_{i m, j} \mathbf{v}_{j n} \mathbf{v}_{j n}^{\dagger} \mathbf{H}_{i m, j}^{\dagger}\right)^{-1} \mathbf{H}_{i m, i} \mathbf{v}_{i m} γim⋆=vim†Him,i†⎝⎛σ2I+(j,n)=(i,m)∑Him,jvjnvjn†Him,j†⎠⎞−1Him,ivim
应用理论2对 f r C F f_{r}^{\mathrm{CF}} frCF进行多维二次转换得到 f q C F f_{q}^{\mathrm{CF}} fqCF,表示为: