论文题目: Hybrid Beamforming for Millimeter Wave Systems Using the MMSE Criterion
论文地址:https://arxiv.org/abs/1902.08343
源码地址:https://github.com/TianLin0509/Hybrid-Beamforming-for-Millimeter-Wave-Systems-Using-the-MMSE-Criterion
这是笔者自己发表在TCom ( IEEE Transactions on Communications) 上的论文, 因为这几天要做一些相关报告,顺便也写成一篇博客。 毕竟完成了那么多篇他人论文的读后感, 也是时候记录下自己的工作了。 何况最懂一篇文章的,一定是作者本人啦。 本博文旨在以最简练的篇幅来提炼文章的核心。
本文的工作还是基于毫米波的混合波束成形系统。 关于混合波束成形 的 背景 和 介绍, 可以参考笔者之前的文章,
这篇文章与之前相关工作的主要区别点在于, 是以MSE为目标提出了一系列优化算法。 尽管在此之前已经有一些以MSE为优化目标的波束成形算法的设计工作, 但基本是多用户场景下, 且并未详尽地阐述该目标的意义。 从算法角度而言, 本文的算法也将性能优化了许多。
本文可以分为两部分, 第一部分以上图所示的窄带点对点毫米波通信系统为研究对象, 提出了相关算法。 第二部分则将其拓展到了宽带OFDM系统下。 阅读完 混合波束成形专栏|进阶:深入浅出混合波束赋形 的话, 很容易可以写出接收端得到的接收信号的表示式:
y = W B H W R F H H V R F V B s + W B H W R F H u \mathbf{y}=\mathbf{W}_{\mathrm{B}}^{H} \mathbf{W}_{\mathrm{RF}}^{H} \mathbf{H V}_{\mathrm{RF}} \mathbf{V}_{\mathrm{B}} \mathbf{s}+\mathbf{W}_{\mathrm{B}}^{H} \mathbf{W}_{\mathrm{RF}}^{H} \mathbf{u} y=WBHWRFHHVRFVBs+WBHWRFHu
与许多相关工作不同的是, 本文是以MSE作为优化目标:
M S E ≜ E { ∥ β − 1 y − s ∥ 2 } \mathrm{MSE} \triangleq E\left\{\left\|\beta^{-1} \mathbf{y}-\mathbf{s}\right\|^{2}\right\} MSE≜E{ ∥∥β−1y−s∥∥2}
这里需要解释一下:严格的MSE应该就是 M S E ≜ E { ∥ y − s ∥ 2 } \mathrm{MSE} \triangleq E\left\{\left\|\mathbf{y}-\mathbf{s}\right\|^{2}\right\} MSE≜E{ ∥y−s∥2}, 而这里的 β \beta β则是一个标量因子, 物理意义上是将接收到的信号放大/缩小一定的幅度, 使之更接近于原始信号。 这个MSE也被称为 modified MSE。 可以理解为用于矫正由于预编码及信道造成的信号幅度的放大/缩小。
但事实上, 因为我们研究的点对点系统中, 接收端也有波束成形操作, 因此这一步的标量scaling其实可以由接收波束赋形来完成。 那 β \beta β的意义在哪里呢? 这其实是有相应考虑的, 这并非本文的贡献, 因为传统的波束成形也会面临同样的疑问, 但这是本文需要解答的, 引入 β \beta β主要出于三点考虑:
最后,为什么要以MSE为目标求解, 而不是用Rate等呢? 因为在传统通信中, MSE是一个经典且合理的指标, 完全有理由同样应用在5G的毫米波通信中。 其次, MSE为目标往往能保证更好的BER性能, 而且由于目标的不同, 数学问题完全不一样了, 推导的算法也会有较大的变化。 最后, 我们可以将MSE的算法推广到WMSE(weight MSE), 这时的解将会有非常不错的Rate性能。
如 混合波束成形专栏|进阶:深入浅出混合波束赋形 中所述,在求解HBF优化问题的时候, 由于总共有4个矩阵, 主流的做法都是, 将发送端和接收端解耦, 其实就是简单的: 先固定接收端求解发送端, 再固定发送端求解接收端, 然后迭代。 我们的第一步也是如此: 先固定接收端, 求解发送端。 首先令 V B = β V U \mathbf{V}_{\mathrm{B}}=\beta \mathbf{V}_{\mathrm{U}} VB=βVU, 可以得到目标函数:
minimize V R F , V U , β tr ( H 1 H V R F V U V U H V R F H H 1 − H 1 H V R F V U − V U H V R F H H 1 + σ 2 β − 2 W H W + I N a ) subject to tr ( V R F V U V U H V R F H ) ≤ β − 2 ; ∣ [ V R F ] i j ∣ = 1 , ∀ i , j \begin{array}{ll} \operatorname{minimize}_{\mathbf{V}_{\mathrm{RF}}, \mathbf{V}_{\mathrm{U}}, \beta} & \operatorname{tr}\left(\mathbf{H}_{1}^{H} \mathbf{V}_{\mathrm{RF}} \mathbf{V}_{\mathrm{U}} \mathbf{V}_{\mathrm{U}}^{H} \mathbf{V}_{\mathrm{RF}}^{H} \mathbf{H}_{1}-\mathbf{H}_{1}^{H} \mathbf{V}_{\mathrm{RF}} \mathbf{V}_{\mathrm{U}}\right. \left.-\mathbf{V}_{\mathrm{U}}^{H} \mathbf{V}_{\mathrm{RF}}^{H} \mathbf{H}_{1}+\sigma^{2} \beta^{-2} \mathbf{W}^{H} \mathbf{W}+\mathbf{I}_{N_{\mathrm{a}}}\right) \\ \text { subject to } & \operatorname{tr}\left(\mathbf{V}_{\mathrm{RF}} \mathbf{V}_{\mathrm{U}} \mathbf{V}_{\mathrm{U}}^{H} \mathbf{V}_{\mathrm{RF}}^{H}\right) \leq \beta^{-2} ; \left|\left[\mathbf{V}_{\mathrm{RF}}\right]_{i j}\right|=1, \forall i, j \end{array} minimizeVRF,VU,β subject to tr(H1HVRFVUVUHVRFHH1−H1HVRFVU−VUHVRFHH1+σ2β−2WHW+INa)tr(VRFVUVUHVRFH)≤β−2;∣∣∣[VRF]ij∣∣∣=1,∀i,j
可以看到, 这一步中我们只需要优化发送预编码矩阵 (数字阵和模拟阵)及 引入的 β \beta β标量。 由于模拟阵有恒模约束,求解困难, 因此我们先求解数字阵。
很容易通过反证法得知: 必在达到最大功率时达到最佳性能, 因此根据第一个限制条件的等号成立时:
β = ( tr ( V R F V U V U H V R F H ) ) − 1 2 \beta=\left(\operatorname{tr}\left(\mathbf{V}_{\mathrm{RF}} \mathbf{V}_{\mathrm{U}} \mathbf{V}_{\mathrm{U}}^{H} \mathbf{V}_{\mathrm{RF}}^{H}\right)\right)^{-\frac{1}{2}} β=(tr(VRFVUVUHVRFH))−21
再用拉格朗日乘子法, 求解上面的问题, 利用KKT法则, 就可以求得数字阵的闭式解:
V U = ( V R F H H 1 H 1 H V R F + σ 2 w V R F H V R F ) − 1 V R F H H 1 \mathbf{V}_{\mathrm{U}}=\left(\mathbf{V}_{\mathrm{RF}}^{H} \mathbf{H}_{1} \mathbf{H}_{1}^{H} \mathbf{V}_{\mathrm{RF}}+\sigma^{2} w \mathbf{V}_{\mathrm{RF}}^{H} \mathbf{V}_{\mathrm{RF}}\right)^{-1} \mathbf{V}_{\mathrm{RF}}^{H} \mathbf{H}_{1} VU=(VRFHH1H1HVRF+σ2wVRFHVRF)−1VRFHH1
一些符号的具体定义可以找一下论文的对应, 这里就不再赘述了。 而将解得的 V U \mathbf{V}_{\mathrm{U}} VU代入目标函数中后, 目标函数就转化成了只和 V R F \mathbf{V}_{\mathrm{RF}} VRF相关的单变量函数了:
J ( V R F ) ≜ tr ( ( I N e + 1 σ 2 w H 1 H V R F ( V R F H V R F ) − 1 V R F H H 1 ) − 1 ) J\left(\mathbf{V}_{\mathrm{RF}}\right) \triangleq \operatorname{tr}\left(\left(\mathbf{I}_{\mathrm{N}_{\mathrm{e}}}+\frac{1}{\sigma^{2} w} \mathbf{H}_{1}^{H} \mathbf{V}_{\mathrm{RF}}\left(\mathbf{V}_{\mathrm{RF}}^{H} \mathbf{V}_{\mathrm{RF}}\right)^{-1} \mathbf{V}_{\mathrm{RF}}^{H} \mathbf{H}_{1}\right)^{-1}\right) J(VRF)≜tr((INe+σ2w1H1HVRF(VRFHVRF)−1VRFHH1)−1)
但是注意, V R F \mathbf{V}_{\mathrm{RF}} VRF是有恒模约束的, 因此需要设计特定的算法求解。
接上一节, 本文给出了两种算法来求解 V R F \mathbf{V}_{\mathrm{RF}} VRF
也叫黎曼优化。 本质上是一种梯度下降法, 然而基本的梯度下降法是在整个欧式空间中进行下降, 因此无法保证下降后的解仍满足 恒模约束, 所以无法直接用于求解 V R F \mathbf{V}_{\mathrm{RF}} VRF。 而流形优化, 则是首先将满足恒莫约束的所有可行解表示为一个流形, 其后每步迭代后都将解映射回这个流形之上, 也因此可以确保结果永远满足恒模约束。 最重要的是, 已经有严谨的数学证明了这样的迭代过程是严格收敛的, 因此可以将 流形优化 理解为 在可行集上进行下降的梯度下降法。
这里推荐大家去看
MO算法的性能卓绝, 但是复杂度偏高, 因此这里提出了一个低复杂度的算法 —— 基于GEVD(广义特征分解)。 首先, 基于一个常用的近似关系 V R F H V R F ≈ N t I N R F \mathbf{V}_{\mathrm{RF}}^{H} \mathbf{V}_{\mathrm{RF}} \approx N_{\mathrm{t}} \mathbf{I}_{N_{\mathrm{RF}}} VRFHVRF≈NtINRF,我们可以简化下目标函数:
J ( V R F ) ≈ tr ( ( I N e + 1 σ 2 w N t H 1 H V R F V R F H H 1 ) − 1 ) J\left(\mathbf{V}_{\mathrm{RF}}\right) \approx \operatorname{tr}\left(\left(\mathbf{I}_{N_{\mathrm{e}}}+\frac{1}{\sigma^{2} w N_{\mathrm{t}}} \mathbf{H}_{1}^{H} \mathbf{V}_{\mathrm{RF}} \mathbf{V}_{\mathrm{RF}}^{H} \mathbf{H}_{1}\right)^{-1}\right) J(VRF)≈tr((INe+σ2wNt1H1HVRFVRFHH1)−1)
但这个问题还是非常难以求解, 因此我们提出了一种思路:固定 V R F \mathbf{V}_{\mathrm{RF}} VRF中的其余列, 每次迭代只优化1列。 通过数学变换, 我们可以把问题转化为一个GEVD问题, 并直接通过广义特征分解,得到那一列的最优解。 经过多次迭代后, 就可以得到一个不错的 V R F \mathbf{V}_{\mathrm{RF}} VRF。详细的推导也见paper。 需要指出的是, 在这个求解过程中, 我们暂时忽略了恒模约束, 因此事实上,我们每次通过特征分解得到一列解之后, 需要对每个元素做一个模归一操作(相位提取)。 这一步没有任何的收敛性可言, 因此, 这个算法相比于MO算法, 没有严谨的收敛证明。然而幸运的是, 在仿真中他还是表现出了随着迭代单调下降的特性。
使用MSE为目标的另一妙处就是, 你会发现固定发送端,求解接收端的时候, 问题形式好发送端的形式一模一样。 因此,我们可以直接套用发送端的算法,用于接收端的求解,而无需额外设计了。 通过发送端和接收端的相互迭代, 最终就可以得到一组性能优异的解。
宽带系统,现在主流一般指的就是OFDM系统了。
系统框图如图所示。 对于数字波束成形而言, 可以对每个子载波进行设计, 因此从每个子载波来看,和窄带系统没有任何区别。 但是问题就在于模拟波束成形, 是对于所有子载波一致的。 也因此,我们设计的时候需要的不是将某个子载波上的MSE最小化的模拟阵,而是一个可以将sum-MSE最小化的解, 那么问题就变成:
mibject to V B , k , V R F , W U , k , W R F , β k ∑ k = 0 N − 1 M S E k subject to ∥ V k ∥ F 2 ≤ 1 ∥ V R F ] i j ∣ = 1 , ∀ i , j ∣ [ W R F ] m l ∣ = 1 , ∀ m , l \begin{array}{cl} \underset{\mathbf{V}_{\mathrm{B}, k}, \mathbf{V}_{\mathrm{RF}}, \mathbf{W}_{\mathrm{U}, k}, \mathbf{W}_{\mathrm{RF}}, \beta_{k}}{\text { mibject to }} & \sum_{k=0}^{N-1} \mathrm{MSE}_{k} \\ \text { subject to } & \left\|\mathbf{V}_{k}\right\|_{F}^{2} \leq 1 \\ & \left.\| \mathbf{V}_{\mathrm{RF}}\right]_{i j} \mid=1, \forall i, j \\ & \left|\left[\mathbf{W}_{\mathrm{RF}}\right]_{m l}\right|=1, \forall m, l \end{array} VB,k,VRF,WU,k,WRF,βk mibject to subject to ∑k=0N−1MSEk∥Vk∥F2≤1∥VRF]ij∣=1,∀i,j∣[WRF]ml∣=1,∀m,l
数字波束成形的求解和窄带一样——因为可以按每个子载波单独设计, 这里直接列出结果:
V U , k = ( V R F H H 1 , k H 1 , k H V R F + σ 2 w k V R F H V R F ) − 1 V R F H H 1 , k \mathbf{V}_{\mathrm{U}, k}=\left(\mathbf{V}_{\mathrm{RF}}^{H} \mathbf{H}_{1, k} \mathbf{H}_{1, k}^{H} \mathbf{V}_{\mathrm{RF}}+\sigma^{2} w_{k} \mathbf{V}_{\mathrm{RF}}^{H} \mathbf{V}_{\mathrm{RF}}\right)^{-1} \mathbf{V}_{\mathrm{RF}}^{H} \mathbf{H}_{1, k} VU,k=(VRFHH1,kH1,kHVRF+σ2wkVRFHVRF)−1VRFHH1,k
接下来还是对模拟波束成形的设计。
首先,流形优化算法可以很简单的拓展到宽带场景,本来难点就在于梯度的求解,但利用下式:
∇ J ( V R F ) = ∑ k = 0 N − 1 ∇ J k ( V R F ) \nabla J\left(\mathbf{V}_{\mathrm{RF}}\right)=\sum_{k=0}^{N-1} \nabla J_{k}\left(\mathbf{V}_{\mathrm{RF}}\right) ∇J(VRF)=k=0∑N−1∇Jk(VRF)
而 ∇ J k \nabla J_{k} ∇Jk的表示式和窄带是一样的推导。 有了梯度, 那么流形优化算法仍能应用。
然而GEVD算法就没法简单的拓展了, 因此, 本文提出了基于特征值分解的EVD算法。 复杂的目标显然无法直接使用EVD求解, 所以需要进行一些近似。 我们分别求取了原式的上界和下界, 分别对应的提出了EVD-LB 和 EVD-UB算法。同样的, 由于暂时的忽略了恒模约束, 在求解完成后也需要一步相位提取操作, 这也造成了算法并非严谨收敛。 这里懒得一个个详述了, paper里有详细的推导。
相比于其他相关的工作, 本文提出的算法不仅在BER上有显著的飞跃, 在Rate性能上也有不错的提升。这同时也说明了, 除了以最主流的Rate指标为优化目标外, MSE也是一个可以考虑的准则。