本文地址:Generative Adversarial Estimation of Channel Covariance in Vehicular Millimeter Wave Systems
深度通信网络专栏: 快速上手: 2018-2019年最新深度学习用于无线通信(物理层)的论文整理,附论文核心思想总结与代码分析。一点拙见,如有偏颇,望不吝赐教,顺颂时祺。
这篇文章一脉相承自 Deep Learning Coordinated Beamforming for Highly-Mobile Millimeter Wave Systems,不同点在于前者同时做了信道估计和波束成形,而这篇文章只聚焦于信道估计。这两篇都提出,只需要一个Omni-received signal即可估计出信道,这样大大降低了训练时长。 但也因此, 导致能给到神经网络的信息微乎其微,维度很低。 然而作者联想到了GAN从低维数据恢复出高维数据的能力,并以此提出了本文的信道估计方法。即将需要估计的信道信息看做一张2D图片,从而通过GAN的方法来处理。 这个方法,显然在通信的许多问题中,会有其应用的前景。
本文考虑的场景比较神奇, 是多个基站同时为一个高速运动的用户进行服务。 这与他们的前作Deep Learning Coordinated Beamforming for Highly-Mobile Millimeter Wave Systems是相同的。 可想而知,应该是提出的算法比较有局限性,因此选用了一种能将其优势体现的淋漓尽致的场景。因此,本文要考虑的是通过上行信道传输的pilot,来估计信道信息。作者假定了User端(发送端)天线数为1, 而接收端为多天线并进行了波束成形。
首先, 作者使用了如下的宽带MISO信道模型:
h d , n = M ρ ∑ ℓ = 1 L g n , ℓ p ( d T s − τ n , ℓ ) a ( θ n , ℓ ) \boldsymbol{h}_{d, n}=\sqrt{\frac{M}{\rho}} \sum_{\ell=1}^{L} g_{n, \ell} p\left(d T_{s}-\tau_{n, \ell}\right) \mathbf{a}\left(\theta_{n, \ell}\right) hd,n=ρMℓ=1∑Lgn,ℓp(dTs−τn,ℓ)a(θn,ℓ)
一个经典的毫米波信道模型。具体可参考Frequency selective hybrid precoding for limited feedback millimeter wave systems。
显然,其频域信道可表示为:
h k , n = ∑ d = 0 D − 1 h d , n e − j 2 π k K d , \mathbf{h}_{k, n}=\sum_{d=0}^{D-1} \boldsymbol{h}_{d, n} e^{-j \frac{2 \pi k}{K} d}, hk,n=d=0∑D−1hd,ne−jK2πkd,
基于此, 上行中BS接收到的信号可以表示为:
y k , n = w n T h k , n s k + v k y_{k, n}=\mathbf{w}_{n}^{T} \mathbf{h}_{k, n} s_{k}+v_{k} yk,n=wnThk,nsk+vk
在本文行文中,下标 n n n表示第 n n n个基站。 w n \mathbf{w}_{n} wn是波束成形向量, v k v_{k} vk是高斯噪声。
另外一个重要的假设是作者认为所有基站之间是可以协作的,也引出了本文网络的目标:
In [1], the authors showed that when the uplink training pilots are received simultaneously by multiple distributed basestations using omni or quasi-omni antenna patterns, these omni-received signals draw a rich multipath signature for the user location and its interaction with the surrounding environment.
简单概述下,这个omni-antenna pattern事实上就是,将接收波束成形向量( receive beamformer or combiner) 置为:
w n = [ 1 , 0 , … , 0 ] , ∀ n \mathbf{w}_{n}=[1,0, \dots, 0], \forall n wn=[1,0,…,0],∀n
作者认为有两个重要优点:
作者很快指出,想只用这么点数据估计信道实在太难。 因此他进行了一些转换。首先,他将目标改为,估计信道的协方差矩阵。 即:
R h n = E [ h k , n h k , n H ] \mathbf{R}_{\mathbf{h}_{n}}=\mathbb{E}\left[\mathbf{h}_{k, n} \mathbf{h}_{k, n}^{H}\right] Rhn=E[hk,nhk,nH]
然后,利用毫米波信道稀疏的特性,将其进行稀疏分解,即
h d , n = U B S g d , n \boldsymbol{h}_{d, n}=\mathbf{U}_{\mathrm{BS}} \boldsymbol{g}_{d, n} hd,n=UBSgd,n
U B S \mathbf{U}_{\mathrm{BS}} UBS 是DFT矩阵。 由于空间中路径数十分有限,因此 g d , n \boldsymbol{g}_{d, n} gd,n中绝大部分元素都为0。(这一部分看不懂的同学可以查阅下作者给出的引文《An Overview of Signal Processing Techniques for Millimeter Wave MIMO Systems》)。
总之,作者将本文的目标改为稀疏矩阵 R g n \mathbf{R}_{\mathrm{g}_{n}} Rgn (文中称为 虚拟信道协方差)
R h n = U B S R g n U B S H \mathbf{R}_{\mathbf{h}_{n}}=\mathbf{U}_{\mathrm{BS}} \mathbf{R}_{\mathrm{g}_{n}} \mathbf{U}_{\mathrm{BS}}^{H} Rhn=UBSRgnUBSH。
由于篇幅原因,这里的一些推导建议大家查看原文,但是对于大致理解这篇文章来说,只需要知道作者将一个信道估计的问题,转变为估计一个稀疏矩阵,以此来降低GAN的难度。正如作者原文所说:
it is much easier to learn the mapping from the omni-received uplink signature y to the virtual channel covariance matrices as compared to the original channel covariance matrix.
如图,作者使用了经典的GAN网络模型, 上方为生成器,下方为判别器。生成器的任务是:
作者指出,由于所需要估计的信道信息的维度远大于输入的训练序列维度。 因此,普通的DNN网络很难胜任 (可以解释为什么作者没有沿用以MSE为loss反向传播训练一个网络)。 而GAN,从低精度图片恢复出高分辨率的图片启发了作者,让他想到使用GAN,从低维度的接收信号去恢复信道信息。
生成器的具体结构展示在上图的上半部分。 在传统的GAN中, 生成器往往接收一组随机数(如:高斯噪声),通过训练生成想要的图片类型。 但这里我们还需要考虑的是必须要给网络训练信息。因此,作者采用的思路是产生一个 100 × 1 100\times1 100×1的服从标准高斯分布的 z \mathbf{z} z噪声向量。 然后将 z \mathbf{z} z与导频序列 y \mathbf{y} y拼接后,通过三层反卷积神经网络(参考),最后得到一个 2 × 32 × 32 2\times32\times32 2×32×32 (假设天线数为32))的实数矩阵,其中第一维的 2 2 2代表实部和虚部。 由于作者没有给出具体的代码,文章中也没有过多介绍,只能依靠给出的图片复现。
判别器的过程则是生成器的反向。 重点在于经过两层卷积网络后, 作者将导频序列与输出结果拼接, 再通过最后一层神经网络,然后输出0或1. 这个拼接的网络又被称为conditioned CNN layer。 个人认为这一步是必不可少的。 我们的目标是根据导频序列估计出信道,那么判别器的目标就是 输入信道,判别他是不是由这串导频序列得到的。
由于是信道估计问题,所以仿真也很好做,即:
N M S E = ∥ R ^ g n − R g n ∥ F 2 ∥ R g n ∥ F 2 \mathrm{NMSE}=\frac{\left\|\hat{\mathbf{R}}_{\mathrm{g}_{\mathrm{n}}}-\mathbf{R}_{\mathrm{g}_{\mathrm{n}}}\right\|_{\mathrm{F}}^{2}}{\left\|\mathbf{R}_{\mathrm{g}_{\mathrm{n}}}\right\|_{\mathrm{F}}^{2}} NMSE=∥Rgn∥F2∥∥∥R^gn−Rgn∥∥∥F2
通过归一化的偏差来衡量信道估计的准确度。
由于这个信道估计的方法过于特殊,加上非常另类的系统模型,作者直接没有给出任何对比算法。所有的仿真结果可以说是在自娱自乐,不太具有意义。 加上仿真代码并未给出, 这个方法的实用价值确实有待商榷。
但无论如何,这为深度通信网络打开了另一种思路,即结合当今深度学习中炙手可热的GAN网络。