——机器学习的最新发展,尤其是深度神经网络 (DNN),使基于学习的端到端通信系统成为可能,其中 DNN 用于替代发送器和接收器的所有模块。在本文中,开发了两个用于频率选择信道和多输入多输出 (MIMO) 信道的端到端框架,其中无线信道效应使用不可训练的随机卷积层建模。端到端框架使用小批量输入数据和通道样本进行训练。与在当前通信系统中使用导频信息隐式或显式估计未知信道参数不同,发射机 DNN 学习以对各种信道条件具有鲁棒性的方式转换输入数据。接收器由两个 DNN 模块组成,分别用于通道信息提取和数据恢复。采用双线性产生操作来组合从信道信息提取模块提取的特征和接收信号。在数据恢复模块中进一步利用组合特征来恢复传输的数据。与传统通信系统相比,频率选择信道和 MIMO 信道的性能有所提高。此外,端到端系统可以自动利用通道和源数据中的相关性来提高整体性能。
现代无线通信的发展极大地改善了我们的日常生活。一个成熟的成功通信系统利用各种技术进步并在各自的模块中实现它们。如图 1(a) 所示,在发射机和接收机中设计了一系列信号处理模块,以补偿信道效应并减轻干扰,从而使数据能够可靠地从发射机传输到接收机。然而,这些模块通常是单独开发和优化的,可能无法及时实现整体性能优化。此外,信道特性会随着各种因素而变化,例如工作频率和传播环境。因此,其中一些模块应设计为适应变化的环境以获得最佳性能,这通常是一项艰巨的任务。
最近,
深度学习正在重塑无线通信系统设计,其中数据驱动的方法可以改进和补充传统的基于模型的方法 [1, 2, 3, 4, 5, 6]。已经设计了基于深度学习的端到端通信范式 [2, 4, 7, 5] 并引起了越来越多的关注。对于端到端通信,发送器和接收器都由深度神经网络 (DNN) 表示,如图 1(b) 所示。发送器 DNN 学习将传输的数据转换为嵌入向量并通过无线信道发送,而接收器 DNN 学习从接收到的信号中恢复传输的数据。端到端管道中的 DNN 以受监督的方式进行训练,以最大限度地减少端到端损失,该损失衡量恢复的数据和传输的数据之间的不一致。由于它是一种纯数据驱动的方法,没有预先假设的信道模型作为先决条件,因此它可能为各种通信场景提供通用的解决方案。尽管端到端范式在加性高斯白噪声 (AWGN) 信道下显示出良好的性能 [2],但如何将此框架扩展到通用无线信道,例如频率选择信道和多输入多输出 (MIMO)渠道,还是很有挑战的。
传统上,处理衰落信道的常见做法是在数据块中插入导频,这些导频是接收机预先知道的。接收机首先在导频的帮助下估计当前信道参数,并通过用估计的信道参数求解逆问题来恢复传输的数据。然而,这种范式与端到端通信系统不兼容。导频的使用在很大程度上使设计复杂化,因为接收器必须采用两个异构源,即接收数据和估计的信道参数,作为输入并在没有任何先验知识的情况下解决逆问题。在现有文献中,端到端学习系统是在常规通信框架下设计的,例如正交频分复用(OFDM)和基于奇异值分解(SVD)的MIMO,将信道分解为独立的子信道。
在本文中,我们提出了一种基于深度学习的通用无线信道端到端通信系统,其中传统的模块,包括源编码、信道编码、调制等,已经被发射端的 DNN 取代,一个在接收器处。这个问题被表述为训练一个深度自动编码器网络,该网络具有不可训练的随机卷积层,代表无线信道。在发射器和接收器中都使用了卷积神经网络 (CNN),并提出了一种具有小批量输入样本和通道的训练算法。与使用导频隐式或显式估计未知信道参数不同,发射机学习以对各种信道条件鲁棒的方式对输入数据进行编码。接收器由两个 DNN 模块组成,分别用于通道信息提取和数据恢复。采用双线性产生操作来组合从信道信息提取模块提取的特征和接收信号。组合特征进一步用于数据恢复模块以恢复传输的数据。所提出的无导频端到端系统在两种常用的无线场景下进行了测试,即频率选择信道和平坦衰落 MIMO 信道。从实验来看,端到端系统可以以数据驱动的方式成功地利用各种相关性并获得卓越的结果。
论文的主要贡献如下,
在本节中,我们简要回顾了物理层通信深度学习、逆问题深度学习和深度学习中的对抗层的最新进展。
A. 物理层通信系统中的深度学习
深度学习已被用于增强传统的通信模块。基于深度学习的方法可以提高信道解码性能 [9, 10, 11, 12, 13]。深度学习也可用于信道估计 [14, 15] 和信号检测 [16, 17, 18]。关于这个主题的更多信息可以在 [19, 20] 和其中的参考资料中找到。
除了改进传统的通信模块外,最近还开发了基于深度学习的端到端通信系统,其中发送器和接收器都由 DNN 表示。在 [2] 中首次提出,该框架具有与 AWGN 信道下具有块结构的传统方法相似的性能。 OFDM 系统 [21] 和基于 SVD 预编码的 MIMO 系统 [22] 也采用了端到端框架,其中将信道视为一组独立的子信道。
最近,人们研究了如何在没有信道模型先验知识的情况下学习端到端通信系统。在[23]中,开发了一种基于强化学习的方法,用于在不知道信道传递函数或信道状态信息(CSI)的情况下优化发射机DNN。在[24]中,采用随机扰动方法设计了一个无模型端到端通信框架。最近,我们在[5]中开发了一种基于条件生成对抗网(GAN)的构建端到端通信的方法,其中信道效应由条件GAN建模。端到端系统可以使用条件GAN作为代理信道进行训练,以允许梯度从接收机DNN反向传播到发射机DNN。
B. 逆问题的深度学习
我们在本文中提出的方法也与解决逆问题和使用学习方法恢复原始数据有关。事实上,深度学习已经显示出其解决逆问题的能力,特别是在图像处理领域,例如去噪和去模糊 [25, 26],其中退化可以表示为原始图像与核卷积。流行的方法包括使用 CNN 学习端到端映射 [27, 28, 29] 和使用 GAN [30, 31, 32, 33] 学习后验。
对于图像处理领域遇到的大多数逆问题,可以通过学习原始图像中的“先验知识”,例如形状和纹理[34]来恢复噪声和失真图像。相比之下,端到端框架中的输入数据可以是独立的比特流,没有任何有用的先验知识,发射器 DNN 应该学习形成具有冗余的发射信号的星座,以便接收器可以隐式推断信道信息,然后利用它来恢复传输的数据。
C. 联合源和信道编码
最近,基于自动编码器的系统已应用于数据压缩,并显示出优于传统方法的效果。因此,可以训练端到端通信系统以传输结构化数据,例如图像和文本,其中自动编码器学习压缩数据并同时对数据进行编码。自动编码器已用于二进制对称信道 (BSC) 信道 [7]、AWGN 信道 [35] 和慢瑞利衰落信道 [36] 中的联合源和信道编码。在本文中,当系统用于传输结构化数据(例如图像和视频)时,所提出的端到端通信系统包括无缝源编码和解码。我们证明端到端系统优于源编码和无线传输分开设计的系统。
在本节中,我们将提供有关基于学习的端到端通信系统的必要背景信息,以此制定学习通用无线信道端到端通信系统的关键问题。
A. 基于自动编码器的端到端通信框架
如图1所示,一般的基带无线通信系统包括发射机、接收机和无线信道,其中发射机和接收机可以进行优化设计,无线信道是随机的和未知的。在操作中,信息源提供用于传输的发射器数据 s,它可以是二进制位流或任何结构化数据,例如图像和视频。传输的数据被编码并转换为复基带信号x,并在进一步调制到规定频率后,发送到天线进行无线电传输。在接收器处,无线信道效应得到补偿,传输的数据从接收到的信号 y 中重建。
如图 1(b) 所示,基于学习的端到端通信范式遵循自动编码器的结构,其中发送器 DNN 和接收器 DNN 分别对应于自动编码器和自动解码器。其中 信源数据 s 由发射器的自编码器网络编码为嵌入向量
其中 fE 表示自动编码器函数,ΘE 表示可训练参数。然后嵌入的向量通过无线信道传输,接收器得到信道输出 y。自动解码器网络根据接收到的信号学习恢复传输的数据 ˆs,即 ˆs = fD(y;ΘD),其中 fD 和 ΘD 分别表示自动解码器函数和可训练参数。这样,发送端的传统信号处理模块链,如编码和调制,由自动编码器表示,而接收端的模块,如信道估计和解码,由自动解码器表示。
端到端范式中自动编码器和解码器的参数是通过测量或模拟数据以监督方式学习的。端到端损失函数 L(s,ˆs) 用于衡量数据恢复的准确性,用作端到端框架的训练目标。
B. 无线信道作为不可训练的随机卷积层
面向一般无线信道的端到端通信系统之所以难以学习,是因为端到端数据恢复损失不仅取决于 DNN 的可训练参数 ΘE 和 ΘD,还取决于信道实现 h。在广泛的场景中,无线信道被建模为具有加性噪声的时变线性系统,离散时变信道模型可以通过对连续信道进行采样来获得 [37]。如果存在符号间干扰,则信道输出表示为当前输入符号和先前输入符号的加权和。对于块内的符号,权重被认为是一致的,但可能会因块而异。
因此,无线信道可以被表述为卷积操作,并通过卷积层实现,卷积层已在 [38] 中开发,以有效地从图像中提取特征。卷积层在共享权重架构和平移不变性特征上与全连接层不同。在卷积层中,每个神经元仅局部连接到前一层中的几个神经元,并且连接权重由该层内的所有神经元共享。一维卷积层的权重 w 是 ni×no×k 的张量,其中 ni 和 no 分别表示输入层和输出层中特征图的数量,k 表示内核大小。特征图j的位置l处的输出可以表示为:
其中 σ 是激活函数,x i l−mis 是特征图 i 位置 l − m 处的输入。用一维卷积层表示无线信道很简单。对于具有由实数向量 [h0, h1, …, hL−1] 表示的脉冲响应的通道,特征图的数量 ni 和 no 设置为 1。内核大小 k 由通道内存的长度决定,而权重由通道响应向量决定。当考虑一个复杂的通道响应时,通道输入和输出的实部和虚部都由两个特征图表示。权重 w 是一个 L × 2 × 2 的张量。 另外,通过进一步增加特征图,卷积层也可以用来表示 MIMO 信道。给定信道响应向量 h ∈ CNt×Nr×NL,权重 w 可以表示为
虽然无线信道可以用常用的卷积层表示[38],但卷积层的权重是不可训练的,并且对于不同的块取不同的值,这与常用的卷积层不同。
C. 关键问题
在传统的通信系统中,插入一组预先为接收器所知的规定导频符号用于信道估计。接收机首先根据接收到的导频数据估计信道参数,然后用估计的信道恢复传输的数据。然而,学习端到端通信系统的设计对于估计信道的导频变得更加困难,因为在接收器处需要考虑两个异构源,即接收的数据和估计的信道参数。此外,最佳试点设计取决于特定场景,是一个复杂的问题。发射器 DNN 没有在我们的框架中明确使用导频,而是学习将传输的数据编码为对信道效应具有鲁棒性的嵌入向量,这可以被视为通过学习隐式添加导频。由于无线信道由具有上瘾噪声的不可训练的随机卷积层表示,
因此关键问题表述如下:
可以在不同场景下自定义损失函数 L。当源数据向量 s 表示比特流时,损失函数可以是二进制交叉熵。当源数据向量s代表影像数据时,损失函数可以是峰值信噪比(PSNR)或多尺度结构相似性指标度量(MS-SSIM)等。
我们没有明确使用导频数据,而是提出了一种无导频端到端学习方法来解决信道估计问题。在本节中,我们将详细介绍通用无线信道的基于学习的端到端通信范式,其中将展示训练算法的概述、接收器 DNN 中采用的双线性运算以及实现细节。还提供了一个玩具示例来说明无导频端到端系统的工作原理。
A. Overview
所提出的方法遵循先前工作 [2, 5, 6, 7] 中基于学习的端到端通信系统的结构,其中 DNN 用于发送器和接收器。出于两个原因,在我们的框架中为发射器和接收器 DNN 选择了 1D CNN。首先,对于宽带无线信道,信道输出是输入与信道脉冲响应线性卷积的结果[5]。
因此,使用卷积层来处理卷积通道效应是很自然的选择。其次,以前的工作表明,使用 CNN 可以有效地实现编码增益,具有很强的泛化能力,可以处理看不见的码字 [6]。
为了使用代表通道的随机通道层来训练端到端网络,使用一种简单但有效的训练算法,将输入数据样本的小批量 s 与通道实现 h 相结合。因此,训练集由两种类型的数据组成:输入样本数据集 S 和通道样本数据集 H。训练算法如算法 1 所示。在 vanilla 随机梯度下降 (SGD) 算法中,梯度为由于只考虑了一小批样本,因此每次更新都会产生噪音。因此,对于每次更新,也可以使用小批量通道来估计通道集上的预期损失。对于每个小批量输入样本,从通道集中采样小批量通道样本。用于更新神经网络权重的梯度是通过从通道 mini-batch 的每个通道下累积梯度 g 获得的,
其中 Hi 是小批量的通道样本,y 是通道实现 h 下的通道输出。使用获得的 g,更新网络的参数(ΘE 和 ΘD)。
备注1: 与端到端系统相比,通道效应被建模为黑盒 [5, 23],所提出的方法较少依赖于真实通道的可访问性。黑盒端到端系统需要在线训练,因为每次更新发送器 DNN 后都应重新收集通道的大量输入和输出对。在我们的方法中,使用无线信道模型,因此一旦收集或模拟训练信道集 H,就可以离线训练。
B. 为什么不需要导频:这里给出了一个示例
在这里,我们提供了一个玩具示例来说明为什么 DNN 可以有效地恢复传输的数据,而无需导频进行信道估计。
示例:基于 CNN 的无导频端到端系统是为瑞利衰落信道构建的,二进制输入大小为 [K,2],其中 K 是块大小。在发射器中,我们使用内核大小为 1 的两个卷积层。因此,每两位都与其他位独立编码。接收器使用两个全连接层。因此,所有接收到的信号都参与到每个比特的恢复中。本示例中使用的 DNN 结构如附录 A 所示。
如图2(a)所示,随着块大小K的增加,端到端系统的误码率(BER)提高。由于每两位独立编码,发射器 DNN 生成的星座可以很容易地绘制,如图 2(b) 所示,与传统的正交相移键控 (QPSK) 调制不同,它与原点不对称。通过这种非对称星座,信道的相位和增益可以通过多个接收数据来推断,推断的可靠性随着块大小而增加,从而导致如图 2(a) 所示的性能。此示例显示端到端系统可以生成传输信号的星座以隐式推断信道信息,这解释了为什么我们的系统中不需要导频。
C. 双线性接收器(Bilinear Receivers)
虽然我们提出的端到端方法是无导频的,但仍然需要推断当前的无线信道,因为端到端的恢复损耗在很大程度上依赖于当前的信道。在没有导频的情况下,信道信息只能从接收到的数据 y 中获得。然而,卷积层中每个神经元的输出仅取决于其感受野内的输入数据。结果,接收到的数据 y 不能通过卷积层完全用于信道信息提取,因为包含在感受野之外的信道信息不能用于传输数据的重建。为了解决这个问题,在接收端采用了两个 DNN 模块,分别用于信道信息提取和数据恢复。
如图 3 所示,所提出的端到端框架中的接收器 DNN 包括信道信息提取模块和数据恢复模块。为了充分利用接收到的数据进行通道信息提取,利用全连接层来获得全局通道特征,然后通过双线性产生将其与接收到的数据相结合。数据恢复模块采用卷积层进一步分析双线性特征并恢复传输的数据。
CNN 的双线性操作如图 4 所示。这种结构广泛用于计算机视觉中,用于将特征组合在一起 [39]。通过双线性运算,接收信号 y ∈ R[K×Nr] 在每个位置通过从信道信息提取模块提取的信道特征 z ∈ Rlz 进行增强。具体来说,接收信号首先被重新整形为向量,然后将信道特征 z 乘以向量的每一项。因此,通过 Y = vec(y)⊗z 获得的增广信号 Y ∈ RK·Nr×lzis,其中 ⊗ 表示外积运算。增广信号 Y 被进一步重塑为大小为 [K, lz×Nr] 的矩阵。因此,双线性操作将接收信号的特征图数量增加了 lz 倍,如图 4 所示。 损失 L 相对于双线性操作的梯度可以表示为
D. 实施细节
所提出方法的每个模型中使用的 CNN 结构的详细信息显示在附录 B 中。当输入是比特流时,利用二元交叉熵损失,
其中 sn和 ˆ sn 分别是 s 和 ˆ s 的第 n 个元素。由于 sn∈ {0,1} 和 ˆ s 是 Sigmoid 函数的输出,代表 0 到 1 之间的概率值,交叉熵损失随着预测概率偏离实际标签而增加。
当图像被视为传输数据时,选择 MS-SSIM [40] 作为损失函数。 SSIM 度量在亮度、对比度和结构方面比较两个图像中的各种块,可以表示为:
其中 µs、µˆ s、σs 和 σˆ s 分别表示平均像素强度和 s 和 ˆ s 块中像素强度的标准偏差,变量 σsˆ s 表示 s 和 ˆ s 中块的相应像素之间的样本相关系数。 MS-SSIM 通过大小为 2 的子采样的多个阶段的过程在多个尺度上进行 SSIM 来扩展这种单尺度测量。 提出的端到端框架在固定信噪比 (SNR) 下进行训练) 并使用不同的 SNR 进行测试。
在本节中,所提出的无导频端到端通信系统在几种不同的场景下进行了测试。我们首先证明了无导频端到端通信系统可以在频率选择性衰落信道和平坦衰落 MIMO 信道下有效工作。
A.频率选择性衰落信道
实验设置:当信道的时延扩展与符号时长相当或大于符号时长时,存在符号间干扰,对应的信道称为频率选择性信道。
频率选择性信道的输出表示为y=h*x+n,其中h和x分别是信道冲激响应和信道输入,*表示线性卷积运算,n表示信道噪声。
因此,频率选择性信道被建模为多抽头滤波。已经有一些统计模型来描述h的分布,对于丰富的散射环境,普遍采用复高斯分布假设。
多抽头的强度和延迟由功率延迟分布(PDP)p={pi}表征。实验中使用了平均功率相等的八抽头信道,即当i=1,···,8时,pi=1。
基线:建议的端到端系统与两个基准进行比较。第一个是使用OFDM系统来处理频率选择性。采用 QPSK 调制,块长度设为 128 个样本,循环前缀长度为 16 个样本。在 OFDM 系统中,由于插入导频用于估计信道,因此需要额外的开销,在我们的实验中其长度为 16,即信道估计的开销为 12.5%。对于信道编码,我们使用速率为 0.5 的卷积码 [41]。所提出的无导频端到端通信系统还与 [6] 中基于条件 GAN 的端到端方法进行了比较,其中导频用于信道建模和数据恢复。与相干 OFDM 系统类似,条件 GAN 系统中需要额外的导频。
端到端模型训练:模型结构在附录A中有详细介绍。训练和测试数据集分别具有3×108和1×108个样本。使用二元交叉熵损失和 Adam 优化器。训练批次大小为 1,000,学习率为 10−4。该模型使用 SNR = 15 dB 进行训练,并使用范围从 0 dB 到 20 dB 的 SNR 进行测试。
实验结果:
图 5 表明端到端通信系统(标记为“E2E”)可以实现比最小二乘 (LS) 信道估计方法更好的 BER 性能,以及与最小均方误差 (MMSE) 方法相当的性能。由于导频提供了额外的信息,基于条件 GAN 的端到端方法比无导频方法表现更好。
B.MIMO信道
MIMO 是未来通信系统中的一项关键技术。我们使用多个滤波器来处理无导频通信系统中的多个天线。
实验设置:在本实验中考虑了在窄带信道上具有四个发射器天线和四个接收器天线的系统。信道矩阵 H 被建模为独立的复高斯分布,其中信道输出可以表示为 y = Hx n,其中 x 是发射信号向量,n 是噪声向量,y 是接收信号向量。对于相关信道,信道矩阵可以表示为 Hc=√RtH√Rr,其中 H 是上面使用的独立信道,Rt 和 Rr 分别表示发射机和接收机信道相关矩阵。相关矩阵可以表示为
其中 ρt 和 ρr 分别表示发射机和接收机的相关系数,而 Nt 和 Nr 分别表示发射机和接收机的天线数。 ρt= ρr= 0 独立通道。
基线:将无导频端到端系统与迫零 (ZF) 和 MMSE 信号检测方法进行比较。本实验中块大小设置为 256。这两种方法都需要额外的信道估计开销(在我们的实验中每个块 12.5%)并且 MMSE 用于信道估计。 QPSK 和速率为 0.5 的卷积码分别用作调制和信道编码。
端到端模型训练:MIMO 端到端系统的详细模型在附录 A 中说明。使用(6)中的二元交叉熵损失,训练集和测试集分别为 3 × 108 和 1 × 108。使用二元交叉熵损失和 Adam 优化器。训练批次大小为 1,000,学习率为 10−4,如第 V-A 部分所示。
实验结果:对于独立通道,所提出方法的性能和基线如图 6(a)所示。最大似然 (ML) 检测 [42] 实现了最佳性能。当 SNR 大于 12.5 dB 时,端到端系统大大优于 ZF 检测方法,并且也优于 MMSE 检测方法。如果有完美的 CSI 可用于 MMSE,则性能可提高约 5dB。此外,两种基线方法都需要额外的信道估计开销,这可以通过所提出的方法来节省。
我们具有不同相关系数的端到端方法的性能如图 6(b) 所示,其中 ρ = ρt = ρr。端到端方法和基线使用等于 5dB 和 10dB 的 SNR 进行评估。使用端到端方法,可以自动利用信道的相关性来显着提高性能,而信道的相关性会降低基线系统中 BER 方面的性能。
如图 6(a) 和 (b) 所示,当 ρt= ρr= 0 时,具有完美 CSI(标记为“MMSE-CSI”)的 MMSE 方法优于端到端系统。但是当 ρt= ρr= 0.5,无导频端到端系统可以达到与具有完美CSI的MMSE方法相似的结果。此外,当 ρt= ρr= 0.9 时,即使有完美的 CSI,基线方法也很难处理信道相关性,而无导频端到端方法不受影响。
为什么相关性会影响基线的误码率性能
C. End-to-End based Wireless Image Transmission
除了二进制数据流的传输,数据驱动的端到端通信系统也可以用于结构化数据传输。我们以无线图像传输为例。传统上,图像需要首先压缩成二进制数据流,然后使用无线通信系统进一步传输。而对于端到端通信系统,图像压缩和恢复可以分别通过端到端的发送器和接收器 DNN 执行。
Experimental Settings:
实验在三个图像数据集上进行,即ImagenetV al[43]、柯达1和B100[44]。使用基线系统或端到端图像传输系统对图像进行压缩和编码。然后,编码信号通过无线信道传输到接收器,在那里恢复原始图像。虽然图像的大小不同,但编码的数据被分组为固定长度的块(在我们的实验中使用128个)用于无线传输。实验中考虑了V-A节中的多径信道。
基线:将端到端通信方法与分别设计图像压缩系统和无线通信系统的基线系统进行了比较。选择了几个图像压缩基准进行比较,包括基于CNN的压缩方法[45]和两种传统的图像压缩方法,即BPG和JPEG2000。为了衡量信源编码和无线传输的联合设计带来的改善,首先使用基线图像压缩方法将图像压缩成二进制压缩数据,然后将二进制数据分组为块(在我们的实验中使用128个),并使用V-A中使用的比特流端到端通信系统进行传输。在接收端利用比特流端到端通信系统的输出恢复原始图像。
传统的图像压缩和恢复方法对无线传输过程中引入的错误非常敏感。例如,JPEG文件通常会完全崩溃,只有少数错误。由于对误差敏感的算术编码用于进一步压缩提取的特征,因此基于CNN的方法的性能也显着下降。为了进行公平的比较,我们假设在基线系统中使用重传通信协议,如果在传输期间当前块中存在任何错误,则该块将被重新传输。因此,源解码没有错误地进行,并且所传输的总块的期望将增加1/(1− pe)时间,其中pe是块错误率。为简单起见,我们假设可以在没有任何额外成本的情况下检测每个块中的错误,这使得比较对于所提出的端到端方法有点不公平。
End-to-End Model Training:与第 V-A 和 V-B 部分中使用的比特流端到端通信系统相比,图像端到端系统包含用于图像压缩和恢复的 2D 卷积层。详细的模型结构见附录 A。模型使用 ImageNet 数据集的训练集进行训练。输入图像是从训练集中裁剪的,大小为 256 × 256,没有任何增强。 MS-SSIM 用作训练损失,其实现和权重如下 [40]。批量大小为 32,学习率为 10-3。
实验结果:图 7 显示了仅传输 J/256 个块的不同 SNR 下的 MS-SSIM 性能,其中 J 是像素数。由于块的长度为 128,如果没有传输错误,基线系统的每像素位 (bpp) 为 0.5。基线系统的源压缩率随着 pe 的增加而增加。从图中可以看出,所提出的方法(标记为“联合 E2E”)通过源编码和通信的联合训练大大优于基线。在三个基线中,基于 CNN 的压缩方法(标记为“Separate E2E”)比其他两种传统压缩方法实现了更好的性能。基线系统通过使用具有上下文信息的全局压缩方法具有优势。
而在我们的系统中,全局压缩被丢弃,用于传输的编码向量是本地独立获得的。不过,这个劣势被联合训练的威力抵消了。因此,即使对于通信错误可以忽略不计的高 SNR 区域,联合训练方法仍然可以胜过基线。随着噪声的增加,其他系统的性能由于错误率的增加而迅速下降,而联合训练方法对信道噪声更加鲁棒。
D. Robustness
在实际环境中部署时,通道分布可能与训练通道分布不同,这可能会降低性能。如果分布差异很大,则应使用新数据对模型进行微调或重新训练。但是我们仍然希望系统对通道中的小方差具有鲁棒性。所提出的端到端系统的稳健性在两种类型的通道中进行了测试,其中训练和测试阶段使用的通道分布存在差异。
在频率选择性信道中测试了对 PDP 的鲁棒性。在训练期间使用相等的平均功率,即 pi=1,而测试通道是用新的 PDP 生成的,该 PDP 通过在训练中使用的 pi 中随机添加或减去 Δ 获得。端到端模型(标记为“错配 E2E”)对 Δ 的 BER 性能如图 8(a)所示,其中 SNR 固定为 15 dB。虽然端到端方法是用不同的 PDP 训练的,但它显示了对 PDP 差异的鲁棒性。对于 ∆ < 0.5,性能几乎保持不变。
在 MIMO 信道中测试信道相关系数 ρ 的鲁棒性。该模型使用 ρ = 0.5 进行训练,并使用范围从 0 到 0.9 的 ρ 进行测试。如图 8(b) 所示,端到端方法也显示了对 ρ 差异的鲁棒性。使用 ρ = 0.5 训练的模型与在相应相关系数中训练和测试的模型实现了相似的性能。
E. Complexity Analysis
我们比较了所提出系统和基线的计算复杂度。端到端方法与传统通信系统之间的直接比较是困难的,因为其复杂性受到所使用的特定架构的许多参数的影响。在表 I 中,列出了所提出的方法的复杂性和基线系统中的每个组件。CNN 的计算复杂度为
其中 N 是块大小,L 是层数,kl是第 l 层的内核大小,Fl−1 和Fl 分别在 l − 1 层和 l 层中扩展过滤器的数量。
对于OFDM系统,快速傅立叶变换(FFT)的计算复杂度为O(N logN),信道估计复杂度为O(N3p),其中Np是所使用的导频数。 Viterbi 解码的复杂度是 O(N2k),其中 k 是内存的长度。
一般来说,端到端系统的计算复杂度随着块长度N线性增长,但是当层数L和特征图Fl的数量很大时,计算复杂度变大。当发射机和接收机采用多根天线时,发射机输出端和接收机输入端的特征图会相应增加。
如果其他层中的特征图数量保持不变,计算复杂度将随天线数量线性增长。它将随数字成二次方增长。在基线系统中,ZF 和 MMSE 检测的检测复杂度都是 O(N3r),其中 Nr 是接收器天线的数量。
为了完成我们对计算复杂性的讨论,我们在配备 Intel i7 CPU 和 Nvidia 1080Ti GPU 的 Windows 服务器上测量了所提出算法和基线方法的平均运行时间。我们选择 MMSE 和 OFDM 作为用于频率选择信道的基线和用于 MIMO 信道的 MMSE 检测。
MIMO 和选频信道系统下每个块的平均运行时间分别约为 3.5 × 10−2 和 2.2 × 10−2 秒,而端到端系统的平均运行时间约为 2.5 × 10−3 秒.
在本文中,我们提出了一种基于无导频深度自编码器的无线信道端到端通信系统。我们表明端到端通信系统可以建模为具有随机卷积层的深度自动编码器系统,因为线性通道可以建模为卷积操作。我们提出了一个带有小批量输入样本和通道的训练程序。此外,在接收器中采用了额外的信道提取模型,以确保全局提取信道信息。对于频率选择性信道和平坦衰落 MIMO 信道,端到端模型在没有导频信息的情况下得到了有效训练,与传统基线相比表现出更好的性能。我们提出的方法可以成功解决未知信道的影响,为构建无线通信端到端系统提供了新的解决方案。未来有很多方向需要探索,包括如何开发能够适应不同信道和信噪比的端到端系统