由于人工智能的发展,各大高校也逐渐加大研究力度。本文源自于个人的本科毕业设计,课题由学校老师分配,设计内容源自于个人。由于个人知识储备以及能力有限,有不足之处我会及时修改。
1.GAN在通信领域的训练分析
对于网络传输,最常用的报文有TCP和UDP两种形式,Jeffrey Erman[1]等人在2007年发表的一篇名为基于半监督学习的实时/离线流量区分的文章,已经详述通过聚类等算法实现了流量的区分,而且实验结果特别理想,这就为我的本篇文章的数据来源提供了理论的可行性,由于机器的训练过程是需要大量可靠的数据为前提的,但是Jeffrey Erman等人有专门的通信信号记录设备,可以轻松搜集某些时间段内,各种通信信号的流量以及持续时长,包括HTTP协议,P2P协议以及FTP等多种通信信号,而这点对于我来说确实是很难实现的,因为我就目前的动手实践水平,在缺少相应设备的前提下,很难准确的对这类数据进行提取,同时由于个人能力的有限,对这些大数据的清洗也是不容易做到的,所以本次设计使用到的训练数据是我人为“臆造”的。
在数学上描述函数的自变量与因变量是一种映射关系,及自变量X→f(X),这就为我提供了一种思想,我个人可以将真实的信号数据与我“臆造”的数据构建成一一映射的关系,也就是说,我将“臆造”的通信信号数据送入生成对抗网络(GAN)模型中进行学习,如果生成对抗网络(GAN)模型可以对这些“臆造”的数据进行学习,并得到相应的成果,那么我们就可以通过反映射的思想(从“臆造”回到真实数据),说明生成对抗网络(GAN)技术是可以应用在通信网络中,映射思想类似于两块陆地的桥梁,起到连接作用,所以合理适当的数据映射会方便我们的实验进行,不合理或者复杂的映射关系,在目前来看,对我们的程序设计是起阻碍作用的,这样会提高程序的复杂度,同时需要大量的时间去运行我们的程序。
众所周知,按照通信的媒质可分为有线通信与无线通信,例如有线通信中的光纤通信,其信号串扰小,抗电磁干扰、抗噪声能力强。与之相比的无线通信,由樊昌信等撰写的书中[2]可知,无线通信信道有一部分属于随参信道,会受到温度,季节,气候等条件的影响,并且在无线通信中,由于移动台在运动,收发两点间的传输路径也在发生变化,就会致使信道参量发生变化,会产生多径传播,带来多径效应,多径效应对信号的损伤是极其严重的,会产生频率的弥散等情况,所以对于我们的输入数据集,严重的随机噪声是必须要考虑的,在我们“臆造”的数据中,有必要加入极大的随机参数以及一定数量的无用数据。
2.基于GAN的一般通信信号的特征提取
在樊昌信等人编写的《通信原理》[2]中一般通信系统模型类似,包括信源,发送设备,信道,接收设备,信宿等组成部分,且在《通信原理》一书中,各部分理论分析使用最多的信号波形是单音正弦波:
f(t)=A cos(wt+φ)
为了不失去一般性,我们通常会令振幅A=1,初始相位φ=0,那么整个形式就会变成:
f(t)=cos(wt)
为了方便建模,让信号的波形可以更好的通过坐标轴来反应,且规定在严格的周期内(初步约束在[-2π,2π]的区间内,包含两个信号波形),我们也令w=1,这样我们就得到我们建模信号使用的最终波形形式:
f(t)=cos(t)
在完成上述分析之后,我们知道计算机是不可能完全按照人的思维模式来处理实际遇到的问题,计算机是个二值世界(0和1),众所周知,基于最基本的数字信号处理(Dsp)知识,我们不是对连续的信号进行直接研究,而是通过抽样,量化,编码等过程形成时间离散,幅度也离散的数字信号。但是为了便于理论研究,在数字信号处理(Dsp)的内容中,我们一般是将幅度连续,时间连续模拟信号波形x(t),经过抽样(抽样是一个线性的过程),得到时间离散,幅度连续的离散时间信号x(kt),同时我们将离散时间信号理想化,得到我们所研究的信号序列x[n],注意,这里的理想化有两点需要注意,第一点是理想抽样,即不考虑脉宽效应;第二点是我们认为量化字长效应是无限的,不考虑有限字长效应。有了上述思想,便得到了实际信号建模的方法,可以在一个正弦信号周期内,对其进行部分点的采样,这个采样方式我们选取等间隔采样也可以采用随机采样,进而得到信号的特征点,这个便是我们所得到的真实信号的数据,生成对抗网络(GAN)所输入的数据也是这类数据。但是为了直观的反应信号的包络情况,我们再结果输出之后,会根据这些频率点绘制出信号的整体包络。
考虑到我们的真实数据是二维的数据点,表示特定时间的信号幅度值,在一般意义上说,我们不需要搭载的太过于复杂的生成器模型。生成器的作用是生成随机的信号的特征分布点,可以是任意的,我们不对其做任何约束,所以就构成一个两层的全连接层网络,经过分析数据样本分布可知,数据结构并不繁琐,我们可以直接创建一个两层结构的生成器,由于生成器不能接触真实的样本分布,所以我们无需将其构建的太过于复杂,其原因是,过于复杂的模型虽然可以“学习”得到真实信号的波形特点,但是可能会造成学习过程的复杂化。由训练经验可知,对于特定的数据类型使用特定的训练方式是优化模型的重要参考指标。回归到生成器的模型,我们这两层用于处理生成器自身“随机”产生的信号特征点数据,第一层使用SoftMax函数模型来处理数据,第二层使用sigmoid函数模型进行再处理,以上我们便得到了生成器的最初模型。
由于鉴别器需要接触真实信号的特征点分布情况,所以在鉴别器构建的时候,可能要稍微比生成器要复杂一些。
首先我们先将真实的信号数据送给我们的鉴别器,鉴别器的第一层接收真实信号,并对其进行信号特征的“学习”,生成器的第二层用于接受生成器得到信号数据,并对生成器所生成的信号特征进行第一次“学习”,我们需要注意的是,当我们输入生成器所生成的信号特征数据时,这一层是要重复使用的,通过动态调整这层的权重来完成鉴别器损失值的最小化。为了让生成器得到更好的信号数据反馈,我们在对其进行第二次“学习”,即再增加一层全连接层,得到更为优秀的学习效率,至此我们已经得到了鉴别器的模型。
起初刚开始训练生成对抗网络(GAN)模型的时候,生成器随意生成的信号特征点所画出的包络与真实数据的包络相比,相差甚远,可以说没有任何的关联,虽然通过TensorFlow的代码,我们可以得到生成器与鉴别器的准确率(accuracy),但是不具备参考的意义,因为直观的从我们肉眼也能判断出两者信号的包络式完全不一样的。随着程序运行到第1500次,我们可以发现,生成器与鉴别器信号的包络已经有大致相同的趋势,但是我们仍然可以通过肉眼直接观察出,信号虽然相位信息逐渐趋于明显,但是幅度等信息还是不一致的。当我们实验进程来至2000次的时候,我们已经无法从肉眼直接看出真实信号的包络与生成信号包络之间的区别,因为从肉眼角度出发,两者已经完全重叠,但是肉眼的精确度不高,只能区分误差较大的事物,所以最优的衡量标准还是咱们所得到的衡量标准数据,我在图中显示了生成器与鉴别器各自判别的准确率(accuracy),我们奇怪的发现两者的概率相等均为0.5,如果单单从机器学习的角度来看,0.5的准确率对于一个模型来说,没有任何意义,在数据分类问题中,0.5概率的准确率意味着机器并不能区分数据的真(1)与假(0)。但是在深度学习的生成对抗网络(GAN)模型里面,0.5的概率是我们迫切所希望得到的,众所周知,当一件未知事件发生的概率P=0.5时,信息所包含的信息量就越大,也就意味着我们并不知道这个事件到底会朝什么样的方向去发展,按照这个想法,我们回归到这个0.5概率的准确率,当鉴别器判定生成器所生成的信号与真实信号是否一致时,给出了0.5概率的可能性,也就是说,知道真实信号分布的鉴别器,已经无法判断生成器生成的信号与真实信号之间是否还有误差,这个时候,咱们生成器生成的信号(信号包络是通过特征点绘制的)就可以完美的媲美真实的信号,达到“以假乱真”的地步!可以说,生成器已经完全获取了真实信号的特征数据了,生成对抗网络(GAN)模型是可以对通信信号进行学习的,在此基础之上,若我们的信道是较为理想的信道,那么我们的GAN技术便可用于稳定信号的特征获取,以及信号的特征识别,这样极大的优化了信号与信息处理领域的信号特征提取的相关工作。
3.基于GAN的无线通信信号的特征提取
在魏崇毓等人编写的《无线通信基础及应用》[3]中,我们可以了解到,通信按照传播媒质的不同可以分为有线通信与无线通信,为了将无线通信的缺点扩大化,我们以有线通信中的光纤通信为例子,光纤通信的主要优点有抗干扰的能力强,相比于无线通信,受噪声,气温,电离层特性等因素的影响小。在无线通信的信道中,有一部分属于随参信道,即乘性干扰随时间剧烈变化,如靠天波传播的无线信道,在天波传播时,电离层的高度和离子浓度随时间,季节和年份的变化而发生不停歇的变化,这就会使信道特性随着这些因素的变化而变化,此外,在无线通信中,由于移动台(MS)在运动,移动台(MS)与基站(BS)之间的传输路径也在不断变化,使得信道参量也在不断的变化,信号经过几条路径到达接收端,而且每条路径的长度(时延)和衰减都随时间的变化而改变,即存在多径传播现象,多径传播会对信号产生多径效应,进而对传输的信号质量有极大的消极影响。
综上所述, 无线通信的模型与无线通信信号所受到的各种干扰较大,最直接造成的影响便是信号波形的畸变,主要包括幅度的畸变与相位的畸变,在本节内容中,我们在上述已得的信息基础上,在富含噪声的信号波形中,提取特征点,然后让我们的生成对抗网络(GAN)去学习,看是否可以恢复大致的信号的包络。
我们在真实信号所获取的所以频率点上加入稳定的噪声,换到模型中来说,就是在特征点处加入随机数。
在模型刚开始训练的时候,生成器所生成的信号包络,生成器在最开始是无法通过简单的几次学习就可以完全获取真实信号的特征点分布情况进而恢复真实信号包络。在相同的生成对抗网络(GAN)模型下,经过2000次的训练,生成器近似可以恢复出真实信号的整体包络趋势,但是无法做到完全一致,这种情况取决于咱们输入的噪声,因为有噪声的影响,我们也并不希望模型可以完全恢复信号的包络,因为如果在有噪声的情况下恢复出信号,那么恢复的信号一定会将噪声也算在有用信号之内,我们不是为了追求完美的图形特征而去拟合信号包络,得到一条优美的曲线,而是通过生成对抗网络(GAN)模型的训练,能够获取原始信号的特征,从第2000次训练之后,我们可以看到,生成器所拟合的信号包络与真实信号包络已经趋近一致,这点从生成器和鉴别器的准确率可以看出,从第2000次训练后准确率始终保持在[0.48-0.52]之间,这个概率对于此问题来说,已经属于很好的结果了。
对于一般信号而言,无失真传输的条件是指传输信号仅在幅度上发生线性变化,而相位的变化会造成严重的码间干扰,无论是对模拟通信信号还是数字通信信号而言。在本节,我们将对信号做一定的相位改变,在相同生成对抗网络(GAN)模型的训练水平下,看我们是否能够再次通过生成器获取真信号的分布特征。如果相邻的两个信号保持着幅度连续,相位差恒定,那么就一般意义而言,这与最初的实验在本质上是一样的,因为以我们已知的知识而言,连续变化的相位畸变,是我们在处理信号时所面临的最困难的问题,大部分通信系统为了区分具有不同特征的通信信号,会在选择在发送端去避免这个问题。就上述内容,首先产生一个相位畸变连续变化的两个信号。然后通过特征点的抽取,当其送入生成对抗网络(GAN)模型,来观察最终的结果。
训练结果并不理想,可以说完全无任何参考价值,在稳定训练后(大概第1200次训练之后),可以看到,真实的信号由于连续的相位畸变,始终处于不停的变化之中,而生成对抗网络(GAN)模型随着真实信号分布的改变也在不停的“学习”,看似很快就会达成包络的拟合,但是整个模型似乎始终处于一种,真实信号在“奔跑”,生成器生成的信号在“追赶”的状态中,也就是说我们通过TensorFlow构建的生成对抗网络(GAN)目前无法追踪这种动态的变化。
4.实验结果分析
目前实验的缺陷还是很多的,首先我在对信号特征点的抽取的时候,我并没有严格的按照抽样定理的最低标准要求对信号进行特征抽取,即无法估在抽样频率fs=2f时候,模型是否可以完成自己的任务。
其次,对于稳定的信号而言,生成对抗网络(GAN)是有能力按照自己的学习机制对此类信号进行学习的,在获取这类信号特征的前提下,进而恢复真实信号的包络情况。所以,对于信号类型不同的通信信号,生成对抗网络(GAN)是具有分别学习他们的特征,然后对这些信号进行区分的能力的。随着条件的约束,实验也在继续深入,第一次加入了稳定的噪声,在这个条件的前提下,生成对抗网络(GAN)模型不负众望,在经过多次训练之后,可以对此类信号进行一定的区分,在第二次实验中,将模型的应用更实际化,因为稳定无噪声的通信信号在无线通信与网络中比较难实现,更多的是一种富含随机噪声且相位有混叠的情况,所以在最后一次实验中,我们将困难极大化,加入了连续的相位畸变,在这一次实验结果中,发现生成对抗网络(GAN)模型并没有达到理想的结果。针对这种情况,原因可能有两种,第一点是我们的生成对抗网络(GAN)模型在处理动态连续变化的问题并不具备优势,与前两次实验相比,第一次是暂态问题,第二次虽然我们加入了一定的随机噪声,但是噪声的变化并不剧烈,其次相比于相位的改变,正常的通信信号对幅度的包容性还是很高的;第二点是我们模型的深度不足,无法处理动态问题。针对上述两种猜想,个人倾向于第二种,因为通过参考相关文献可知,目前生成对抗网络(GAN)的变种已经达到上百种,在未来几年里,还会有长足的发展空间。
参考文献
[1] effrey Erman, Anirban Mahanti, Martin Arlitt, Ira Cohen, Carey Williamson. Offline/Realtime traffic classification using semi-supervised learning[J]. Performance Evaluation, 2007, 64(9).
[2] 樊昌信.通信原理[M]. 曹丽娜. 第七版.北京:国防工业出版社, 2017
[3] 魏崇毓.无线通信基础及应用[M]. 西安:西安电子科技大学出版社,2009
[4] Ian J. Goodfellow, Jean Pouget-Abadie. Generative Adversarial Network[EB/OL]. (2014-06-10). https://arxiv.org/abs/1406.2661.
[5] Tao Liu, Alberto E. Cerpa. Temporal Adaptive Link Quality Prediction with Online Learning[J]. 2014, 10(3):1-41.
[6] Bhutani, Gitanjali. Application of Machine-Learning Based Prediction Techniques in Wireless Networks[J]. International Journal of Communications, Network and System Sciences, 2014, 7(5).
[7] 王坤峰, 苟超, 段艳杰 , 林懿伦, 郑心湖, 王飞跃.生成式对抗网络GAN的研究进展与展望[J]. 自动化学报, 2017, 43(03):321-332.