重点介绍和分析了提高仿真软件本身运行速度的四种基本技术方法:
现代信息化战争的一个最显著的特点就是电子战的作用和地位日益突出,甚至可以说,电子战水平和应用能力的高低,在很大程度上决定了战斗和战役的胜负。雷达和针对雷达的电子对抗是电子战中最主要的内容和攻防矛盾之一,应用计算机仿真对雷达/电子干扰攻防对抗进行研究非常必要。
雷达/电子干扰攻防对抗计算机仿真可以粗略分为功能级仿真和信号级仿真两大类,在满足了真实性要求的前提下,信号级仿真最突出的问题就是仿真速度的问题。在本文中,我们结合多年从事雷达/电子干扰攻防对抗信号级仿真的体会,就提高雷达/电子干扰攻防对抗信号级仿真的仿真速度的问题进行一些讨论,主要包括以下内容:
简而言之,我们认为,对于相参雷达,能够再现雷达内部的零中频及其以下的信号流动流程及其处理过程; 对于非相参雷达,能够再现雷达内部的视频及其以下的信号流动流程及其处理过程,就是信号级仿真。而功能级仿真,通常仅涉及空间能量计算以及一些基于概率计算的随机变量门限检测,而不涉及雷达内部的信号流动流程及其处理过程。
从信号级仿真和功能级仿真的作用和实际效果看,在雷达/电子干扰攻防对抗仿真中,有以下区别。
综上所述,我们认为,对于雷达/电子干扰攻防对抗而言,要进行客观、全面、准确的研究,信号级仿真是非常必要的。
相对于功能级仿真,信号级仿真有一些特别突出的问题,例如仿真速度问题,模型校核问题。在满足了真实性要求的前提下,信号级仿真的一个最引人关注的问题就是仿真速度的问题。信号级仿真速度慢,主要原因在两个方面: 一是计算内容多而且细致导致的计算量大; 二是计算频率高。以非相参雷达为例,系统采样频率需要达到 20 MHz。这两个方面的因素是由于信号级仿真本身的性质决定的,是无法改变的。
信号级仿真的速度慢主要导致三个方面的问题:一是一次仿真要花费很长的时间,效率太低,同时也影响了仿真应用者对重点问题的关注; 二是极大地限制了信号级仿真在系统层面、体系层面上的应用; 三是不能用于任何有硬件参与的研究,包括模拟训练等。
虽然计算量大、计算频率高是信号级仿真的天然特性,但提高其仿真速度,使其达到实时或近实时( 这里的近实时指的是: 名义时间 ∶计算机时间< = 1 ∶3) 还是大有可为的。从通用的角度看问题,提高信号级仿真的速度有赖于在以下方面取得突破:
第一个方面,计算机硬件的整体速度,至少涉及CPU、内存、主板等多个硬件( 或硬件组件) 的速度以及整合速度,这里主要拖后腿的是内存( 也涉及主板和总线) 的存取速度。除非出现系统性的技术变革,要计算机硬件的整体速度有大幅度的提高是不现实的。
第二个方面,计算机的多核并行处理能力的大幅度提高,在今天已经成为技术现实。多核并行处理能力的提高,通过多个实体仿真软件( 多枚反舰导弹同时攻击水面舰艇目标情况下,每一枚反舰导弹的末制导雷达都是一个实体仿真软件) 的并行运行,可以提高整个仿真系统的运行速度,但对于构成真正瓶颈的单个实体仿真软件的速度提高则没有意义。实际情况下,不大可能为了多核并行处理,把一个实体仿真软件拆分成为多个部分。这里有三个问题:
第三个方面,通过辅助硬件加速使计算机系统的速度得到大幅度的提高。通行做法有两条途径:
一条途径是采用 FPGA 或 FPGA+DSP 构建专用的辅助硬件; 一条途径是采用 GPU 等通用辅助硬件。采用 FPGA 或 FPGA+DSP 构建的专用辅助硬件,的确能够大幅度提高单个实体仿真软件的运行速度,除了构建专用辅助硬件需要付出的成本和人力/时间代价外,其最大缺点是灵活性差。
GPU 从本质上看是一种并行多核,而且其处理单元数比 CPU 中的核数高好几个量级。除了上述的多核并行处理的三个问题外,GPU 并行处理还有一个特殊的问题,就是其处理深度很浅,因而需要频繁地交换数据,在这个方面会付出更大的时间代价。有 GPU 方面的资深专家给出了一个例子,对于同一个问题,采用程序优化和 GPU 加速两种方法,GPU 加速方法的速度仅比程序优化方法快一倍。我们认为,GPU 加速的适用面受到很大的限制。
第四个方面,使仿真软件本身的运行速度得到大幅度的提高,在下面作为一个专题,进行一定程度上的
展开讨论。
从理论和实践两个方面看,从仿真软件本身找速度问题的解决出路,使仿真软件本身的运行速度得到大幅度的提高,是大有可为的。基于我们的具体实践,以下列出四条基本思路或者说是基本技术方法:
提高模型抽象和实现的层次和水平,在一定意义上,对于提高仿真软件的运行速度具有根本的、普遍的意义和作用。
系统仿真以模型为基础,在本质上是模型试验,仿真运行主要就是模型的运行。模型的有效性和精度决定了仿真的有效性和精度,模型也决定了仿真软件运行的计算量。这里所说的通过提高模型抽象和实现的层次和水平来提高仿真软件的运行速度,以保证模型的有效性和精度不下降为基本前提。
本文以目标回波的仿真为例阐述模型抽象的问题。这里仅考虑回波的时间位置和标准波形( 与发射基带波形相同的单位幅度的波形,这里采用简单矩形脉冲) 。提高模型抽象和实现的层次和水平对于提高仿真软件的运行速度可以具有非常显著的作用。
针对不同的具体问题,算法优化的具体方法可能千差万别,但还是有一些共同的规律可以摸索和遵循。例如,已有计算结果的重用( 重复使用) 、避免数据的不必要的移动等。本文以在雷达信号级仿真中经常会遇到的非相参脉冲滑窗积累( 滑窗宽度设为 M) 的算法优化为例来进行说明。
简而言之,非相参脉冲滑窗积累就是对于雷达接收机在连续 M 个脉冲重复周期中的视频输出数据按距离单元相加,其基本原理如表 1 所示。表 1 中,L 表示一个脉冲重复周期中的距离单元数,当前的脉冲重复周期编号为 N+M-1,要与前面的编号直到 N 的各个脉冲重复周期( 一共是 M 个脉冲重复周期) 中的数据按距离单元相加。
狭义地讲,以空间换时间就是以计算机的存储空间资源换取计算机的时间资源,提高计算机的运行速度。以空间换时间的最简单也是非常有效的例子之一就是通过查表法来避免复杂计算,直接得到相关数据结果。下面以 FFT 为例进行说明和讨论。FFT 算法是在计算 DFT 的最高层面上,主要通过计算结果的重用提高了计算效率,属于算法优化的层次。
信号级的雷达/电子干扰攻防对抗仿真软件在目前的计算机( 指 PC 机,以下同) 上要提高运行速度,一条大有潜力的技术途径是提高数据存取的速度。
信号级的雷达/电子干扰攻防对抗仿真软件在目前的计算机上运行时,人们感觉运行缓慢,这是一种整体感觉。事实上,真正缓慢的、或者说成为仿真软件整体速度瓶颈的是计算机中的存储器( 指内存,以下同)及其相关部件。因为很久以来,CPU 的运行速度已经达到了存储器存取速度的 100 倍以上。容易想到,如果能够提高存储器存取度使其达到 CPU 的运行速度,仅此一条就可以大幅度提高仿真软件的运行速度,使信号级的雷达/电子干扰攻防对抗仿真软件的运行速度达到实时。但令人遗憾的是,全面、大幅度提高存储器的速度在目前以及可以预见到的将来都是做不到的,只能采取 Cache 等折中的办法。
Cache 被称作缓冲存储器,其特点是速度快( 比内存快 10 倍以上) 但容量小。因其容量小,产生了命中率的概念。Cache 的命中率定义为 CPU 需要的信息已经存在于 Cache 中的比率。显然,只有当 CPU 需要的信息已经存在于 Cache 中时,才能发挥 Cache 速度快的优 势,真正提高仿真软件的运行速度。因 此,提 高Cache 的命中率对于提高仿真软件的运行速度可以起到直接的、显著的作用。Cache 命中率的提高涉及多方面的因素,但数据/程序是否存入 Cache 在根本上遵循所谓的局部性原理: 在访问完一个内存区域后,程序会在不久的将来( 时间局部性) 访问邻近的区域( 空间局性) 。
Cache 的局部性原理可以在不同的层次、从不同的角度加以利用,以提高 Cache 的命中率。这里以 Matlab中矩阵数据的存储和应用为例,来阐述和讨论一些典型问题。众所周知,在 Matlab 的 m 语言中,矩阵数据是按列存储的。这就意味着,如果在组织矩阵数据的时候,把相关的数据组织到相同的列中去,在处理的时候也按列进行处理,将获得( 相对于按行组织数据和按行处理) 更快的处理速度。
对于雷达/电子干扰攻防对抗信号级仿真,提高仿真软件的运行速度具有非常重要的意义。基于技术分析和多年的实践经验,我们认为在当今的技术条件下,针对仿真软件本身挖掘潜力,对于提高速度仍然是大有可为的。以我们的亲身经历为例,我们研制了一个信号级的舰载多功能相控阵雷达仿真软件,最初的运行速度为 1 ∶80,采取多种方法改进后,在原有功能不变,技术性能还有所提高的情况下,在相同的硬件环境中,使该仿真软件的运行速度提高近 20 倍,达到 1 ∶4左右。所采取的方法就是上述的模型抽象、算法优化、以数据表格替换复杂计算、提高 Cache 命中率等。我们希望并相信,经过更加深入的艰苦努力,在国内同行的支持和共同参与下,雷达/电子干扰攻防对抗信号级仿真以及其他领域中具有计算量大和计算频率高特点的信号级仿真,在运行速度方面,能够有进一步的显著提高,从而使得信号级仿真在应用广度上得到大幅度的扩展,包括应用于系统层面、体系层面上的仿真,应用于有硬件参与的研究,如模拟训练等。