撰写简单的FPGA的主流技术与市场表现方面的调研报告,表达自己的认知和发展展望,500字,图片,表格除外
FPGA(Field-Programmable Gate Array)是一种可编程逻辑器件,是在PAL (可编程阵列逻辑)、GAL(通用阵列逻辑)等可编程器件的基础上进一步发展的产物,广泛应用于通信、嵌入式系统、数据中心、人工智能等领域
FPGA是作为专用集成电路(ASIC)领域中的一种半定制电路而出现的,既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点它具有灵活性和可重新配置性,可以根据需要进行快速的硬件设计和开发
与传统模式的芯片设计进行对比,FPGA 构成了半定制电路中的典型集成电路,其中含有数字管理模块、内嵌式单元、输出单元以及输入单元等。在此基础上,着眼于综合性的芯片优化设计,通过改进当前的芯片设计来增设全新的芯片功能,据此实现了芯片整体构造的简化与性能提升
FPGA可用于处理多元计算密集型和通信密集型任务,依托流水线并行结构体系
矩阵运算、机器视觉、图像处理、非对称加密等计算密集型任务可由CPU卸载至FPGA执行
计算性能方面,Stratix系列FPGA进行整数乘法运算,其性能与20核CPU相当,进行浮点乘法运算,其性能与8核CPU相当;FPGA进行整数乘法、浮点乘法运算,性能相对GPU存在数量级差距,可通过配置乘法器、浮点运算部件接近GPU计算性能
FPGA执行计算密集型任务核心优势在于FPGA加速方案下,PCIe时延可降至微秒级别,而传统GPU加速方案下数据包规模较大,时延可达毫秒级别
FPGA可针对数据包步骤数量搭建同等数量流水线(流水线并行结构),数据包经多个流水线处理后可即时输出,处理速度快;用于处理通信密集型任务不受网卡限制,在数据包吞吐量、时延方面表现优于CPU方案,时延稳定性较强
对称加密、防火墙、网络虚拟化等人物处理相对计算密集数据处理复杂度较低,易受硬件设备限制
① 吞吐量优势:FPGA可接入40Gbps、100Gbps网线,并以线速处理各类数据包,可降低网卡、交换机配置成本;而CPU方案需通过网卡接收数据,易受网卡性能限制,时延较长
② 时延优势:FPGA无需指令,可保证稳定、极低时延,FPGA协同CPU异构模式可拓展FPGA方案在复杂端设备的应用;CPU方案通过网卡收集数据包,处理通信密集任务时延近5微秒,且CPU时延稳定性较弱,高负载情况下时延或超过几十微秒
FPGA部署包括集群式、分布式等,逐渐从中心化过渡至分布式,不同部署方式下,服务器沟通效率、故障传导效应表现各异
① 集群部署特点及限制:FPGA芯片构成专用集群,形成FPGA加速卡构成的超级计算器(如Virtex系列早期实验板于同一硅片部署6块FPGA,单位服务器搭载4块实验板)
② 网线连接分布部署:为保证数据中心服务器同构性,该部署方案于不同服务器嵌入FPGA,并通过专用网络连接,解决单点故障传导、网络延迟等问题
③ 共享服务器网络部署:该部署模式下,FPGA置于网卡、交换机间,可大幅提高加速网络功能并实现存储虚拟化。FPGA针对每台虚拟机设置虚拟网卡,虚拟交换机数据平面功能移动至FPGA内,无需CPU或物理网卡参与网络数据包收发过程。该方案显著提升虚拟机网络性能(25Gbps),同时可降低数据传输网络延迟(10倍)
依托高带宽、低时延优势,FPGA可组成网络交换层与服务器软件之间的数据中心加速层,并随分布式加速器规模扩大实现性能超线性提升。数据中心加速层位于网络交换层及传统服务器软件之间,负责为每台服务器提供网络加速、存储虚拟化加速支撑等
加速层性能提升原理
使用单块FPGA时,单片硅片内存不足以支撑全模型计算任务,需持续访问DRAM以获取权重,受制于DRAM性能。加速层通过数量众多的FPGA支撑虚拟网络模型单层或单层部分计算任务。该模式下,硅片内存完整加载模型权重,可突破DRAM性能瓶颈,FPGA计算性能得到充分发挥。加速层需避免计算任务过度拆分而导致计算、通信失衡
eFPGA技术在性能、成本、功耗、盈利能力等方面优于传统FPGA嵌入方案,可针对不同应用场景、不同细分市场需求提供灵活解决方案。eFPGA技术通过设计复杂度提升伴随设备成本下降激发市场对eFPGA技术的需求
eFPGA技术优势:
FPGA的优点:
(1) FPGA由逻辑单元、RAM、乘法器等硬件资源组成,通过合理组织,可实现乘法器、寄存器、地址发生器等硬件电路
(2) FPGA可通过使用框图或者Verilog HDL来设计,从简单的门电路到FIR或者FFT电路
(3) FPGA可无限地重新编程,加载一个新设计方案只需几百毫秒,可以减少硬件的开销
(4) FPGA的工作频率由FPGA芯片以及设计决定,可以通过修改设计或者更换更快的芯片来达到某些苛刻的要求(当然,工作频率也不是无限制的可以提高,而是受当前的IC工艺等因素制约)
FPGA的缺点:
(1) FPGA的所有功能均依靠硬件实现,无法实现分支条件跳转等操作
(2) FPGA只能实现定点运算
国际上
全球FPGA市场由四大巨头Xilinx赛灵思,Intel英特尔(收购阿尔特拉)、Lattice莱迪思、Microsemi美高森美垄断,四大厂商垄断9,000余项专利技术,把握行业“制空权”
FPGA芯片行业形成以来,全球范围约有超70家企业参与竞争,新创企业层出不穷,随智能化市场需求变化演进,高度定制化芯片(SoC ASIC)因非重复投资、规模大、研发周期长等特点导致市场风险剧增。相对而言,FPGA在并行计算任务领域具备优势,在高性能、多通道领域可以代替部分ASIC。人工智能领域多通道计算任务需求推动FPGA技术向主流演进
在市场表现方面,FPGA技术在过去几年中一直保持着稳定的增长势头。根据市场研究公司的数据,全球FPGA市场规模预计将在未来几年内继续增长。这主要得益于FPGA在各个领域的广泛应用和不断增长的需求
国内
中国FPGA芯片研发企业可以紫光同创、国微电子、成都华微电子、安路科技、智多晶、高云半导体、上海复旦微电子和京微齐力为例。从产品角度分析,中国FPGA硬件性能指标相较赛灵思、Intel等差距较大。紫光同创是当前中国市场唯一具备自主产权千万门级高性能FPGA研发制造能力的企业。上海复旦微电子于2018年5月推出自主知识产权亿门级FPGA产品。中国FPGA企业紧跟大厂步伐,布局人工智能、自动驾驶等市场,打造高、中、低端完整产品线
中国FPGA企业竞争突破口现阶段中国FPGA厂商芯片设计软件、应用软件不统一,易在客户端造成资源浪费,头部厂商可带头集中产业链资源,提高行业整体竞争力
对于国产FPGA厂商来说,目前不少优秀国际人才的加盟给国产企业添加了新的活力。市场也给国产FPGA提供了千载难逢的机遇,国家政策在支持与倾斜,国内整体集成电路发展水平也在提升,因此现在正是国产FPGA厂商发展的良好机遇。但国内FPGA厂商也存在器件规模相对较小,软硬件性能有一定差距,量产管理欠缺以及人才分散的问题
人工智能、5G通信是未来FPGA应用的重点领域,数据量大是二者的共同特点,因此需要传输速率更高的SerDes模块来连接FPGA与外部通信。在5G时代,SerDes需要达到28Gbps甚至更高的32Gbps,才能满足5G通信协议的“肚量”,而进入人工智能时代,大量的、重复的数据传输甚至将超出32Gbps的传输能力范围,从而要求FPGA达到56Gbps甚至更高的传输速率
诸多应用场景将要求FPGA将外部的模拟信号转为数字信号后进行处理,或者除了进行算法处理、扮演高速协处理器以外,还要同时执行复杂控制的任务,这类新需求在未来人工智能、特种集成电路领域将非常普遍。因此,采用CPU+FPGA+AI或者CPU+FPGA+GPU融合架构的PSoC将成为重要的发展方向