NVIDIA显卡算力、Jetson比较

1 基本概念
1.1 算力单位
TOPS:指的是每秒钟可以执行的整数运算次数,它代表着计算机在处理图像、音频等任务时的处理能力。TOPS的单位是万亿次每秒(trillion operations per second)。一般是指整数运算能力INT8。

TFLOPS:指的是每秒钟可以执行的浮点运算次数,它代表着计算机在处理科学计算、机器学习等任务时的处理能力。TFLOPS的单位是万亿次每秒(trillion floating point operations per second)。一般是指单精度性能FP32。

MFLOPS:等于每秒一百万次浮点运算。(megaFLOPS)

GFLOPS:等于每秒十亿次浮点运算。(gigaFLOPS)

PFLOPS:等于每秒一千万亿次浮点运算。(petaFLOPS)

1.2 内存带宽
内存带宽是指从计算机主板到内存之间传输数据的速度。它通常用作衡量内存性能的指标之一,以确定计算机可以快速读取和写入内存中的数据量。

内存带宽的大小取决于内存总线的宽度和内存频率的乘积。例如,如果内存总线宽度为64位,内存频率为1600 MHz,则内存带宽为64位 x 1600 MHz = 12.8 GB/s。

内存带宽的大小会直接影响计算机的算力,因为它可以限制计算机能够快速读取和写入数据的数量。如果内存带宽不足,计算机可能需要等待更长的时间才能读取或写入数据,从而降低了计算机的效率。特别是在处理大规模数据集和运行需要大量内存的应用程序时,内存带宽的大小会更加重要。因此,在选择计算机配置时,需要考虑内存带宽和其他关键指标,以确保计算机能够满足特定的计算需求。

1.3 DMIPS
DMIPS(Dhrystone Million Instructions Per Second,每秒处理的百万级的机器语言指令数),描述的是 CPU 的运算能力。

自动驾驶多传感器融合的滤波算法,激光点云的配准算法,多数的路径规划和决策算法考验的都是 CPU 的运算能力。

1.4 ASIC
ASIC(Application-Specific Integrated Circuit)是指应用特定集成电路,是一种定制的、用于特定应用的集成电路。与通用集成电路(如微处理器)不同,ASIC是针对特定应用进行设计和制造的,可以优化电路的性能和功耗,从而满足特定应用的要求。ASIC通常用于高性能计算、通信、图形处理等领域。

ASIC设计需要经过电路设计、逻辑设计、物理设计、验证等多个步骤,因此制造成本较高,但在高端应用中可以获得很高的性能和可靠性。与FPGA相比,ASIC在性能、功耗和面积等方面都具有优势,但缺乏FPGA的灵活性和可编程性。

ASIC 加速器包括 CVP(Computer Vision Processors,计算机视觉处理器),DLA 和 MA(Multithreaded Accelerator,多线程加速器),其中 18 颗 CVP 是 Mobileye 的下一代针对传统计算机视觉算法设计的 ASIC 芯片。芯片整体的 AI 算力设计只有 24TOPS。

例如:Jetson中的DLA深度学习加速就是一种ASIC。

2 GeForce 30x系列

NVIDIA显卡算力、Jetson比较_第1张图片
3 Jetson

 NVIDIA显卡算力、Jetson比较_第2张图片

 


参考1:AI芯片,自动驾驶里的「水浒卡」
参考2:芯参数
————————————————
版权声明:本文为CSDN博主「李尔阳」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/Creationyang/article/details/130006729

你可能感兴趣的:(人工智能)