GPU 架构概述 费米(Feimi)、开普勒(Kepler)、麦克斯韦(Maxwell)、帕斯卡(Pashcal)和伏特(Volt)架构

GPU 架构概述

本文主要介绍 NVIDIA GPU 每一代架构的技术发展和架构之间的区别和联系,时间跨度从 2010 年至 2017 年,包括费米(Feimi)、开普勒(Kepler)、麦克斯韦(Maxwell)、帕斯卡(Pashcal)和伏特(Volt)架构。

架构名称 Fermi Kepler Maxwell Pascal Volta
中文名字 费米 开普勒 麦克斯韦 帕斯卡 伏特
发布时间 2010 2012 2014 2016 2017
核心参数 16 个 SM,每个 SM 包含 32 个 CUDA Cores,一共 512 CUDA Cores 15 个 SMX,每个 SMX 包括 192 个 FP32+64 个 FP64 CUDA Cores 16 个 SM,每个 SM 包括 4 个处理块,每个处理块包括 32 个 CUDA Cores+8 个 LD/ST Unit + 8 SFU GP100 有 60 个 SM,每个 SM 包括 64 个 CUDA Cores,32 个 DP Cores 80 个 SM,每个 SM 包括 32 个 FP64+64 Int32+64 FP32+8 个 Tensor Cores
特点&优势 首个完整 GPU 计算架构,支持与共享存储结合的 Cache 层次 GPU 架构,支持 ECC GPU 架构 游戏性能大幅提升,首次支持 GPU Direct 技术 每组 SM 单元从 192 个减少到每组 128 个,每个 SMM 单元拥有更多逻辑控制电路 NVLink 第一代,双向互联带宽 160GB/s,P100 拥有 56 个 SM HBM NVLink2.0,Tensor Cores 第一代,支持 AI 运算,NVSwitch1.0
纳米制程 40/28nm 30 亿晶体管 28nm 71 亿晶体管 28nm 80 亿晶体管 16nm 153 亿晶体管 12nm 211 亿晶体管
代表型号 Quadro 7000 K80 K40M M5000 M4000 GTX 9XX 系列 P100 P6000 TTX1080 V100 TiTan V

现代计算机的内存结构主要如下:

GPU 架构概述 费米(Feimi)、开普勒(Kepler)、麦克斯韦(Maxwell)、帕斯卡(Pashcal)和伏特(Volt)架构_第1张图片

Fermi 架构

2010 年 NVIDIA 提出 Feimi 架构,最大可支持 16 个 SMs,每个 SM 有 32 个 CUDA Cores,一共 512 个 CUDA Cores,架构设计主要是以

你可能感兴趣的:(架构,CUDA)