详细介绍 NVIDIA GeForce RTX 系列,各显卡配置参数(长期更新 - 2024.12)

NVIDIA GeForce RTX 系列是 NVIDIA 面向消费级市场的高性能 GPU 产品线,注重提供高性能的图形处理能力和游戏特性。主要面向游戏玩家和普通用户,同时也被广泛用于深度学习推理和训练等计算密集型任务。

主要 GPU 产品有:50 Series 、40 Series 、30 Series、20 Series、10 Series 。其主要参数如下:


NVIDIA GeForce RTX 50 Series 规格


架构:Blackwell
发布时间:2025.01
制造工艺:TSMC 3 nm

50 系列显卡暂未发布(2024.12),以下数据汇总于社区提供


关键参数 RTX 5090 RTX 5080 RTX 5070 Ti RTX 5070 RTX 5060 RTX 5050
每秒 FP32 运算次数 (TFLOPS) 109.7 54.19 TFLOPS 45.16 TFLOPS 32.26 TFLOPS 23.22 TFLOPS 12.90 TFLOPS
SM 数量 170 84 70 50 36 20
CUDA Core 数量 21760 10752 8960 6400 4608 2560
Tensor Cores 数量 680 334 280 200 144 80
标准显存配置 32 GB GDDR7 16 GB GDDR7 16 GB GDDR7 12 GB GDDR7 8 GB GDDR7 8 GB GDDR6
显存位宽 512 bit 256 bit 256 bit 192 bit 128 bit 128 bit
显存带宽 (TB/sec) 1.52 TB/sec 710.1 GB/sec 710.1 GB/sec 532.6 GB/sec 355.0 GB/sec 224 GB/sec
一级缓存 128 KB 128 KB 128 KB 128 KB 128 KB 128 KB
二级缓存 88 MB 64 MB 64 MB 40 MB 32 MB 32 MB
显卡总功耗 (W) 500 350 300 220 170 100

NVIDIA GeForce RTX 40 Series 规格


架构:Ada Lovelace
发布时间:2022.09.20
制造工艺:TSMC 4 nm


关键参数 RTX 4090 RTX 4090 D RTX 4080 SUPER RTX 4080 RTX 4070 Ti SUPER RTX 4070 Ti RTX 4070 SUPER RTX 4070 RTX 4060 Ti RTX 4060
发售价格 (美金) $1,599 $1,599 $1,199.00 $999.00 $799.00 $799.00 $599.00 $599.00 $399 $299.00
晶体管数量 763 亿 763 亿 459 亿 459 亿 459 亿 358 亿 358 亿 358 亿 229 亿 189 亿
晶粒面积 (mm2) 608.4 608.4 378.6 378.6 378.6 294.5 294.5 294.5 190 146
每秒 FP32 运算次数 TFLOPS 82.58 73.54 52.22 48.74 44.1 40.1 35.48 29.15 22.06 15.11
SM 数量 128 114 80 76 66 60 56 46 34 24
CUDA Core 数量 16384 14592 10240 9728 8448 7680 7168 5888 4352 3072
Tensor Cores 数量 512 456 320 304 264 240 224 184 136 96
Ray Tracing Cores 数量 128 114 80 76 66 60 56 46 34 24
纹理映射单元 (TMU) 数量 512 456 320 304 264 240 224 184 136 96
渲染输出单元 (ROP) 数量 176 176 112 112 96 80 80 64 48 32
加速频率 2.52 GHz 2.52 GHz 2.55 GHz 2.51 GHz 2.61 GHz 2.61 GHz 2.48 GHz 2.48 GHz 2.54 GHz 2.46 GHz
基础频率 2.23 GHz 2.28 GHz 2.29 GHz 2.21 GHz 2.34 GHz 2.31 GHz 1.98 GHz 1.92 GHz 2.31 GHz 1.83 GHz
标准显存配置 24 GB GDDR6X 24 GB GDDR6X 16 GB GDDR6X 16 GB GDDR6X 16 GB GDDR6X 12 GB GDDR6X 12 GB GDDR6X 12 GB GDDR6 / 12 GB GDDR6X 16 GB GDDR6 或 8 GB GDDR6 8 GB GDDR6
显存位宽 384 bit 384 bit 256 bit 256 bit 256 bit 192 bit 192 bit 192 bit 128 bit 128 bit
显存带宽 (GB/sec) 1008 GB/sec 1008 GB/sec 736 GB/sec 717 GB/sec 672 GB/sec 504 GB/sec 504 GB/sec 504 GB/sec 288 GB/sec 272 GB/sec
一级缓存 128 KB 128 KB 128 KB 128 KB 128 KB 128 KB 128 KB 128 KB 128 KB 128 KB
二级缓存 72 MB 72 MB 64 MB 64 MB 48 MB 48 MB 48 MB 36 MB 32 MB 24 MB
最高 GPU 温度 90 ℃ 90 ℃ 90 ℃ 90 ℃ 90 ℃ 90 ℃ 90 ℃ 90 ℃ 90 ℃ 90 ℃
闲置功耗 (W) 19 19 15 13 12 12 11 10 7 7
视频播放功耗 (W) 25 26 22 21 17 20 16 16 13 11
常规游戏功耗 (W) 315 302 246 251 226 226 200 186 140 110
显卡总功耗 (W) 450 425 320 320 285 285 220 200 165 或 160 115
要求的系统功率 (W) 850 850 750 750 700 700 650 650 550 550
所需电源接口 3x8-pin 3x8-pin 3x8-pin 2x8-pin 2x8-pin 2x8-pin 2x8-pin 8-pin 8-pin 8-pin

CUDA Core 是 NVIDIA 显卡架构的核心组成部分,专为处理图形渲染和并行计算任务设计。主要用于传统的 浮点运算 和 整数运算,比如顶点着色、像素渲染,以及科学计算中的矩阵操作、图像处理等。

Tensor Core 是从 Volta 架构(V100) 开始引入的,用于 矩阵乘法和累加运算,这是深度学习的核心计算任务。主要用于 AI 加速,例如 深度学习推理 和 训练,以及支持图形中的 DLSS(深度学习超级采样) 技术。

二者详细区别,可参考另一篇文章 NVIDIA 显卡 CUDA Core 和 Tensor Core 特性及其区别

一级缓存 L1 Cache 位于 GPU 核心内部,与流处理器(Streaming Multiprocessor,SM)等部件紧密相连,访问速度非常快,但容量相对较小。主要用于存储频繁访问的数据,如最近使用的像素数据、顶点数据等,以减少对外部显存的访问次数,提高数据访问的速度

二级缓存 L2 Cache 通常是多个流处理器或计算单元共享的,容量相对较大,但访问速度比 L1 Cache 慢一些。主要用于缓存从显存中读取的数据以及中间计算结果,以便在后续的计算中能够快速地获取这些数据,进一步提高数据的命中率和 GPU 的整体性能


码字不易,若觉得本文对你有用,欢迎点赞 、分享 ,相关技术热点时时看​​​…


NVIDIA GeForce RTX 30 Series 规格


架构:Ampere
发布时间:2020.09.01
制造工艺:Samsung 8 nm


关键参数 RTX 3090 Ti RTX 3090 RTX 3080 Ti RTX 3080 RTX 3070 Ti RTX 3070 RTX 3060 Ti RTX 3060 RTX 3050 (8 GB) RTX 3050 (6 GB)
发售价格 (美金) $1,999.00 $1,499.00 $1,199.00 $699.00 $599.00 $499.00 $399.00 $329.00 $249.00 $249.00
晶体管数量 283 亿 283 亿 283 亿 283 亿 174 亿 174 亿 174 亿 133 亿 133 亿 133 亿
晶粒面积 (mm2) 628.4 628.4 628.4 628.4 392.5 392.5 392.5 276 276 276
每秒 FP32 运算次数 TFLOPS 33.54 29.28 28.57 25.07 19.35 17.66 13.72 9.46 7.95 7.95
SM 数量 84 82 80 68 48 46 38 28 20 20
CUDA Core 数量 10752 10496 10240 8960 / 8704 6144 5888 4864 3584 2560 (1) 2304
Tensor Cores 数量 336 328 320 272 192 184 152 112 80 80
Ray Tracing Cores 数量 84 82 80 68 48 46 38 28 28 28
纹理映射单元 数量 336 328 320 272 192 184 152 112 80 80
渲染输出单元 数量 112 112 112 96 96 96 80 48 32 32
加速频率 (GHz) 1.86 1.7 1.67 1.71 1.77 1.73 1.67 1.78 1.78 (1) 1.47
基础频率 (GHz) 1.56 1.4 1.37 1.26 / 1.44 1.58 1.5 1.41 1.32 1.55 (1) 1.04
标准显存配置 24 GB GDDR6X 24 GB GDDR6X 12 GB GDDR6X 12 GB GDDR6X / 10 GB GDDR6X 8 GB GDDR6X 8 GB GDDR6 8 GB GDDR6 / 8 GB GDDR6X 12 GB GDDR6 / 8 GB GDDR6 8 GB GDDR6 6 GB GDDR6
显存位宽 384 bit 384 bit 384 bit 384 bit / 320 bit 256 bit 256 bit 256 bit 192 bit / 128 bit 128 bit 96 bit
显存带宽 (GB/sec) 1008 936 912 760 608 448 448 360 224 224
一级缓存 128 KB 128 KB 128 KB 128 KB 128 KB 128 KB 128 KB 128 KB 128 KB 128 KB
二级缓存 6 MB 6 MB 6 MB 5 MB 4 MB 4 MB 4 MB 3 MB 2 MB 2 MB
最高 GPU 温度 (℃) 92 ℃ 93 ℃ 93 ℃ 93 ℃ 93 ℃ 93 ℃ 93 ℃ 93 ℃ 93 ℃ 93 ℃
显卡总功耗 (W) 450 350 350 350 / 320 290 220 200 170 130 70
要求的系统功率 (W) (8) 850 750 750 750 750 650 600 550 550 300
所需电源接口 3x8-pin 2x8-pin 2x8-pin 2x8-pin 2x8-pin 8-pin 8-pin 8-pin 8-pin 8-pin

NVIDIA GeForce RTX 20 Series 规格


架构:Turing
发布时间:2018.09.20
制造工艺:TSMC 12 nm


关键参数 RTX 2080 Ti RTX 2080 SUPER RTX 2080 RTX 2070 SUPER RTX 2070 RTX 2060 SUPER RTX 2060
发售价格 (美金) $999.00 $699.00 $699.00 $499.00 $499.00 $399.00 $349.00
晶体管数量 (亿) 186 亿 136 亿 136 亿 136 亿 108 亿 108 亿 108 亿
晶粒面积 (mm2) 754 545 545 545 445 445 445
每秒 FP32 运算次数 (TFLOPS) 11.8 10.1 8.92 8.22 6.5 6.12 5.24
SM 数量 68 48 46 40 36 34 30
CUDA Core 数量 4352 3072 2944 2560 2304 2176 2176 / 1920
Tensor Cores 数量 544 384 368 320 288 272 240
Ray Tracing Cores 数量 68 48 46 40 36 34 30
纹理映射单元数量 272 192 184 160 144 136 120
渲染输出单元数量 88 64 64 64 64 64 48
加速频率 (GHz) 1.64 1.82 1.8 1.77 1.71 1.65 1.65 / 1.68
基础频率 (GHz) 1.35 1.65 1.52 1.61 1.41 1.47 1.47 / 1.37
标准显存配置 11 GB GDDR6 8 GB GDDR6 8 GB GDDR6 8 GB GDDR6 8 GB GDDR6 8 GB GDDR6 12 GB GDDR6 / 6 GB GDDR6
显存位宽 352 bit 256 bit 256 bit 256 bit 256 bit 256 bit 192 bit
显存带宽 (GB/sec) 616 496 448 448 448 448 336
一级缓存 64 KB 64 KB 64 KB 64 KB 64 KB 64 KB 64 KB
二级缓存 5.5 MB 4 MB 4 MB 4 MB 4 MB 4 MB 3 MB
最高 GPU 温度 (℃) 89 89 88 88 89 89 88
显卡总功耗 (W) 260 250 225 215 185 175 185 / 160
要求的系统功率 (W) (8) 650 650 650 650 550 550 550 / 500
所需电源接口 2x8-pin 6-pin+8-pin 6-pin+8-pin 6-pin+8-pin 8-pin 8-pin 8-pin

码字不易,若觉得本文对你有用,欢迎点赞 、分享 ,相关技术热点时时看​​​…


NVIDIA GeForce RTX 16 Series 规格


架构:Turing
发布时间:2019.02.22
制造工艺:TSMC 12 nm


关键参数 GTX 1660 Ti GTX 1660 Super GTX 1660 GTX 1650 Super GTX 1650 (G5) GTX 1650 (G6) GTX 1630
发售价格 (美金) ¥279.00 ¥229.00 ¥219.00 ¥159.00 ¥149.00 ¥149.00 None
晶体管数量 (亿) 66 66 66 66 47 47 47
晶粒面积 (mm2) 284 284 284 284 200 200 200
每秒 FP32 运算次数 (TFLOPS) 4.61 4.31 4.31 3.92 2.66 2.53 1.83
SM 数量 24 22 22 20 14 14 8
CUDA Core 数量 1536 1408 1408 1280 896 896 512
纹理映射单元数量 96 88 88 80 56 56 32
渲染输出单元数量 48 48 48 32 32 32 16
加速频率 (MHz) 1770 1785 1785 1725 1665 1590 1785
基础频率 (MHz) 1500 1530 1530 1530 1485 1410 1740
标准显存配置 6GB GDDR6 6GB GDDR6 6GB GDDR5 4GB GDDR6 4GB GDDR5 4GB GDDR6 4GB GDDR6
显存位宽 192 bit 192 bit 192 bit 128 bit 128 bit 128 bit 64 bit
显存带宽 (GB/sec) 288 336 192 192 192 192 128
一级缓存 (KB) (per SM) 64 KB 64 KB 64 KB 64 KB 64 KB 64 KB 64 KB
二级缓存 (MB) 1.5 MB 1.5 MB 1.5 MB 1 MB 1 MB 1 MB 1 MB
最高 GPU 温度 (℃) 95 93 95 90 92 94 94
显卡总功耗 (W) 120 125 120 100 75 75 75
要求的系统功率 (W) (8) 450 450 450 350 300 300 300
所需电源接口 8-pin 8-pin 8-pin 6-pin 6-pin 6-pin 6-pin

NVIDIA GeForce RTX 10 Series 规格


架构:Pascal
发布时间:2016
制造工艺:Samsung 16 nm


关键参数 GTX 1080 Ti GTX 1080 GTX 1070 Ti GTX 1070 GTX 1060 GTX 1050 Ti GTX 1050
发售价格 (美金) $120.00 $72.00 $72.00 $72.00 $72.00 $33.00 $33.00
晶体管数量 (亿) 471 314 312 314 314 132 132
晶粒面积 (mm2) 699 599 449 379 249 139 109
每秒 FP32 运算次数 (TFLOPS) 10.61 8.23 7.82 5.78 3.86 1.98 1.73
SM 数量 28 20 19 15 10 6 5
CUDA Core 数量 3584 2560 2432 1920 1280 768 640
纹理映射单元数量 224 160 152 120 80 48 40
渲染输出单元数量 88 64 64 64 48 32 32
加速频率 (MHz) 1582 1733 1683 1683 1708 1392 1455
基础频率 (MHz) None 1607 1607 1506 1506 1290 1354
标准显存配置 11 GB GDDR5X 8 GB GDDR5X 8 GB GDDR5 8 GB GDDR5 6 GB GDDR5X 4 GB GDDR5 2 GB GDDR5
显存位宽 352 256 256 256 192 128 128
显存带宽 (GB/sec) 484 320 256 256 192 112 112
一级缓存 (KB) (per SM) 48 KB 48 KB 48 KB 48 KB 48 KB 48 KB 48 KB
二级缓存 (MB) 2.78 2 2 2 1.5 1 1
最高 GPU 温度 (℃) 91 94 94 94 94 97 97
显卡总功耗 (W) 250 180 180 150 120 75 75
要求的系统功率 (W) (8) 600 500 500 500 400 300 300
所需电源接口 6-pin + 8-pin 8-Pin 8-Pin 8-Pin 6-Pin None None

NVIDIA GeForce RTX 9 Series 规格


关键参数 GTX 980 Ti GTX 980 GTX 970 GTX 960 GTX 950
发售价格 (美金) $80.00 $52.00 $52.00 $29.40 $29.40
晶体管数量 (亿) 601 398 398 227 227
晶粒面积 (mm2) 649 549 329 199 159
每秒 FP32 运算次数 (TFLOPS) 5.63 4.61 3.49 2.31 1.57
SMM 数量 22 16 13 8 6
CUDA Core 数量 2816 2048 1664 1024 768
纹理映射单元数量 176 128 104 64 48
渲染输出单元数量 96 64 56 32 32
加速频率 (MHz) 1076 1216 1178 1178 1188
基础频率 (MHz) 1000 1126 1050 1127 1024
标准显存配置 6 GB GDDR5 4 GB GDDR5 4 GB GDDR5 2 GB GDDR5 2 GB GDDR5
显存位宽 384 256 224 128 128
显存带宽 (GB/sec) 336 224 196 112 106
一级缓存 (KB) (per SMM) 48 KB 48 KB 48 KB 48 KB 48 KB
二级缓存 (MB) 3 2 1.75 1 1
最高 GPU 温度 (℃) 92 98 98 98 95
显卡总功耗 (W) 250 165 145 120 90
要求的系统功率 (W) (8) 600 500 500 400 350
所需电源接口 6-pin + 8-pin 2x6-Pin 2x6-Pin 6-Pin 6-Pin

码字不易,若觉得本文对你有用,欢迎点赞 、分享 ,相关技术热点时时看​​​…


你可能感兴趣的:(人工智能,深度学习,机器学习,gpu算力,AIGC,人工智能,图形渲染)