深度学习的GPU型号和参数选择

关于深度学习的Nvidia的GPU加速网络训练参数性能测试
英伟达RTX 30系列已出,有预算的,建议直接30系列了

深度学习的GPU型号和参数选择

深度学习注重的参数有两个,分别是显存带宽和单精度浮点计算能力(这里不考虑双精度浮点计算能力)
显存带宽计算涉及到的显卡参数:显存位宽(位)、显存频率(Mhz)
单精度浮点据算能力涉及到的显卡参数:显卡主频(Mhz)、cuda核心

下面介绍常见的几种显卡参数:

显卡型号 显存 单精度计算能力 显存带宽
主频xCuda核心数x2/1000 (TFlops) 显存位宽x显存频率/8/1000(Gb/s)
1060 6G 1.582x1280x2=4.05 192.2
1660ti 6G 1.580x1536x2=4.85 288
1070 8G 1.566x1920x2=5.78 256.32
1070ti 8G 1.607x2432x2=7.85 256
1080 8G 1.607x2560x2=8.23 320
1080ti 11G 1.480x3584x2=10.61 484.4
2060 8G 1.365x1920x2=5.24 336
2070 8G 1.410x2304x2=6.51 448
2070 Super 8G 1.410x2560x2=7.22 448
2080 8G 1.515x2944x2=8.92 448
2080 Super 8G 1.650x3072x2=11.65 448
2080ti 11G 1.350x4352x2=11.75 616
3070 8G 1.730x5888x2=20.40 448
3080 10G 1.71x8704x2=29.80 760
3090 24G 1.70x10496x2=35.70 936
Titan X (Maxwell架构) 12G 1.000x3072x2=6.14 336.6
Titan X (Pacsal架构) 12G 1.418x3584x2=10.16 336.58
Titan XP >12G 1.582x3840x2=12.15 547.7
Titan V >12G 1.200x5120x2=15.36 652.8

根据整理的以上数据

  • 推荐入门级别的选择2060的8GB,计算力和显存带宽都是最低价格也是最低
  • 其次性能较好的就是2070Super,拥有8GB显存,带宽较大,cuda核心数也增多
  • 如果是做图像方面的深度学习,那么标配起步就是1080ti,11GB显存,可以训练更深的网络,cuda核心较多计算力较强,带宽不用多说也是很大(本人18年购买的1080ti显卡,目前已经停产)
  • 此外Titan X(Maxwell)架构的显卡不推荐购买,购买的时候要注意,这款显卡比较老是28nm工艺了,计算力和带宽表现都很差。

根据实际测试1080ti、2070、3070

运行相同的代码所用时间对比,并不能完全依照上述单精度计算能力来对比速度

显卡型号 单精度计算力 测试结果
1080ti 10.61 165s
2070 6.51 194s
3070 20.40 154s

你可能感兴趣的:(深度学习,深度学习)