深度学习相关的硬件配置

感谢原作者:MachinePlay 原文链接:https://www.jianshu.com/p/1f67a9f55ae7

写在前面:
1.目前只有Nvida GPU能完整的支持深度学习,所以请购买较新的nvidia显卡(pascal、turing架构以上)
2.GPU上的投资回报比基本呈线性变化,因此可以按照自己的需要配置不同GPU。
3.保持工作站长期稳定工作需要一个靠谱的电源,所以在电源选择上追求稳定。
4.在现有预算下,GPU>CPU=RAM>=SSD
5.云服务用起来简单,长期使用却十分昂贵,所以我们要有自己的硬件设施

一)配置要求

深度学习相关的硬件配置_第1张图片

1.1CPU:
因为主要使用显卡进行cuda计算,因此对CPU的要求并不是很高,频率越高、线程数越多越好,一般最低要求cpu核心数大于显卡个数。其中一个制约因素:cpu的最大PCI-E 通道数。每张显卡占用16条pcie通道才能达到最大性能,而单cpu最大支持40条pcie,也就是即使有4个pcie x16接口,只能最多达到2路x16加一路x8,插上的显卡不能发挥全部性能。不过,主板芯片组其实也可以扩充一部分pcie通道。(x99主板可以扩宽2.0的8lanes,z170可以扩充3.0的20lanes)

1.2显卡:
深度学习需要较强性能的显卡进行复杂的单精度运算,通常神经网络需要大量显存和内存资源,因此需要8GB以上显存才能运行大规模的深度卷积网络,(显存大小决定了网络模型能不能执行)

执行计算机视觉任务,一般选择GTX1070以上配置。应该购买具有较大显存的显卡。

下面给出2080ti、2080、2070、1080ti、1070、1060、Titan X、Titan V的几项指标的对比:

1.2.1  TFLOPS(teraFLOPS FLoating-point Operations Per Second每秒浮点运算次数)单精度。也就是运算性能,决定了运算速度,首选1080ti、2080ti、Titan V,

深度学习相关的硬件配置_第2张图片

1.2.2 VRAM (显存):显存大小决定了我们的网络模型能不能执行,大型的卷积神经网络会使用超过8G以上的显存

深度学习相关的硬件配置_第3张图片

1080Ti 约5000元, 2080Ti约9000元,Titanic V 约25000元。

1.2.3 其他

主板:

      前面提到了cpu提供的pcie通道数的限制,如果要使用多块显卡,就需要主板提供额外的pcie通道,一般只有服务器级别的主板才会提供扩展pcie通道如x99、x299等主板,但是使用此类主板必须搭配具有该接口的服务器级cpu(xeon系列、i7 7900x以上、i9系列等),如果不需要三块以上的显卡,使用cpu提供的40lane pcie即可。

内存:
     深度学习需要大量数据,中间计算过程也会临时储存大量数据,一般要求具有显存2~3倍的内存,32G或64G乃至更高。内存频率越高越好。
最低建议32G DDR4 3200MHz内存(16G*2)约2000元,预算宽裕可升级到64G(约4000元)。

硬盘:
    深度学习需要大量数据,和较快的访问速度,一般使用一个较大的固态硬盘作为系统盘和训练数据仓储盘,另外使用hdd机械硬盘作为仓储盘。
建议使用512G以上nVME固态硬盘(800元)搭配几TB(2TB约300元)Hdd作为储存空间

电源、机箱:电源其实还是要买个比较稳定的,因为要保证长期稳定运行会有“无休止”的training。一般使用大品牌的经过80PLUS金牌或铂金认证的电源。只搭配一张显卡700w即可,每多一张增加400w。4*titan V大概使用1600w电源。


来源:简书                                                                                                                                                                                          原作者:MachinePlay
链接:https://www.jianshu.com/p/1f67a9f55ae7
 

你可能感兴趣的:(深度学习)