深度学习硬件配置

硬件环境

以下配置针对小型企业级深度学习的配置建议,关于服务器配置细节还需要专业有经验的人确认合理性。

GPU

考虑方面整机价格参考

RTX 2080 Ti 总体¥58988https://item.jd.com/41013681385.html#crumb-wrap

RTX 2080成本效益高,但价格昂贵¥41888https://item.jd.com/41013681388.html#crumb-wrap

RTX 2080 比 RTX 2080 Ti 的性价比更高。 与 RTX2080 相比,RTX 2080 Ti 的 Tensor 核心和带宽增加了约 40%,价格提高了 50%,但性能并没有提高 40%。

RTX 2080 具有更高的性价比,因为它具有比 GTX 10 系列获得性能提升(GDDR6 + Tensor 核心)所需的所有功能,同时也比 RTX 2080 Ti 更便宜。

关于RTX和GTX的选用参考了https://jingyan.baidu.com/article/a501d80c544262ec630f5ed3.html

由于大部分网络占满一个GPU,为了同时可以训练多个网络,建议使用多GPU。

CPU

初学者建议CPU的核数和线程数越多越好。

如果使用GPU运算,则对CPU没有特殊需求。 CPU的核心数量和显卡数量一致即可。

内存

鉴于相对GPU和CPU而言内存所需要的资金投入比较少,建议至少配备32G,总投入大约1500,预算充裕的话,可以直接上64G。
由于内存的扩展非常便捷,完全可以先使用32G以后根据情况考虑是否扩展。前提是,选择的都是DDR4的内存。

硬盘

因为GPU速度越来越快,硬盘速度需要跟上,考虑固态硬盘(SSD)。硬盘容量建议越大越好。

主板

如果要使用多GPU训练 , 主板要有多个PCIe * 16的卡槽。

提示:由于CPU所支持的PCIe通道数和主板支持PCIe通道数会对多GPU训练产生影响,尽可能的选择支持PCIe3.0的主板。

电源

电源CPU功率 + GPU功率 + 额外组件功率 + 电力峰值缓冲 100~300W。一个显卡的功率接近300W,四显卡建议电源在1500W以上,为了以后扩展,可以选择1600W的电源。

如果是单显卡的话,一个800W的电源就足够了。

机箱

机箱尺寸会对显卡长度和数量造成限制,所以要主意机箱支持的显卡长度和数量。

另外散热情况也要综合考虑。未来如果需要还可以加装水冷设备。机箱的空间最好是大一些,毕竟这一堆高性能的东西,要保证足够好的散热,当然,有条件还是上水冷吧,那么多钱都花了。

散热

安装多个机箱风扇形成风道进行散热。

安装的软件环境

安装linux操作系统(Ubuntu系统,64位) 。Centos上安装Caffe较大的问题是yum 源问题,各种找不到,只能自己手动在网上找,然后下载,再安装。

你可能感兴趣的:(机器学习,深度学习)