自己动手组装深度学习服务器遇到的问题(2 X 2080Ti)

注: 本文是作者的自我总结,主要作为个人记录, 欢迎大家批评,交流. https://zhouxiaowei1120.github.io/#blogs

自己动手组装深度学习服务器

由于实验室要买一台用于深度学习的服务器,凸凹这边直接买整机的话,价格比较偏高,所以就干脆自己组装。由于自己之前也只是了解组装服务器的一些皮毛,所以这次也没少费时,去了解这些知识。在这里,更多的记录自己之前没有考虑的问题,以供大家参考。

配置清单

我组装的这台机器,是双intel Xeon E5-2630V4 cpu, 双RTX 2080
ti GPU,96G内存,一个10THDD,一个500GSSD。以下是自己列出的各个配件的清单:

具体的关于机器如何配置的问题,大家也可以参考这些帖子:https://www.zhihu.com/question/33996159

安装配置

装配之前,大家可以在网上看看一些安装教程视频。我觉得,大部分插线,组件,大家应该都不会插错,毕竟线的设计已经考虑了会插错的问题,让大家只能以一种正确的方式插进去。所以,如果不能插入某个插口,不要硬插,确保线的插口方向是正确的,再稍微用点力量插进去。建议大家在插线之前,一定要先阅读主板的说明书,这一点非常关键。

装配的过程,我认为最关键步骤的是如何插主机前置面板插线,有的人也称为跳线。首先,你要找到主板上,关于这一点的说明。如下图,就是我这款主板的说明:
自己动手组装深度学习服务器遇到的问题(2 X 2080Ti)_第1张图片
根据这幅图的说明,一般就不会插错了。线插好之后,发现线上的字,都是朝外可以看见的。这也算是检查是否插对的一个小技巧。

注意事项

  1. 购买配件时,一定要弄清楚,cpu是否包含风扇,不然需要单独买风扇的。而且要注意CPU风扇的大小是否匹配你的机箱尺寸,不然装上风扇之后,可能无法盖上主机盖。
  2. 购买主板时,注意PCIE插口的分布和GPU的大小。有可能买回来的是可以插4gpu的主板,但是因为尺寸不匹配,导致无法插上4个GPU。
  3. 注意主板上的sata插口和GPU的位置,有可能遇到sata插口被GPU盖住的问题。这个问题十分尴尬。有钱的话,可以换主板。或者买个弯头的sata数据线,可能可以解决这个问题。
  4. 安装CPU风扇时,记得涂硅脂。而且自己单独买的风扇,其中可能有很多配件,这些配件不一定都要用上。有些配件是针对不同CPU型号配置的,注意对应好自己的CPU型号。
  5. 安装内存条时要注意,经常会因为内存条安装不好,导致主板自检不通过。遇到这种情况,可以把内存条拔下来重新插,多试几次,一般就好了。
  6. GPU插入时,一定要插入底,可能机箱外面的护板会阻碍GPU。可以用螺丝刀处理一下。
  7. 安装完成之后,注意查看机箱的风道。是否风扇的吹风方向,能形成良好的进风出风风道。只有良好的风道,才会有良好的通风。
  8. 安装系统centos之后,未装显卡驱动之前,连接显卡上的HDMI接口,系统无法显示,直接黑屏。建议在未装驱动之前,仍然使用主板的显卡,进行显示。
  9. centos 安装之后,无法上网,主要问题是无法获取ip。
    1)首先设置/etc/sysconfig/network-scrips/路径下的网卡配置文件 ifcfg-ensxxx,将ONBOOT设置为yes,保存。
    2) 执行 service network restart,再执行dhclient。
    如果2)执行失败,可以参考以下链接Centos 7: failed to bring up/down networking: configure interface for a trunk interface,先执行
    systemctl stop NetworkManager
    systemctl disable NetworkManager
    
    再执行2)。

最后奉上安装完毕的图片。

自己动手组装深度学习服务器遇到的问题(2 X 2080Ti)_第2张图片

你可能感兴趣的:(技术类)