【札记】点亮深度学习工作站

终于赶在2017年结束前,点亮了我的深度学习工作站。

【札记】点亮深度学习工作站_第1张图片
小核武.jpg
【札记】点亮深度学习工作站_第2张图片
【札记】点亮深度学习工作站_第3张图片

配置表

配件 型号 价格 数量 合计
GPU 微星 GTX 1080 Ti AERO 11GB 5999 2 11998
CPU 英特尔 i7 6850K 3799 1 3799
主板 X99-E WS/USB 3.1 4298 1 4298
内存 海盗船复仇者16G/3000 1749 2 3498
SSD 浦科特 PX-512M8SeG M.2 1899 1 1899
电源 长城 额定1250W 巨龙GW-EPS1250DA 1099 1 1099
散热器 追风者 TC14PE双塔旗舰版 399 1 399
机械硬盘 希捷酷鱼系列 2TB 7200转64M SATA3 399 1 399
机箱 美商海盗船 780T 黑色 全塔机箱 1259 1 1259
总计 28648

工作站的选型和系统安装主要借鉴了以下两篇文章,都相当靠谱:

  • 配置深度学习主机与环境(TensorFlow+1080Ti)
  • 5700刀打造3卡1080Ti深度学习机器

由于这两篇已经写的非常详细了,所以相同的部分就没必要再赘述,下面只记录下我填的坑。

顺便说一句,内存较2017年年中价格翻翻了,所以半年来深度学习工作站总价并未有明显下降。

坑1:显卡尺寸!显卡尺寸!显卡尺寸!

重要的事情说3遍。

作为工作站平台的x99 E WS/USB3.1已经是这个级别为数不多、能插满4张GTX1080ti的主板了,但是显卡的厚度务必以35mm为限。也就是说,基本上带两个大风扇甚至更多风扇的1080ti们,都不可以拿来组多卡。

我不仅买了MSI红龙1080ti,而且还在京东买的——不支持7天无理由退换货。结果连电都没上,直降500大洋挂在闲鱼上。已经出了一张,还剩一张。

MSI Aero 1080ti是OK的,35mm厚,刚刚好。

坑2:X99 E WS/USB3.1供电

X99 E WS/USB3.1供电位置(接电源),有4处,但是只有其中两处是必要的:24pin的主板供电和8pin的CPU供电。前者没有接错可能,后者我接错了。

两个8pin的CPU供电如下图。其实没必要两个都接满,我最终只接了左侧的8pin。

我的问题在于,我用了6pin+2pin组合,结果当满心欢喜首次按下开关时,只听到电源发出两声“嗒嗒”的金属片声音,风扇都纹丝不动。懵逼了数十分钟。现在看应该是断电保护在起作用。

【札记】点亮深度学习工作站_第4张图片
CPU供电.jpg

错误的6+2:

【札记】点亮深度学习工作站_第5张图片
错误:6pin+2pin

对于8pin的CPU供电,务必使用下面的接口:

【札记】点亮深度学习工作站_第6张图片
正确

坑3:U盘安装Ubuntu出现nouveau SCHED_ERROR

由于x99 E WS/USB3.1连个集成显卡也没有,所以在Ubuntu下会有这个状况。按照下面这篇文章的方案即可解决:

安装ubuntu 提示nouveau SCHED_ERROR 08错误解决方案

坑4:Ubuntu启动紫屏卡住

Ubuntu安装好后重启,无需再从U盘启动,所以坑3的方案已经无用了,可此时显卡驱动还没装,就会出现紫屏的问题。本质上和坑3是一回事。

参考这篇即可顺利进入系统,等把显卡驱动装好后就不会再出现了。

【札记】点亮深度学习工作站_第7张图片
添加nomodeset

双系统共享HDD

我装的双系统Win10+Ubuntu16.04,两者2/3开瓜分了512G的SSD,还有一块2T的HDD作为存储盘。为了实现双系统可以共享这个HDD,只需要做2件事:

  • 可先在Windows下对HDD进行GPT分区操作,使用NTFS文件系统;
  • 再Ubuntu下进行挂载设置,见下图;
【札记】点亮深度学习工作站_第8张图片
GUI HDD挂载设置

你可能感兴趣的:(【札记】点亮深度学习工作站)