【札记】点亮深度学习工作站

终于赶在2017年结束前，点亮了我的深度学习工作站。

小核武.jpg

配置表

工作站的选型和系统安装主要借鉴了以下两篇文章，都相当靠谱：

由于这两篇已经写的非常详细了，所以相同的部分就没必要再赘述，下面只记录下我填的坑。

顺便说一句，内存较2017年年中价格翻翻了，所以半年来深度学习工作站总价并未有明显下降。

坑1：显卡尺寸！显卡尺寸！显卡尺寸！

重要的事情说3遍。

作为工作站平台的x99 E WS/USB3.1已经是这个级别为数不多、能插满4张GTX1080ti的主板了，但是显卡的厚度务必以35mm为限。也就是说，基本上带两个大风扇甚至更多风扇的1080ti们，都不可以拿来组多卡。

我不仅买了MSI红龙1080ti，而且还在京东买的——不支持7天无理由退换货。结果连电都没上，直降500大洋挂在闲鱼上。已经出了一张，还剩一张。

MSI Aero 1080ti是OK的，35mm厚，刚刚好。

X99 E WS/USB3.1供电位置（接电源），有4处，但是只有其中两处是必要的：24pin的主板供电和8pin的CPU供电。前者没有接错可能，后者我接错了。

两个8pin的CPU供电如下图。其实没必要两个都接满，我最终只接了左侧的8pin。

我的问题在于，我用了6pin+2pin组合，结果当满心欢喜首次按下开关时，只听到电源发出两声“嗒嗒”的金属片声音，风扇都纹丝不动。懵逼了数十分钟。现在看应该是断电保护在起作用。

CPU供电.jpg

错误的6+2：

错误：6pin+2pin

对于8pin的CPU供电，务必使用下面的接口：

正确

由于x99 E WS/USB3.1连个集成显卡也没有，所以在Ubuntu下会有这个状况。按照下面这篇文章的方案即可解决：

安装ubuntu 提示nouveau SCHED_ERROR 08错误解决方案

Ubuntu安装好后重启，无需再从U盘启动，所以坑3的方案已经无用了，可此时显卡驱动还没装，就会出现紫屏的问题。本质上和坑3是一回事。

参考这篇即可顺利进入系统，等把显卡驱动装好后就不会再出现了。

添加nomodeset

我装的双系统Win10+Ubuntu16.04，两者2/3开瓜分了512G的SSD，还有一块2T的HDD作为存储盘。为了实现双系统可以共享这个HDD，只需要做2件事：

GUI HDD挂载设置