蜗牛星际散热问题导致群晖掉盘(已解决)

总论

蜗牛星际A的机箱散热不足,温控风扇不给力,导致硬盘过热,东芝MG06硬盘触发温控保护自我关闭(确切说:不知道是崩了还是自我保护机制),最终导致群晖掉盘,RAID降级。

解决方案很简单,不想看流水账的直接换风扇即可,主板不支持手动调速的不建议用温控风扇,直接上固定转速的又便宜效果又明显。目前换成固定1500 RPM的风扇,靠近机箱包电源噪声54db左右,稳定硬盘温度44° C-46° C。


背景

机箱+主板:蜗牛星际A款 + J1900
硬盘:

  • 日立HGST(8T)(蜗牛星际盘位1)
  • 东芝MG06(8T)(蜗牛星际盘位3)

系统:群晖DS3617xs(黑)
RAID:RAID 1(双备)
基本系统配置:硬盘15分钟休眠


事件原由

今晚在正常使用群晖的时候,突然间收到RAID降级消息.打开面板查了一下,是其中一块硬盘掉了。但是又很快地连接上了,群晖日志显示的是:

RAID Group [1] was degrade [1/2], please repair it.
Disk [3] was removed.
Disk [3] was inserted.
Disk [3] was removed.
Disk [3] was inserted.
...


初步判断

这个时候掉的那个盘还是连接着的,只不过需要重新修复,通过硬盘快速检测及检查了硬盘的SMART信息,一切正常,不过这个时候扫了一眼,发现两块硬盘的温度是:55°57°

  1. 硬盘因为质量问题炸了(坏了)
  2. 蜗牛的SATA面板坏了
  3. 主板SATA接口坏了
  4. 硬盘过热自带温度过载
  5. 玄学...

检查

打开群晖硬盘再次快速检测一次,一切正常。先暂时排除上面猜测硬盘炸了的问题。
下线,拆机,准备检查发现硬盘仓十分热,就把硬盘拔出来,不拔还好,一拔就发现那个硬盘都差不多可以煎蛋了,回想起刚刚看到的两块硬盘的温度:55°57°,有可能是硬盘温度过热导致硬盘自己“关闭重启”了,硬盘关闭势必导致硬盘在群晖下线进而导致RAID降级。


验证

简单验证上面的猜想(主要是蜗牛拆机非常非常麻烦,先检查是不是温度导致的问题再看)。

简单降温

先让硬盘降一点温,装上去,查了一下温度是53°
然后恢复RAID,这时候硬盘基本处于满载运转状态,不一会又下线了(大概恢复了1%)。

持续降温

再拆下来,花半小时把硬盘降温降到室温,插上去使用的同时用风扇(那种手持风扇)对着硬盘吹,保持温度在40°左右,满载运转,目前恢复到30%,一切正常。


现阶段小结

去查了一下东芝的MG06硬盘温度参数:

Operating:5° C to 55° C
Non-Operating:-40° C to 70° C

服了,真的服了,55°就自动停止运转了。之前群晖一直长时间开机没有崩的原因是设了硬盘休眠,这次是长时间没有休眠导致温度太高。
蜗牛星际机箱就只有好看,可惜散热是真的一般,特别是我现在用的蜗牛星际A款。


问题解决:换风扇

原有的温控风扇是300-2000 RPM的(还是很贵的那种),可惜主板只支持自动温控不支持手动调速,J1900没怎么跑运算,CPU发热不大,转速一直最低。因此,硬盘温度蹭蹭蹭上去了。

将温控风扇拆下来,换了一个固定1500 RPM的风扇(D2接口那种,相比温控便宜多了),室温30° C,硬盘温度维持在44° C-46° C之间,正常了。噪声还行,包括1u电源的风扇,靠近54db左右。


总结

最后补充一下,除非长时间保持CPU运转,CPU温度升高使温控风扇转速加大,或者主板支持手动调速,否则不建议用温控风扇。

你可能感兴趣的:(蜗牛星际散热问题导致群晖掉盘(已解决))