本帖作者是戴尔热工程组的 Hasnain Shabbir。


在购买服务器时,买家不仅要看其购置的硬件成本的价值,还要考虑运行服务器的经常性成本。功耗是影响买家购买决策的关键因素。戴尔出于自身和服务客户的利益考虑,决定打造业内最环保企业的目标,省电是其整体目标的组成内容。戴尔在这方面取得的领先地位让很多评论家大吃一惊,这方面的思想已***到产品设计的底层。

身为戴尔企业级产品团队的热工程师,我觉得有必要与大家分享一下我们在所设计产品的动力冷却效率方面下了多大的功夫。我们的设计目标是在确保系统和组件达到相应的冷却规定的同时减少能耗。为了方便大家更好地理解这个问题,我们有必要指出服务器里的风扇耗电量(用于冷却服务器)可能高达服务器系统耗电总量的 20%。因此,在不降低系统冷却效果的情况下减少风扇能耗是我们设计的一个关键目标。

为实施这种设计方案,我们采用了通常被称为冷却功率 (Power to Cool) 的冷却功率比率 (PTCR) 指标。这个比率的计算方法简单,就是用服务器冷却风扇的耗电功率除以服务器交流输入总功率。例如,如果运行某应用程序的服务器在交流电源插座端消耗了 400W 功率,用于冷却服务器的风扇耗电 20W,则 PTCR = 20W/400W = 5%。PTCR 值视不同系统负载下的风扇转速而定。我们的目标是降低这个比率,最好将其控制在最常见系统功耗的 2% 以下。

PTCR 虽然只是个简单的指标,但是它对系统设计和顾客购买底价的影响却相当大。功耗每减少 1 瓦特,都能反映在顾客的购买底价上。每个服务器上减少 1 瓦特功耗,整个产品的生命期内就能节省数百万美元的开销,该数字还会随着部署服务器的数量而加倍。这种省电效果不仅是服务器级的,还是虚拟架构级的,可以帮助数据中心实现低气流、低功耗,从而在冷却器或部署的其他形式的冷却虚拟架构上节省开支。简言之,PTCR 越小,我们的产品对客户的价值就越大。

如何保证我们的设计能优化冷却效率?在设计服务器时,我们一开始就非常注重服务器底座的冷却效率。首先要对设计选项进行 CFD(计算流体动力学)分析。根据 CFD 的结果选择能降低 PRCR 的最佳布局(见图 1)。选择好最佳布局之后,使用早期原型测试 CFD 结果以确保设计坚固且最优(见图 2)。

 

 

图 1:CFD 建模

  • CFD Model CHD 模型
  • Thermal Result 散热效果
  • Airflow Results 气流效果
  • System Validation 系统验证

 

 

图 2: 系统设计周期

  • FINAL PRODUCT 最终产品
  • FUNCTIONAL SYSTEM 功能系统
  • PROTOTYPE 原型
  • SIMULATION 模拟

进行系统散热设计时,每做一个决定都必须考虑到 PTCR 指标。关于更换部件、DIMM 间隔、CUP 散热器的散热片间距、进出口的通风情况等方面的决定都对 PTCR 优化有很大影响。散热设计的高下主要体现在机箱流阻是否够低,部件更换/布局是否更优,是否能引导气流直接且均匀地穿过系统。这些判断标准帮助我们确保充分有效地利用系统里的气流。

一旦设计脱离了概念阶段,首个功能系统就在开发周期中现身了,这时,我们的所有的重心都放在优化平台服务器的散热控制算法上。从这一刻起,散热控制就成了决定冷却效率的最重要的因素。设计散热控制算法的是为了以最小风扇转速满足系统所有冷却需要,从而减少风扇功耗,降低 PTCR 值。这里我不打算详细介绍风扇控制策略(这方面内容日后在我同事的博文中谈到),风扇控制方案使用安装在模板和部件上的各个散热感应器的反馈的信息,在减少风扇功耗的同时优化冷却效果。风扇控制算法经过各个开发阶段的精细调整和优化,当系统已经准备好交付给客户时,该算法已经达到了最优的形式。

无论您是我们的现有客户或潜在客户,或仅仅是一名好奇的发烧友,我都希望能通过这篇文章能让您对热学、对戴尔及我们的“冷却能力”有所了解。

您可以通过以下几个有用的链接,查阅负责戴尔本代服务器散热设计的我的同事撰写的白皮书。

 DELL™ POWEREDGE™ T610™、R610™ 和 R710™ 服务器散热设计

 DELL™ POWEREDGE™ M-系列散热设计

 

 

更多精彩文章请关注:

戴尔技术社区