IBM LSF 任务调度系统客户案例——赛普拉斯半导体

赛普拉斯半导体利用 IBM 平台计算以更低的成本将先进技术更快推向市场

在工作站和网络文件服务器上存储数据影响了性能、数据可访问性和可靠性,阻碍了缩短半导体产品总周期时间的努力。如今,GPFS™ 存储解决方案消除了数据访问的瓶颈,赛普拉斯的性能提高了十倍,并提高了可用性。

业务挑战
为了抢在竞争对手之前将新产品推向市场并降低设计成本,赛普拉斯必须不断缩短总周期时间 (TCT),增加潜在收入、提高利润率。

转型
通过部署 IBM General Parallel File System(GPFS™) 支持全球芯片设计和部署IBM Platform™ Load Sharing Facility (LSF)管理仿真 HPC 集群,消除了存储瓶颈。

成效

  • 在相同的硬件上的处理速度比以前快 10 倍
  • 通过缩短总周期时间节省大量年度成本
  • 计划停机时间最小化

业务挑战简述

存储瓶颈

在半导体行业中,一个关键的业务指标是总周期时间(TCT),即从最初想法到成品之间的时间。通过削减TCT,赛普拉斯可以更早地将新的或改进的解决方案推向市场,并降低设计成本。领先于竞争对手进入市场自然会增加收入机会,而削减成本可以提高利润率。

对于产品功能增强和新产品,赛普拉斯的设计周期依赖于由 IBM Platform LSF 管理的、在集群上运行的电子设计自动化(EDA)软件。

“仿真和验证新集成电路的原理图是I/O密集型的,而存储一直是复杂的,”赛普拉斯IT总监Alan Malek说,“我们将数据存储在工作站上,或者部署在网络文件服务器上,这是有风险的。一旦您有十个独立的存储服务器,日常管理就成了一个主要问题。如果您在 48 小时的模拟中耗尽了空间,则需要重新开始,从而增加成本、延长总周期时间(TCT)。”

由于存储性能和容量问题影响了公司及时、经济高效地将产品推向市场的能力,赛普拉斯需要一种集中且更具可扩展性的方法。

“GPFS运作良好,这是我们有史以来最好的存储状态。”
——赛普拉斯半导体 IT 总监 Alan Malek,

转型叙述

分担负载

为了更好地管理同时进行集群计算作业的存储,赛普拉斯选择了 IBM General Parallel File System (GPFS)——旨在对来自多个服务器的一组通用数据提供高性能访问的并行文件系统。

“我们希望能够向单个逻辑存储池添加容量,并且需要将其拆分到多个分布式服务器,以满足我们对性能和并行访问的需求,”Malek 说,“借助 GPFS,我们可以在新添加的服务器之间分担负载来提高存储性能。我们最初研究的是开源分布式文件系统,但与 GPFS 不同,它无法处理我们在制造之前使用的超大文件。”

赛普拉斯在 CentOS 上原生使用 GPFS 作为其唯一的文件系统,为其数据中心的所有集群提供全局可寻址的命名空间。为了避免额外许可证的成本,工作站使用 GPFS 的内置集群 NFS 组件访问通用数据。

“与以前的分布式文件系统相比,我们看到相同硬件的性能提高了一个数量级,”Malek 说,“处理速度越快,我们用相同数量的 LSF 许可证就能实现越多。快速的处理有助于减少 TCT,并以更低的成本更快地将产品推向市场。

成效简述

速度、弹性、可扩展性

借助全局可寻址的命名空间,多个芯片设计人员团队可以轻松共享中央文件存储。

“将所有文件放在一个地方意义重大,不用四处寻找”马雷克说,“作业运行更可靠,性能更好,数据中心之间的分布更均匀。

更可预测的存储性能使赛普拉斯能够更准确地确定容量需求的大小 ——在这种情况下,性能提高了 50%。GPFS 还可确保业务关键型 EDA 流程的高可用性。

“停机对我们来说代价高昂,使设计师无法完成工作并影响 TCT,”Malek 说,“借助 GPFS,我们可以完全消除计划外停机,因为硬件故障是无中断的。我们做了一些计划内维护,在不影响 LSF 作业的情况下使节点脱机,这对我们来说是一个巨大的胜利。该架构为我们的系统管理员提供支持,因为他们不必担心故障。”

高可靠性意味着低总拥有成本,这是选择 GPFS 而不是免费替代品的决定性因素。Malek 解释说:“很容易被零美元的价格标签所蒙蔽,更重要的是持续的管理成本,IBM 解决方案的持续的管理成本非常低。GPFS运作良好,这是我们有史以来最好的存储状态。”

赛普拉斯半导体简介

赛普拉斯半导体总部位于加利福尼亚州圣何塞,公司拥有3500名员工,是知名的电子芯片制造商,在数据通信、消费类电子等广泛领域提供芯片解决方案。

你可能感兴趣的:(LSF任务调度系统,人工智能,大数据,云计算,LSF,任务调度系统,存储管理)