谷歌云 | 最大限度地提高可靠性&降低成本:调整 Kubernetes 工作负载的大小

您知道通过调整工作负载请求以更好地代表其实际使用情况可以节省多少钱吗?如果您没有调整工作负载规模,则可能会为工作负载根本没有使用的资源支付过高的费用,甚至更糟,从而使工作负载面临因配置不足而导致可靠性问题的风险。

为了提高 Kubernetes 工作负载的可靠性,设置资源是最重要的事情。在本博客中,我们将帮助您了解Kubernetes 成本优化现状报告的重要发现!

根据我们的研究结果,工作负载调整是最重要的黄金信号。工作负载调整衡量的是开发人员正确使用为其应用程序请求的 CPU 和内存的能力。

规模调整具有挑战性

预测应用程序的资源需求可能非常困难,而传统数据中心环境中的开发人员历来并不关心这一点。在传统的数据中心环境中,通常会预先过度配置资源,以确保满足峰值需求和未来增长的需求,因此开发人员无需专注于准确预测资源需求,因为它们已被过剩容量所覆盖,而在云环境中,资源按需消耗。在效率和可靠性之间找到平衡通常感觉像是一种微妙的平衡行为。

用于调整工作负载规模的工具

Cloud Monitoring 和 GKE UI 中提供了原生工具,您可以使用它们来调整 GKE 上运行的工作负载规模。

在控制台中调整大小

“工作负载成本优化”选项卡可通过显示已使用的资源与请求的资源来帮助您识别可优化的工作负载。

为了充分利用潜在的成本节省,您可以深入了解集群以查看工作负载级别的资源建议。

仅查看部署对象的工作负载资源建议:

  • 在GKE 成本优化中
  • 选择一个集群
  • 单击工作负载 > 成本优化
  • 选择一个部署工作负载
  • 在工作负载的详细信息页面中,选择操作 > 扩展 > 编辑资源请求

通过云监控调整规模

Cloud Monitoring 提供内置的 VPA 规模建议指标,您可以使用这些指标来监控工作负载的性能并确定调整工作负载规模的机会,而无需创建 VPA 对象

要查看这些指标:

  1. 进入云监控 > 指标探索控制台。
  2. 在指标下拉列表中,选择指标:
  • 内存建议:
    Kubernetes Scale > autoscaler > Recommended per replica request bytes
  • CPU推荐:
    Kubernetes Scale > autoscaler > Recommended per replica request cores

大规模调整规模

如果您有兴趣查看跨集群和项目的建议,我们创建了一份指南,您现在就可以使用它来帮助您大规模调整 GKE 工作负载规模。

此解决方案利用 Cloud Monitoring 提供的实际集群的指标数据和内置工作负载建议。您可以确定所有工作负载的资源要求,而无需在每个集群中创建额外的 VPA 自动缩放程序对象。该指南将引导您完成解决方案的部署。

综上所述

总之,调整工作负载规模对于节省成本和提高可靠性至关重要。通过遵循本博客中的提示,您可以确保您的工作负载使用正确数量的资源,这将为您节省资金并提高工作负载的可靠性。

下面列出了本博客中提供的解决方案的链接以及可帮助您优化集群的其他有用工具:

大规模调整工作负载解决方案指南

设置资源请求:Kubernetes成本优化的关键

简单的kube-requests-checker工具

使用一组示例工作负载在 GKE 中进行设置的交互式教程

如果您有任何疑问或需求,欢迎随时与我们取得联系。

你可能感兴趣的:(开发云服务云计算)