[已解决]大数据集群CPU告警问题解决

大数据集群CPU告警问题解决

问题

6台机器的 CPU总是连续超过90%

[已解决]大数据集群CPU告警问题解决_第1张图片

思路

调整yarn资源

常见的是调整容器虚拟 CPU 内核

yarn.nodemanager.resource.cpu-vcores

[已解决]大数据集群CPU告警问题解决_第2张图片

根据集群具体的CPU核数规划

[已解决]大数据集群CPU告警问题解决_第3张图片

我另外调整了两个参数

最小容器虚拟 CPU 内核数量

yarn.scheduler.minimum-allocation-vcores

设置为2

原本是1,这样能减少并行的任务数

最大容器虚拟 CPU 内核数量

yarn.scheduler.maximum-allocation-vcores

设置为7

防止CPU超频告警

解决

目前集群稳定运行无告警!

你可能感兴趣的:(Bug错题集,大数据)