关于全球化大规模混合云 Kubernetes Prometheus 监控体系标准化及 GitOps 自动化改进方案
背景现状某司概况:PaaS/SaaS公司,业务面向全球,包括东南亚/南亚/中东/欧洲/非洲/美洲/东亚…生产k8s集群数十套,生产非生产>100套(多种集群类型,各种公有云/专有云/私有云/数据中心…)疫情以来,持续推进成本优化。某司监控概况,由于历史原因和出于成本考虑:基于原生Prometheus深度定制+自研部分exporter/sd,没用使用kube-prometheus-stack(不兼容