部署生产级别的 Kubernetes 集群要注意哪些问题?

在生产中开始使用Kubernetes,需要解决很多问题:
1.规划阶段的问题:集群是用作开发测试使⽤,还是⽣产使用? 集群节点用哪种操作系统?集群部署在物理理机上,还是云平台上? 集群采⽤哪种网络⽅案?应用服务如何对外暴露? 集群用哪种持久化存储? 是否需要支持 GPU?
2.部署阶段的问题:是否有可视化页面,降低部署门槛?如何快速创建集群主机资源? 如何实现自动化一键部署,比如调用 Ansible、Puppet等?是否可以支持离线部署?
3.运营阶段的问题:集群如何进行备份和恢复?集群如何无缝升级? 集群如何快速扩容? 监控、告警、日志是否完善? 如何进行快速安全加固,打补丁?

所以要部署和运营生产可用的 K8s 集群,除了自身要有很强的理论知识和实践外,还需要借助一定的工具。这些工具列表可以查看 CNCF 认证过的列表,https://landscape.cncf.io/category=certified-kubernetes-installer&format=card-mode&grouping=category,总共有 19个工具。这边简单点评下国人常用的几个工具。

Kubespray、KOps 这类工具只关注安装部署阶段,满足不了前期规划,及后期持续运营的要求。另外,比较麻烦的是,一般依赖于联网环境,国内特色网络环境下很麻烦。

Openshift 之类的平台过于庞大,没有商业支持很难陆地,真买的话也很贵。另外两个可选工具是 KubeOperator 和 RKE(Rancher)。如果仅是集群管理员使用的话,KubeOperator 会更合适, 可以通过 Web UI 在 VMware、OpenStack 和物理机上规划、部署和运营生产级别的 Kubernetes 集群,支持内网离线环境、支持 GPU。

你可能感兴趣的:(部署生产级别的 Kubernetes 集群要注意哪些问题?)