k8s集群-calico-报错-dial tcp *:10250: connect: connection refused

1. 机房断电服务器重启

在 Kubernetes 集群中,确认节点已经重新启动并正常运行。

# 查看节点状态 kubectl get nodes

2. 查看 Calico Pod 的详细信息和日志

  1. 查看 Calico Pod 的事件信息:

kubectl describe pod -n kube-system calico-node-gd96f

  1. 查看 Calico Pod 的日志:

kubectl logs -n kube-system calico-node-gd96f

注意:如果你遇到 Error from server: Get ... connection refused 错误,请确保与 Kubernetes API 的连接正常。

3. 状态显示调度成功,但无法链接节点的端口

确认节点与集群的网络连接正常。执行以下操作:

  1. 确保节点的网络端口可用。
  2. 在 Master 节点上使用 ping 命令测试与节点的连通性。
  3. 登录到节点服务器并执行以下命令检查防火墙设置:

systemctl status firewalld.service

如果防火墙处于运行状态,请关闭防火墙:

systemctl stop firewalld.service

  1. 使用以下命令查看节点的内存情况:

free -m

如果发现 swap 分区仍然存在,执行以下命令关闭 swap 分区:

swapoff -a

5. 返回 Master 节点查看 Calico Pod 状态

返回到 Master 节点,并检查 Calico Pod 的状态:

kubectl get pods -n kube-system

确认 Calico Pod 的状态为 Running

NAME READY STATUS RESTARTS AGE calico-kube-controllers-7c845d499-x6444 1/1 Running 0 21m calico-node-fp5bt 1/1 Running 0 21m calico-node-gd96f 1/1 Running 0 21m calico-node-nl2rx 1/1 Running 0 21m coredns-6d8c4cb4d-wlnw6 1/1 Running 1 (4d ago) 31d

你可能感兴趣的:(云原生,kubernetes,容器,云原生)