pod 卡在terminating无法自动被删除

首先介绍环境信息:
3个master非HA架构,CSI使用nfs server,nfs server是其中一个master节点。
环境部署后nfs server节点down机,导致剩余两个节点的磁盘响应非常慢。
df -h 查看主机的磁盘使用情况,发现命令卡住,无法执行,怀疑是因为nfs server服务端down导致客户端连接服务端失败,这个时候怎么解决呢?
解决办法:
查看主机上已经使用nfs server做mount的目录,通过ls查看目录发现无法执行ls命令卡住

mount | grep serverIP

手动umount 卡住的目录

umount -l /var/lib

此时需要重启kubelet,因为kubelet中已经存在一个goroutine在做umount,且这个goroutine目前处于卡住状态,所以重启一下kubelet,此时kubelet可以重新做umount,然后查看terminating的pod发现pod可以被成功删除。

  • 没有调查清楚的点
    kubelet 删除pod的流程 --force删除的流程

你可能感兴趣的:(pod 卡在terminating无法自动被删除)