NFS nfs4_reclaim_open_state lock reclaim failed

背景

最近看了比较奇怪的问题,挂载共享了一个NFS,进程会持久化数据到NFS,但是突然开始有一个任务的进度都不动了,查看日志发现是lock报错资源不可用

排查

  1. 之前怀疑有并发的场景,导致资源卡住不释放,导致其他lock无法成功
  2. 看调度没什么问题,通过看日志,看到在某个时间,全部lock失败,不太像并发
  3. dmesg -T| grep NFS
    sudo grep NFS /var/log/messages
    都看到大量NFS nfs4_reclaim_open_state lock reclaim failed
    怀疑是该节点挂载的NFS已经失联,所以导致NFS访问问题

你可能感兴趣的:(开发效能)