kubernetes: Failed to pull image...rpc error: code = Canceled desc = context canceled

背景:
部署deployment服务之后,pod拉起失败, describe 显示code = Canceled desc = context canceled
分析:
1.查看harbor,排除网络问题
2.服务器上可以 docker pull ,排除image问题
3.查看pull image policy 为 IfNotPresent 排除镜像策略问题
4.查看 pod日志,code = Canceled ,表示pull 这个动作被取消,由于手动没法停止 kubelet pull image的操作,只能是服务端发起的
参考资料
1.于是查看了kubelet的官方文档,发现了问题所在
https://kubernetes.io/docs/reference/command-line-tools-reference/kubelet/
官方默认pull的超时时间是1m。由参数–image-pull-progress-deadline 控制
在这里插入图片描述
2.对应地到GitHub上也看到了类似的issues
https://github.com/kubernetes/kubernetes/issues/59376
https://github.com/Azure/AKS/issues/245
https://github.com/openshift/origin/issues/13122
kubelet源码
https://github.com/kubernetes/kubernetes/blob/5e442a3f61e1e1eb67323183cfba6540c02a4a54/pkg/kubelet/kubelet.go#L276
kubernetes: Failed to pull image...rpc error: code = Canceled desc = context canceled_第1张图片
问题基本上已经能确认,是由于 镜像过大,下载超时,引起服务端canceled
具体解决办法
1./etc/default/kubelet 中添加KUBELET_OPTS=–image-pull-progress-deadline=60m
有的环境可能在/etc/sysconfig/kubelet 配置文件
2 . systemctl restart kubelet

你可能感兴趣的:(kubernetes)