K8S集群内部Service无法curl的bug处理方法(设置ipvs和关闭flannel的Checksum校验)

根据创建集群内部可访问的Service创建了集群内service,发现可以ping通service的ip:port但curl超时。

参照k8s集群ClusterIP不能使用一开始就设置了ipvs,不知道为何没有生效。

1.修改模式为ipvs

kubectl get pods -n kube-system
kubectl logs -n kube-system kube-proxy-****
'''
Flag proxy-mode="" unknown, assuming iptables proxy
Using iptables Proxier.
'''
#发现mode:'',按i编辑成mode: "ipvs",esc+:wq退出
kubectl edit cm kube-proxy -n kube-system

#删除 kube-proxy的pod让其重新生成
kubectl get pods -n kube-system |grep kube-proxy|awk '{print $1}'| xargs kubectl delete pod  -n kube-system

kubectl get pods -n kube-system
kubectl logs -n kube-system kube-proxy-****
''' log出现Using ipvs Proxier.可以看到使用了ipvs'''

kubectl delete -f pod-nginx.yaml
kubectl apply -f pod-nginx.yaml
#发现依旧可以ping通service的ip:port但curl超时,原因是flannel虚拟网卡会开启了Checksum校验

参考Kubernetes K8S在IPVS代理模式下Service服务的ClusterIP类型访问失败处理,原理完全不懂

2.临时关闭flannel虚拟网卡Checksum校验,此步操作后可以curl

ethtool -k flannel.1 | grep checksum
'''
rx-checksumming: on
tx-checksumming: on     ##### 当前为 on
	tx-checksum-ipv4: off [fixed]
	tx-checksum-ip-generic: on    ##### 当前为 on
	tx-checksum-ipv6: off [fixed]
	tx-checksum-fcoe-crc: off [fixed]
	tx-checksum-sctp: off [fixed]
'''
#flannel的网络设置将发送端的checksum打开了,而实际应该关闭,从而让物理网卡校验。操作如下:
# 临时关闭操作
ethtool -K flannel.1 tx-checksum-ip-generic off  

3.永久关闭flannel虚拟网卡Checksum校验

#使用以下代码创建服务
cat >/etc/systemd/system/k8s-flannel-tx-checksum-off.service <<EOF
[Unit]
Description=Turn off checksum offload on flannel.1
After=sys-devices-virtual-net-flannel.1.device

[Install]
WantedBy=sys-devices-virtual-net-flannel.1.device

[Service]
Type=oneshot
ExecStart=/sbin/ethtool -K flannel.1 tx-checksum-ip-generic off
EOF

#开机自启动,并启动服务
systemctl enable k8s-flannel-tx-checksum-off
systemctl start  k8s-flannel-tx-checksum-off

本文转载来自:集群内部Service无法curl的bug(设置ipvs和关闭flannel的Checksum校验)

你可能感兴趣的:(linux,kubernetes,bug,容器)