nickDaDa

Ubuntu部署Kubernetes集群及问题解决

总计五部分：

master节点部署；
node节点部署并加入master；
管理工具部署；
问题解决；
常用命令

master节点：

1 . 关闭防火墙

主要是防止master和node之间、master和客户端之间通信阻止。

// 关闭防火墙
sudo ufw disable

2 . 关闭swap并重新加载配置

因为k8s调度需要计算机器容量，因此关闭交换内存，减少计算误差，另外，启动kubelet时如果未关闭，也会报错。

sudo swapoff -a
sudo sysctl -p
sudo sysctl --system

修改fstab，防止机器重启又自动打开swap，导致无法重新加入集群

vim /etc/fstab

注释掉swap盘挂载的一行，保存退出。

注：因为Ubuntu默认selinux关闭，因此不需要再关闭一次。

这种关闭swap的方式是临时的，重启机器就会失效。

3 . 设置机器名称

用于在集群中显示，以便分辨机器

sudo hostnamectl set-hostname 主机名

4 . 安装kubeadm、kubectl、kubelet

apt-get update

# add aliyun resource
curl -s https://mirrors.aliyun.com/kubernetes/apt/doc/apt-key.gpg| apt-key add -

cat </etc/apt/sources.list.d/kubernetes.list
deb https://mirrors.aliyun.com/kubernetes/apt/ kubernetes-xenial main 
EOF

apt-get update

更新资源库之后就可以直接安装了，但是默认安装的是最新版本，如果需要安装指定版本的（例如只有1.15.0的整套镜像，就需要选择安装对应1.15.0的客户端）。

# default install latest version
apt-get install -y kubelet kubeadm kubectl

NOTICE:
# list available version
apt-cache madison kubectl
apt-cache madison kubeadm
apt-cache madison kubelet

# spec version to install
apt-get install -y kubelet= kubeadm kubectl=

5 . 安装docker

安装方式参考：https://blog.csdn.net/nickDaDa/article/details/92816938

墙裂建议：修改docker的默认存储位置（具体方式参考上链接），以防以后空间不足报，因为k8s是依赖docker创建容器的，以后pods创建数量过大会直接导致硬盘不足，整个集群面临瘫痪的风险，而且遇到问题之后再修改docker存储，会导致已有的镜像、容器丢失，如果是主节点，可能就要重新部署集群了。

如果需要让非root用户可使用docker命令，则参考一下两步；如果本身就是root用户，则不需要。

sudo groupadd docker
sudo usermod -aG docker $USER

把docker加到系统服务中。

# add docker into system service
systemctl enable docker

6 . 拉取镜像

将一下内容保存为download.sh，上传到master/node机器上，执行 sudo chmod ugo+x ./download.sh赋予权限。

直接执行./download.sh即可。

注意：镜像版本需要和kubectl客户端一致，如果不知道，执行kubectl version查看client部分即可。由于当前的kubectl的版本是1.15，所以镜像选的是1.15版本。

#!/bin/bash
images=(kube-proxy:v1.15.0 kube-scheduler:v1.15.0 kube-controller-manager:v1.15.0 kube-apiserver:v1.15.0 etcd:3.3.10 coredns:1.3.1 pause:3.1 )
for imageName in ${images[@]} ; do
docker pull registry.aliyuncs.com/google_containers/$imageName
docker tag  registry.aliyuncs.com/google_containers/$imageName k8s.gcr.io/$imageName
docker rmi  registry.aliyuncs.com/google_containers/$imageName
done

如果下载不下来，可以到我的网盘拉取(1.15.0版本)：

链接：https://pan.baidu.com/s/1yNVKz3G4kaJ6XzMydLQULg 
提取码：nlym

7 . 初始化master节点

初始化的过程中会用到上一步下载好的镜像。

使用默认网卡监听apiserver：

kubeadm init --kubernetes-version=v1.15.0 --pod-network-cidr=10.244.0.0/16

或者指定网卡监听apiserver（参考troubleShooting 9）：

kubeadm init --kubernetes-version=v1.15.0 --pod-network-cidr=10.244.0.0/16 --apiserver-advertise-address=192.168.1.1 --apiserver-bind-port=6443

返回成功后，执行以下操作（和返回的信息一致），如果跳过可能导致下一步创建flannel pod证书不受信。

mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config

此时获取node状态，会是NotReady，describe node会发现，是因为网络配置未完成。

8 . master初始化完成之后，创建网络层pod

kubectl apply -f https://raw.githubusercontent.com/coreos/flannel/master/Documentation/kube-flannel.yml

如果不可下载，则复制以下脚本来创建。

---
apiVersion: policy/v1beta1
kind: PodSecurityPolicy
metadata:
  name: psp.flannel.unprivileged
  annotations:
    seccomp.security.alpha.kubernetes.io/allowedProfileNames: docker/default
    seccomp.security.alpha.kubernetes.io/defaultProfileName: docker/default
    apparmor.security.beta.kubernetes.io/allowedProfileNames: runtime/default
    apparmor.security.beta.kubernetes.io/defaultProfileName: runtime/default
spec:
  privileged: false
  volumes:
    - configMap
    - secret
    - emptyDir
    - hostPath
  allowedHostPaths:
    - pathPrefix: "/etc/cni/net.d"
    - pathPrefix: "/etc/kube-flannel"
    - pathPrefix: "/run/flannel"
  readOnlyRootFilesystem: false
  # Users and groups
  runAsUser:
    rule: RunAsAny
  supplementalGroups:
    rule: RunAsAny
  fsGroup:
    rule: RunAsAny
  # Privilege Escalation
  allowPrivilegeEscalation: false
  defaultAllowPrivilegeEscalation: false
  # Capabilities
  allowedCapabilities: ['NET_ADMIN']
  defaultAddCapabilities: []
  requiredDropCapabilities: []
  # Host namespaces
  hostPID: false
  hostIPC: false
  hostNetwork: true
  hostPorts:
  - min: 0
    max: 65535
  # SELinux
  seLinux:
    # SELinux is unsed in CaaSP
    rule: 'RunAsAny'
---
kind: ClusterRole
apiVersion: rbac.authorization.k8s.io/v1beta1
metadata:
  name: flannel
rules:
  - apiGroups: ['extensions']
    resources: ['podsecuritypolicies']
    verbs: ['use']
    resourceNames: ['psp.flannel.unprivileged']
  - apiGroups:
      - ""
    resources:
      - pods
    verbs:
      - get
  - apiGroups:
      - ""
    resources:
      - nodes
    verbs:
      - list
      - watch
  - apiGroups:
      - ""
    resources:
      - nodes/status
    verbs:
      - patch
---
kind: ClusterRoleBinding
apiVersion: rbac.authorization.k8s.io/v1beta1
metadata:
  name: flannel
roleRef:
  apiGroup: rbac.authorization.k8s.io
  kind: ClusterRole
  name: flannel
subjects:
- kind: ServiceAccount
  name: flannel
  namespace: kube-system
---
apiVersion: v1
kind: ServiceAccount
metadata:
  name: flannel
  namespace: kube-system
---
kind: ConfigMap
apiVersion: v1
metadata:
  name: kube-flannel-cfg
  namespace: kube-system
  labels:
    tier: node
    app: flannel
data:
  cni-conf.json: |
    {
      "name": "cbr0",
      "plugins": [
        {
          "type": "flannel",
          "delegate": {
            "hairpinMode": true,
            "isDefaultGateway": true
          }
        },
        {
          "type": "portmap",
          "capabilities": {
            "portMappings": true
          }
        }
      ]
    }
  net-conf.json: |
    {
      "Network": "10.244.0.0/16",
      "Backend": {
        "Type": "vxlan"
      }
    }
---
apiVersion: apps/v1
kind: DaemonSet
metadata:
  name: kube-flannel-ds-amd64
  namespace: kube-system
  labels:
    tier: node
    app: flannel
spec:
  selector:
    matchLabels:
      app: flannel
  template:
    metadata:
      labels:
        tier: node
        app: flannel
    spec:
      hostNetwork: true
      nodeSelector:
        beta.kubernetes.io/arch: amd64
      tolerations:
      - operator: Exists
        effect: NoSchedule
      serviceAccountName: flannel
      initContainers:
      - name: install-cni
        image: quay.io/coreos/flannel:v0.11.0-amd64
        command:
        - cp
        args:
        - -f
        - /etc/kube-flannel/cni-conf.json
        - /etc/cni/net.d/10-flannel.conflist
        volumeMounts:
        - name: cni
          mountPath: /etc/cni/net.d
        - name: flannel-cfg
          mountPath: /etc/kube-flannel/
      containers:
      - name: kube-flannel
        image: quay.io/coreos/flannel:v0.11.0-amd64
        command:
        - /opt/bin/flanneld
        args:
        - --ip-masq
        - --kube-subnet-mgr
        resources:
          requests:
            cpu: "100m"
            memory: "50Mi"
          limits:
            cpu: "100m"
            memory: "50Mi"
        securityContext:
          privileged: false
          capabilities:
             add: ["NET_ADMIN"]
        env:
        - name: POD_NAME
          valueFrom:
            fieldRef:
              fieldPath: metadata.name
        - name: POD_NAMESPACE
          valueFrom:
            fieldRef:
              fieldPath: metadata.namespace
        volumeMounts:
        - name: run
          mountPath: /run/flannel
        - name: flannel-cfg
          mountPath: /etc/kube-flannel/
      volumes:
        - name: run
          hostPath:
            path: /run/flannel
        - name: cni
          hostPath:
            path: /etc/cni/net.d
        - name: flannel-cfg
          configMap:
            name: kube-flannel-cfg
---
apiVersion: apps/v1
kind: DaemonSet
metadata:
  name: kube-flannel-ds-arm64
  namespace: kube-system
  labels:
    tier: node
    app: flannel
spec:
  selector:
    matchLabels:
      app: flannel
  template:
    metadata:
      labels:
        tier: node
        app: flannel
    spec:
      hostNetwork: true
      nodeSelector:
        beta.kubernetes.io/arch: arm64
      tolerations:
      - operator: Exists
        effect: NoSchedule
      serviceAccountName: flannel
      initContainers:
      - name: install-cni
        image: quay.io/coreos/flannel:v0.11.0-arm64
        command:
        - cp
        args:
        - -f
        - /etc/kube-flannel/cni-conf.json
        - /etc/cni/net.d/10-flannel.conflist
        volumeMounts:
        - name: cni
          mountPath: /etc/cni/net.d
        - name: flannel-cfg
          mountPath: /etc/kube-flannel/
      containers:
      - name: kube-flannel
        image: quay.io/coreos/flannel:v0.11.0-arm64
        command:
        - /opt/bin/flanneld
        args:
        - --ip-masq
        - --kube-subnet-mgr
        resources:
          requests:
            cpu: "100m"
            memory: "50Mi"
          limits:
            cpu: "100m"
            memory: "50Mi"
        securityContext:
          privileged: false
          capabilities:
             add: ["NET_ADMIN"]
        env:
        - name: POD_NAME
          valueFrom:
            fieldRef:
              fieldPath: metadata.name
        - name: POD_NAMESPACE
          valueFrom:
            fieldRef:
              fieldPath: metadata.namespace
        volumeMounts:
        - name: run
          mountPath: /run/flannel
        - name: flannel-cfg
          mountPath: /etc/kube-flannel/
      volumes:
        - name: run
          hostPath:
            path: /run/flannel
        - name: cni
          hostPath:
            path: /etc/cni/net.d
        - name: flannel-cfg
          configMap:
            name: kube-flannel-cfg
---
apiVersion: apps/v1
kind: DaemonSet
metadata:
  name: kube-flannel-ds-arm
  namespace: kube-system
  labels:
    tier: node
    app: flannel
spec:
  selector:
    matchLabels:
      app: flannel
  template:
    metadata:
      labels:
        tier: node
        app: flannel
    spec:
      hostNetwork: true
      nodeSelector:
        beta.kubernetes.io/arch: arm
      tolerations:
      - operator: Exists
        effect: NoSchedule
      serviceAccountName: flannel
      initContainers:
      - name: install-cni
        image: quay.io/coreos/flannel:v0.11.0-arm
        command:
        - cp
        args:
        - -f
        - /etc/kube-flannel/cni-conf.json
        - /etc/cni/net.d/10-flannel.conflist
        volumeMounts:
        - name: cni
          mountPath: /etc/cni/net.d
        - name: flannel-cfg
          mountPath: /etc/kube-flannel/
      containers:
      - name: kube-flannel
        image: quay.io/coreos/flannel:v0.11.0-arm
        command:
        - /opt/bin/flanneld
        args:
        - --ip-masq
        - --kube-subnet-mgr
        resources:
          requests:
            cpu: "100m"
            memory: "50Mi"
          limits:
            cpu: "100m"
            memory: "50Mi"
        securityContext:
          privileged: false
          capabilities:
             add: ["NET_ADMIN"]
        env:
        - name: POD_NAME
          valueFrom:
            fieldRef:
              fieldPath: metadata.name
        - name: POD_NAMESPACE
          valueFrom:
            fieldRef:
              fieldPath: metadata.namespace
        volumeMounts:
        - name: run
          mountPath: /run/flannel
        - name: flannel-cfg
          mountPath: /etc/kube-flannel/
      volumes:
        - name: run
          hostPath:
            path: /run/flannel
        - name: cni
          hostPath:
            path: /etc/cni/net.d
        - name: flannel-cfg
          configMap:
            name: kube-flannel-cfg
---
apiVersion: apps/v1
kind: DaemonSet
metadata:
  name: kube-flannel-ds-ppc64le
  namespace: kube-system
  labels:
    tier: node
    app: flannel
spec:
  selector:
    matchLabels:
      app: flannel
  template:
    metadata:
      labels:
        tier: node
        app: flannel
    spec:
      hostNetwork: true
      nodeSelector:
        beta.kubernetes.io/arch: ppc64le
      tolerations:
      - operator: Exists
        effect: NoSchedule
      serviceAccountName: flannel
      initContainers:
      - name: install-cni
        image: quay.io/coreos/flannel:v0.11.0-ppc64le
        command:
        - cp
        args:
        - -f
        - /etc/kube-flannel/cni-conf.json
        - /etc/cni/net.d/10-flannel.conflist
        volumeMounts:
        - name: cni
          mountPath: /etc/cni/net.d
        - name: flannel-cfg
          mountPath: /etc/kube-flannel/
      containers:
      - name: kube-flannel
        image: quay.io/coreos/flannel:v0.11.0-ppc64le
        command:
        - /opt/bin/flanneld
        args:
        - --ip-masq
        - --kube-subnet-mgr
        resources:
          requests:
            cpu: "100m"
            memory: "50Mi"
          limits:
            cpu: "100m"
            memory: "50Mi"
        securityContext:
          privileged: false
          capabilities:
             add: ["NET_ADMIN"]
        env:
        - name: POD_NAME
          valueFrom:
            fieldRef:
              fieldPath: metadata.name
        - name: POD_NAMESPACE
          valueFrom:
            fieldRef:
              fieldPath: metadata.namespace
        volumeMounts:
        - name: run
          mountPath: /run/flannel
        - name: flannel-cfg
          mountPath: /etc/kube-flannel/
      volumes:
        - name: run
          hostPath:
            path: /run/flannel
        - name: cni
          hostPath:
            path: /etc/cni/net.d
        - name: flannel-cfg
          configMap:
            name: kube-flannel-cfg
---
apiVersion: apps/v1
kind: DaemonSet
metadata:
  name: kube-flannel-ds-s390x
  namespace: kube-system
  labels:
    tier: node
    app: flannel
spec:
  selector:
    matchLabels:
      app: flannel
  template:
    metadata:
      labels:
        tier: node
        app: flannel
    spec:
      hostNetwork: true
      nodeSelector:
        beta.kubernetes.io/arch: s390x
      tolerations:
      - operator: Exists
        effect: NoSchedule
      serviceAccountName: flannel
      initContainers:
      - name: install-cni
        image: quay.io/coreos/flannel:v0.11.0-s390x
        command:
        - cp
        args:
        - -f
        - /etc/kube-flannel/cni-conf.json
        - /etc/cni/net.d/10-flannel.conflist
        volumeMounts:
        - name: cni
          mountPath: /etc/cni/net.d
        - name: flannel-cfg
          mountPath: /etc/kube-flannel/
      containers:
      - name: kube-flannel
        image: quay.io/coreos/flannel:v0.11.0-s390x
        command:
        - /opt/bin/flanneld
        args:
        - --ip-masq
        - --kube-subnet-mgr
        resources:
          requests:
            cpu: "100m"
            memory: "50Mi"
          limits:
            cpu: "100m"
            memory: "50Mi"
        securityContext:
          privileged: false
          capabilities:
             add: ["NET_ADMIN"]
        env:
        - name: POD_NAME
          valueFrom:
            fieldRef:
              fieldPath: metadata.name
        - name: POD_NAMESPACE
          valueFrom:
            fieldRef:
              fieldPath: metadata.namespace
        volumeMounts:
        - name: run
          mountPath: /run/flannel
        - name: flannel-cfg
          mountPath: /etc/kube-flannel/
      volumes:
        - name: run
          hostPath:
            path: /run/flannel
        - name: cni
          hostPath:
            path: /etc/cni/net.d
        - name: flannel-cfg
          configMap:
            name: kube-flannel-cfg

文件虽大，但是不难看出它的组成是由一些角色创建、绑定、安全策略以及daemonSet模块组成，我们只需要关注DeamonSet部分，具体支持了amd64、arm64、arm、ppc64le、s390x，架构CPU，如果可以确定集群机器CPU架构，可以选择性删除一些不需要的支持。

9 . master上的kubelet加到系统服务，在kubeadm init之后，此服务状态才会是Active

systemctl enable kubelet

node节点：

1 . 关闭防火墙

// 关闭防火墙
sudo ufw disable

2 . 关闭swap并重新加载配置

sudo swapoff -a
sudo sysctl -p
sudo sysctl --system

3 . 设置机器名称，用于在集群中显示，以便分辨机器

sudo hostnamectl set-hostname 主机名

4 . 安装kubeadm、kubectl、kubelet

apt-get update

# add aliyun resource
curl -s https://mirrors.aliyun.com/kubernetes/apt/doc/apt-key.gpg| apt-key add -

cat </etc/apt/sources.list.d/kubernetes.list
deb https://mirrors.aliyun.com/kubernetes/apt/ kubernetes-xenial main 
EOF

apt-get update

在安装kubelet、kubeadm、kubectl之前，最好先确认master上其它node的version，

安装对应版本的肯定不会错，如果使用默认命令安装，则会安装最新版本，如果不一致可能导致加入失败。

查询已有哪些版本可以安装：

apt-cache madison kubectl

指定版本安装命令：

apt-get install kubelet=1.14.2-00

apt-get install kubeadm=1.14.2-00

apt-get install kubectl=1.14.2-00

安装最新版本命令：

# default is latest version
apt-get install -y kubelet kubeadm kubectl

5 . 安装docker

安装方式参考：https://blog.csdn.net/nickDaDa/article/details/92816938

如果需要让非root用户可使用docker命令，如果本来就是root，则不需要执行。

sudo groupadd docker
sudo usermod -aG docker $USER

# add docker into system service
systemctl enable docker

6 . 拉取镜像

将一下内容保存为download.sh，上传到master/node机器上，执行 sudo chmod ugo+x ./download.sh赋予权限。

直接执行./download.sh即可。

注意：镜像版本需要和kubectl客户端一致，如果不知道，执行kubectl version查看client部分即可。

#!/bin/bash
images=(kube-proxy:v1.15.0 kube-scheduler:v1.15.0 kube-controller-manager:v1.15.0 kube-apiserver:v1.15.0 etcd:3.3.10 coredns:1.3.1 pause:3.1 )
for imageName in ${images[@]} ; do
docker pull registry.aliyuncs.com/google_containers/$imageName
docker tag  registry.aliyuncs.com/google_containers/$imageName k8s.gcr.io/$imageName
docker rmi  registry.aliyuncs.com/google_containers/$imageName
done

7 . node 部分创建并加入集群

执行格式是由创建master成功后返回的。

kubeadm join 116.xxx.xx.xx:6443 --token wc52ln.zxwjd0qvb5nivh1y \
    --discovery-token-ca-cert-hash sha256:c87435f9d3f44ffd1ff013a4c8bd865f146370f518d98095c7690a744bb62d30

如果已经找不到：

kubeadm token list

可以返回token值

如果已经失效（默认24小时就消失了），则在master上创建一个新的：

kubeadm token create

然后再执行 token list即可。

查询哈希值，在master上执行：

openssl x509 -pubkey -in /etc/kubernetes/pki/ca.crt | openssl rsa -pubin -outform der 2>/dev/null | openssl dgst -sha256 -hex | sed 's/^.* //'

可以返回哈希值，两部分拼到一起即可。

8 . 将kubelet加到系统服务

systemctl enable kubelet

dashBoard安装：

dashboard是依托于k8s环境的一个应用程序，需要部署好k8s集群才能安装。

1 . dashboard脚本

# Copyright 2017 The Kubernetes Authors.
#
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#     http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

# ------------------- Dashboard Secret ------------------- #

apiVersion: v1
kind: Secret
metadata:
  labels:
    k8s-app: kubernetes-dashboard
  name: kubernetes-dashboard-certs
  namespace: kube-system
type: Opaque

---
# ------------------- Dashboard Service Account ------------------- #

apiVersion: v1
kind: ServiceAccount
metadata:
  labels:
    k8s-app: kubernetes-dashboard
  name: kubernetes-dashboard
  namespace: kube-system

---
# ------------------- Dashboard Role & Role Binding ------------------- #

kind: Role
apiVersion: rbac.authorization.k8s.io/v1
metadata:
  name: kubernetes-dashboard-minimal
  namespace: kube-system
rules:
  # Allow Dashboard to create 'kubernetes-dashboard-key-holder' secret.
- apiGroups: [""]
  resources: ["secrets"]
  verbs: ["create"]
  # Allow Dashboard to create 'kubernetes-dashboard-settings' config map.
- apiGroups: [""]
  resources: ["configmaps"]
  verbs: ["create"]
  # Allow Dashboard to get, update and delete Dashboard exclusive secrets.
- apiGroups: [""]
  resources: ["secrets"]
  resourceNames: ["kubernetes-dashboard-key-holder", "kubernetes-dashboard-certs"]
  verbs: ["get", "update", "delete"]
  # Allow Dashboard to get and update 'kubernetes-dashboard-settings' config map.
- apiGroups: [""]
  resources: ["configmaps"]
  resourceNames: ["kubernetes-dashboard-settings"]
  verbs: ["get", "update"]
  # Allow Dashboard to get metrics from heapster.
- apiGroups: [""]
  resources: ["services"]
  resourceNames: ["heapster"]
  verbs: ["proxy"]
- apiGroups: [""]
  resources: ["services/proxy"]
  resourceNames: ["heapster", "http:heapster:", "https:heapster:"]
  verbs: ["get"]

---
apiVersion: rbac.authorization.k8s.io/v1
kind: RoleBinding
metadata:
  name: kubernetes-dashboard-minimal
  namespace: kube-system
roleRef:
  apiGroup: rbac.authorization.k8s.io
  kind: Role
  name: kubernetes-dashboard-minimal
subjects:
- kind: ServiceAccount
  name: kubernetes-dashboard
  namespace: kube-system

---
# ------------------- Dashboard Deployment ------------------- #

kind: Deployment
apiVersion: apps/v1
metadata:
  labels:
    k8s-app: kubernetes-dashboard
  name: kubernetes-dashboard
  namespace: kube-system
spec:
  replicas: 1
  revisionHistoryLimit: 10
  selector:
    matchLabels:
      k8s-app: kubernetes-dashboard
  template:
    metadata:
      labels:
        k8s-app: kubernetes-dashboard
    spec:
      nodeSelector:
        nodeType: master
      containers:
      - name: kubernetes-dashboard
        image: registry.cn-hangzhou.aliyuncs.com/google_containers/kubernetes-dashboard-amd64:v1.10.1
        env: 
          - name: ACCEPT_LANGUAGE
            value: english
        ports:
        - containerPort: 8443
          protocol: TCP
        args:
          - --auto-generate-certificates
          - --token-ttl=43200
          # Uncomment the following line to manually specify Kubernetes API server Host
          # If not specified, Dashboard will attempt to auto discover the API server and connect
          # to it. Uncomment only if the default does not work.
          # - --apiserver-host=http://my-address:port
        volumeMounts:
        - name: kubernetes-dashboard-certs
          mountPath: /certs
          # Create on-disk volume to store exec logs
        - mountPath: /tmp
          name: tmp-volume
        livenessProbe:
          httpGet:
            scheme: HTTPS
            path: /
            port: 8443
          initialDelaySeconds: 30
          timeoutSeconds: 30
      volumes:
      - name: kubernetes-dashboard-certs
        secret:
          secretName: kubernetes-dashboard-certs
      - name: tmp-volume
        emptyDir: {}
      serviceAccountName: kubernetes-dashboard
      # Comment the following tolerations if Dashboard must not be deployed on master
      tolerations:
      - key: node-role.kubernetes.io/master
        effect: NoSchedule

---
# ------------------- Dashboard Service ------------------- #

kind: Service
apiVersion: v1
metadata:
  labels:
    k8s-app: kubernetes-dashboard
  name: kubernetes-dashboard
  namespace: kube-system
spec:
  type: NodePort
  ports:
    - port: 443
      targetPort: 8443
  selector:
    k8s-app: kubernetes-dashboard

- --token-ttl=43200参数指定session超时时间，ACCEPT_LANGUAGE指定了语言，可以修改为chinese或者不写，默认跟随系统语言。由于使用了阿里上的镜像，因此不存在无法拉取镜像的问题（如果确实无法拉取镜像，则手动拉取一个其它版本的，然后修改yaml中的镜像名称即可），脚本中Deployment.spec.template.spec.nodeSelector指定了机器必须是有NodeType=master，因为本次部署是计划部署到master节点上，如果要调度到master上，则需要让master可以被调度，需要先执行：

# label master
kubectl label no masterNode  nodeType=master

# allow master schedule
kubectl taint node k8s-master node-role.kubernetes.io/master-

优化：上述脚本中，service的type是NodePort类型，也就是说指定了机器，并随机分配了一个端口。这样会导致如果删除掉再创建端口会发生变化（NotePort会随机分配一个30000以上的端口，如果手动指定会对k8s性能造成不必要的损失），因此service部分可以修改为：

kind: Service
apiVersion: v1
metadata:
  labels:
    k8s-app: kubernetes-dashboard
  name: kubernetes-dashboard
  namespace: kube-system
spec:
  type: LoadBalancer
  ports:
    - port: 443
      targetPort: 8443
  externalIPs: 
  - 集群中一台可用机器IP
  selector:
    k8s-app: kubernetes-dashboard

使用机器IP需要提前查询443是否没有被占用，执行：

sudo netstat -anp | grep 443

这样访问方式就是固定IP和port了，如果系统稳定则不需操作这一步。

2 . 创建角色

apiVersion: v1
kind: ServiceAccount
metadata:
  name: admin-user
  namespace: kube-system
 
---
apiVersion: rbac.authorization.k8s.io/v1beta1
kind: ClusterRoleBinding
metadata:
  name: admin-user
roleRef:
  apiGroup: rbac.authorization.k8s.io
  kind: ClusterRole
  name: cluster-admin
subjects:
- kind: ServiceAccount
  name: admin-user
  namespace: kube-system

3 . 查看刚创建的用户(admin-user)持有token

kubectl -n kube-system describe secret $(kubectl -n kube-system get secret | grep admin-user | awk '{print $1}')

4 . 访问

由于证书是自动生成的，建议使用Firefox，输入https://ip:port即可访问。如果是chrome，需要在chrome.exe的property中加入--ignore-certificate-errors，否则不能使用。

troubleShooting：

1 . node节点join之后一直NotReady

这种情况一般是因为node节点该启动的pod无法正常启动造成。处理思路为：先看node机器docker 容器是否正常，再看master节点上的node状态，再在master节点上describe node节点的pod的状态。

docker ps -a

在node机器上查看docker容器启动情况是否正常，一般会启动如图几个容器，如果正常，则进行下一步。

kubectl describe no 节点名称

执行命令查看是否有异常，如果不能解决则进行下一步。

kubectl get po -namespace kube-system -o wide | grep nodeName

kubectl describe -n kube-system 上一步查到的有问题的POD

执行命令，查看失败节点的pods状态，一般是因为镜像拉取失败，如果是镜像拉取不到，可以找到一台机器有对应镜像的，执行

docker save img -o ./xxx.tar

将对应镜像打成tar包，名称无所谓，还原成镜像后，名称会恢复，执行

scp ./xxx.tar user@ip:/path

将tar包传输到失败节点机器上，执行

docker load < ./xxx.tar

即可导出镜像。

或者，镜像都ok，可以查看一下docker依赖的环境是否ok，最近遇到一个情况就是node节点的/run目录占用满了，不能再跑container了，手动清理一下即可，然后在node机器上run一个镜像试试，能成功跑容器，即视为修改完成。

解决问题之后，在node节点上执行

kubeadm reset

kubeadm reset && systemctl stop kubelet && systemctl stop docker && rm -rf /var/lib/cni/ && rm -rf /var/lib/kubelet/* && rm -rf /etc/cni/ && ifconfig cni0 down && ifconfig flannel.1 down && ifconfig docker0 down && ip link delete cni0 && ip link delete flannel.1 && systemctl start docker

还原node节点，如果需要可以删除配置文件，最后再join即可。

注意：kubeadm reset之后并不会删除配置文件、文件及、镜像。

The reset process does not reset or clean up iptables rules or IPVS tables.
If you wish to reset iptables, you must do so manually.
For example:
iptables -F && iptables -t nat -F && iptables -t mangle -F && iptables -X

If your cluster was setup to utilize IPVS, run ipvsadm --clear (or similar)
to reset your system's IPVS tables.

The reset process does not clean your kubeconfig files and you must remove them manually.
Please, check the contents of the $HOME/.kube/config file.

2 . master节点NotReady

kubectl describe no masterName

kubectl describe no -A | grep masterName

查看node和pods状态即可，多情况下是flannel镜像丢失和配置文件已存在，根据提示处理即可。

3 . node节点从master中删除，再加入报错"cni0" already has an IP address different from ，网络创建错误。

由于上一次删除node，没有清空网络配置，再次加入网络无法创建，删除并重新加入即可。

亲测可用：

kubeadm reset

apt install ipvsadm
ipvsadm --clear

iptables -F && iptables -t nat -F && iptables -t mangle -F && iptables -X

kubeadm join xxx.xxx.xx.xx:6443 --token tieqto.41ip1n2v018nku1n \
    --discovery-token-ca-cert-hash sha256:912af6962629722e3e4cce88db150789d096747c99641b308c6f30759c7fa1ee

网上其它方法：

kubeadm reset
systemctl stop kubelet
systemctl stop docker
rm -rf /var/lib/cni/
rm -rf /var/lib/kubelet/*
rm -rf /etc/cni/
ifconfig cni0 down
ifconfig flannel.1 down
ifconfig docker0 down
ip link delete cni0
ip link delete flannel.1
systemctl start docker

4 . Error from server: error dialing backend: dial tcp 10.x.xx.xx:10250: i/o timeout

在master节点上执行 kubectl logs xxx 或 kubectl exec -it xxx 等操作，不能连接到node节点，一直报超时。可以尝试ping 上述ip地址，发现不通，因为master节点默认使用了node节点的eth0网卡，但是eth0网卡的inet addr是不通的。可能是由于此内网地址没有加到交换机。

/var/lib/kubelet/config.yaml中指定了对端端口10250，可以查看。

解决方式：在node机器上查看ifconfig找一个网卡可以访问的地址，例如：192.168.x.x，执行kubelet --address 192.168.x.x。成功之后基本就可以了。（参考：https://kubernetes.io/docs/reference/command-line-tools-reference/kubelet/）

解析：以面向对象的思想，应该能想到，master上执行命令，实际执行者还是node节点上的kubelet.exe，它默认绑定的IP地址是0.0.0.0，也就选取了eth0的内网地址，当这个内网地址不可用时，就不能执行了。因此，切换成一个可用的网卡内网地址，能保证两台机器连通即可。

5 . master和nodes，不在同一网段，无法通信。

flannel默认使用机器的默认网卡，如果master节点和nodes的默认网卡不在同一网段，则会不通。

需要手动指定，一下以amd64为例，其它类型同理（https://github.com/coreos/flannel/blob/master/Documentation/configuration.md）：

第一种：指定网卡：

containers:
      - name: kube-flannel
        image: quay.io/coreos/flannel:v0.11.0-amd64
        command:
        - /opt/bin/flanneld
        args:
        - --ip-masq
        - --kube-subnet-mgr
        - --iface=eth2 #在这添加

第二种：指定网段：

containers:
      - name: kube-flannel
        image: quay.io/coreos/flannel:v0.11.0-amd64
        command:
        - /opt/bin/flanneld
        args:
        - --ip-masq
        - --kube-subnet-mgr
        - --iface-regex=192\.168\.1\.*  #在这改

如果master和所有node的同名网卡都在同一网段，且能ping通，则可以使用第一种；如果能通的网卡名称不一致，无规则，则使用第二种。

6 . 修改nodeIP（https://networkinferno.net/trouble-with-the-kubernetes-node-ip）

sudo vi /etc/systemd/system/kubelet.service.d/10-kubeadm.conf



========================
# Note: This dropin only works with kubeadm and kubelet v1.11+
[Service]
Environment="KUBELET_KUBECONFIG_ARGS=--bootstrap-kubeconfig=/etc/kubernetes/bootstrap-kubelet.conf --kubeconfig=/etc/kubernetes/kubelet.conf"
Environment="KUBELET_CONFIG_ARGS=--config=/var/lib/kubelet/config.="yaml""
# This is a file that "kubeadm init" and "kubeadm join" generates at runtime, populating the KUBELET_KUBEADM_ARGS variable dynamically
EnvironmentFile=-/var/lib/kubelet/kubeadm-flags.env
# This is a file that the user can use for overrides of the kubelet args as a last resort. Preferably, the user should use
# the .NodeRegistration.KubeletExtraArgs object in the configuration files instead. KUBELET_EXTRA_ARGS should be sourced from this file.
EnvironmentFile=-/etc/default/kubelet
ExecStart=
ExecStart=/usr/bin/kubelet $KUBELET_KUBECONFIG_ARGS $KUBELET_CONFIG_ARGS $KUBELET_KUBEADM_ARGS $KUBELET_EXTRA_ARGS --cloud-provider=vsphere --cloud-config=/etc/vsphereconf/vsphere.conf --node-ip 你的IP地址

在ExecStart中加入node-ip指令，即可指定nodeIp（当前机器的集群内标识）。

保存后需要重新加载系统配置，并重启kubelet服务。

sudo systemctl daemon-reload && sudo systemctl restart kubelet

注意：如果是node节点，还没join成功就启动kubelet（systemctl start kubelet.service / systemctl restart kubelet.service），会启动失败，报找不到配置文件

failed to load Kubelet config file /var/lib/kubelet/config.yaml, error failed to read kubelet config file “/var/lib/kubelet/config.yaml”, error: open /var/lib/kubelet/config.yaml: no such file or directory

这些配置项会在join完成之后自动生成。

7 . kubelet/kubeadm/....服务启动、重启...失败

# view kubelet logs
journalctl --system | grep kubelet

journalctl --system | grep kubelet | tail -f

通过查看日志，查看失败原因。

8 . node节点join时，kubelet总是报错，类似服务健康状态不正确或者服务未启动之类

kubelet是在join时自动启动的，对应的配置文件也会生成，此处报错一般是因为对应容器无法创建，因为docker有问题，例如磁盘满了之类的，需要在node上创建成功后才视为没问题

9 . node节点统统挂掉

通过dashboard查看，发现所有node节点都挂掉，在任意一台node机器上查看kubelet日志，发现是因为无法访问到master的api，ping之后发现是因为丢包率过高。因此尽量使用内网地址进行通信。

kubeadm init 会使用默认网卡，通过执行 ip route可以查看默认网卡。

via 的网卡就是默认网卡。

如果默认网卡是公网的，可以使用 kubeadm init --help查看，使用如下参数

--apiserver-advertise-address string   The IP address the API Server will advertise it's listening on. If not set the default network interface will be used.
      --apiserver-bind-port int32            Port for the API Server to bind to. (default 6443)

跟上内网地址，即可为apiserver指定监听ip和port，node节点join的地址就是内网ip地址，即可规避node节点必须使用公网地址加入集群的问题。

10 . node节点机器重启，不能自动加回集群

机器由于加挂载硬盘或者加内存，需要重启，但是重启之后node状态一直是notReady。在master节点执行describe node节点发现没有发送心跳，再到node节点上执行docker ps -a 发现依赖的容器没有启动，正常来说机器在重启之后，启动了kubelet就可以自动拉起来相关容器，因此推断kubelet启动不成功。查看kubelet日志，定位到是因为swap没关，部署集群的时候是临时关闭的，重启后又自动打开了，手动关闭后，node节点自动加回集群成功。

11 . master节点报DiskPressure

因为没有改dockerd的data-root，导致所有的镜像、容器、挂载、日志，都会输出到/var/lib/docker/。kubelet是和docker通信的而它的默认路径是/var/lib/kubelet。但是“/”目录往往不是最大的硬盘。解决思路是，先看根目录“/”下的大文件，大文件的生产者是哪个进程，为什么要输出这么多。一般是因为没有把容器对应的输出目录挂载到/data下。如果确实要生成大量的数据文件，建议修改docker的data-root（修改方式参考https://blog.csdn.net/nickDaDa/article/details/92816938），或者修改kubelet的输出目录（启动时使用--root-dir string Directory path for managing kubelet files (volume mounts,etc). (default "/var/lib/kubelet")）。

12 .创建pod一直报Failed create pod sandbox: rpc error: code = Unknown desc

遇到过几次，一般是因为docker服务有问题，导致node无法创建pod。可以查看一下/lib/systemd/system/docker.service是否正常，是否有人修改了启动参数之类的操作。

常用命令：

#获取pod运行在哪个节点上的信息。

kubectl get po -o wide

#获取集群中有多少节点

kubectl get nodes

#创建token（24小时过期）

kubeadm token create

#生成一条永久有效的token

kubeadm token create --ttl 0

#查看token列表

kubeadm token list

#获取ca证书sha256编码hash值

openssl x509 -pubkey -in /etc/kubernetes/pki/ca.crt | openssl rsa -pubin -outform der 2>/dev/null | openssl dgst -sha256 -hex | sed 's/^.* //'

#在node节点上执行：node节点加入

kubeadm join 192.168.x.xxx:6443 --token q6y34p.5xg6gaxwucl22ff5 --discovery-token-ca-cert-hash sha256:22367e3046478dd8ba0df256ac2af83e156b45731f2f769a6aea4671bad1d5cc

#移除node

kubectl drain ubuntu-pub02 --delete-local-data --force --ignore-daemonsets
kubectl delete node ubuntu-pub02

你可能感兴趣的:(kubernetes)

云原生灰度方案对比：服务网格灰度（Istio ）与 K8s Ingress 灰度（Nginx Ingress ）大手你不懂微服务-云原生 Java Java项目实战云原生 istio kubernetes 微服务
服务网格灰度与KubernetesIngress灰度是云原生环境下两种主流的灰度发布方案，它们在架构定位、实现方式和适用场景上存在显著差异。以下从多个维度对比分析，并给出选型建议：一、核心区别对比维度服务网格灰度（以Istio为例）K8sIngress灰度（以NginxIngress为例）架构层级网络层（L7），工作在服务间通信层面边缘网关层，工作在集群入口处流量控制范围服务间的全链路流量集群外部
如何设计一个高并发系统？从哪些方面考虑？真IT布道者架构性能优化分布式
核心观点：高并发系统设计需要从架构分层、资源扩展、性能优化、容错机制四个维度综合考量，通过分布式架构和异步化等手段实现系统弹性。一、架构分层设计1.分层解耦接入层：使用Nginx/LVS实现负载均衡，采用DNS轮询或Anycast进行流量分发服务层：微服务架构（如SpringCloud或Kubernetes），服务按功能垂直拆分数据层：读写分离（MySQL主从）+分库分表（ShardingSphe
Alluxio EnterpriseAI on K8s 部署教程 Alluxio kubernetes 容器云原生
AlluxioEnterpriseAIonK8s部署视频教程视频为AlluxioEnterpriseAIonK8s部署视频教程。下面内容将主要介绍如何通过Operator（Kubernetes管理应用程序的扩展）在Kubernetes上安装Alluxio。1.系统要求Kubernetes至少1.19版本的Kubernetes集群，支持特性门控确保集群的Kubernetes网络策略允许应用程序（Al
科伦坡证券交易所（CSE）定制的全栈系统开发报告 Ashlee_guweng22346 python java perl docker 数据结构 emacs 算法
“全自动化交易平台”（CSE主席瓦吉拉·库拉提拉卡评价）的进化——订单处理延迟1Tbps）。容器化微服务：iSulad轻量容器引擎（内存开销6MB）实现Kubernetes秒级扩容，资源利用率提升70%，故障切换时间10ms，错失套利窗口。方案：鲲鹏低延迟引擎+InfiniBand网络。结果：时延降至0.5ms，套利收益年化提升22%。
Spring Cloud 微服务架构部署模式 Java技术栈实战架构 spring cloud 微服务 ai
SpringCloud微服务架构部署模式：从单体到云原生的进化路径关键词：SpringCloud、微服务架构、部署模式、容器化、Kubernetes、服务网格、DevOps摘要：本文系统解析SpringCloud微服务架构的核心部署模式，涵盖传统物理机部署、容器化部署、Kubernetes集群编排、服务网格集成等技术栈。通过技术原理剖析、实战案例演示和最佳实践总结，揭示不同部署模式的适用场景、技术
Minikube Unable to resolve the current Docker CLI context “default“ LF-DevJourney docker 容器运维 k8s minikube
问题描述minikube安装后，执行任何minikube命令，均报下面的信息。解决方法确认docker是否运行查看docker当前的context$dockercontextlsNAMETYPEDESCRIPTIONDOCKERENDPOINTKUBERNETESENDPOINTORCHESTRATORdefault*mobyCurrentDOCKER_HOSTbasedconfiguration
第一部分、Kubernetes基础（第三节：Kubernetes 核心概念全解析） jarenyVO K8s kubernetes 容器云原生
Kubernetes核心概念全解析深入理解Kubernetes核心概念是设计云原生架构的基础。本文将全面剖析Kubernetes的关键概念，结合Java应用场景，帮助您掌握这些核心抽象。一、Pod：Kubernetes的最小调度单元1.Pod概念解析Pod核心特性：原子调度单位：Kubernetes不直接调度容器，而是调度Pod共享上下文：同一个Pod中的容器共享：网络命名空间（相同IP和端口空间
k8s基础概念和组件介绍小黑屋说YYDS 笔记 kubernetes 容器云原生
k8s涉及到的概念和组件介绍Kubernetes（简称k8s）是一个开源的容器编排系统，由Google开发并于2014年开源，后捐赠给云原生计算基金会（CNCF）。它用于自动化应用程序的部署、扩展和管理，特别是在容器化环境中，已成为业界容器编排的事实标准。它通过自动化、弹性和自我修复能力，简化了容器化应用的部署和管理。无论是小型创业公司还是大型企业，k8s都能帮助团队更高效地构建、扩展和维护应用程
IP变更后k8s集群环境恢复方法总结 Herry_644280825 kubernetes 容器云原生
在实际工作中，已安装部署的k8s集群环境，可能由于办公场所搬迁等原因导致网络环境变化，原k8s集群环境不可用，重新安装比较麻烦，可参考下述方法，恢复环境运行。1.修改hostsip信息，配置新ip域映射。/etc/hosts2.检查k8s配置,配置新ip/etc/kubernetes/kubelet.conf3.manifests目录下配置ip更新/etc/kubernetes/manifests
Kubernetes架构原理
一，为什么需要Kubernetes很多人会有疑问，有了Docker为什么还用Kubernetes?在业务开始进行容器化时，前期需要容器化的项目可能并不多，涉及的容器也并不多，此时基于Docker容器直接部署至宿主机也能实现基本的需求。但是随着项目越来越多，管理的容器也会越来越多，此时使用“裸容器”部署的方式管理起来就显得很吃力，并且随着业务量的增加，会明显体会到“裸容器”的不足，比如:宿主机宕机造
集群透视 - K8s 核心监控组件与日志管理方案 weixin_42587823 云原生 kubernetes 容器云原生
集群透视-K8s核心监控组件与日志管理方案对于SRE而言，仅仅让应用跑起来是远远不够的，确保整个Kubernetes集群的健康、稳定，并能够快速定位应用问题，依赖于一套完善的监控和日志体系。Kubernetes监控分层与核心组件Kubernetes的监控可以从不同层面进行：节点(Node)层面:监控每台物理机或虚拟机的硬件资源使用情况、操作系统状态等（通常由NodeExporter负责，我们在Pr
Kubernetes自动伸缩全解析：HPA、VPA与CA的协同工作原理倪俊炼
Kubernetes自动伸缩全解析：HPA、VPA与CA的协同工作原理developer-roadmapdeveloper-roadmap项目地址:https://gitcode.com/gh_mirrors/deve/developer-roadmap概述在现代云原生环境中，应用的负载往往具有波动性，静态配置的资源很难满足动态需求。Kubernetes提供了三种自动伸缩机制来应对这一挑战：Hor
【Kubernetes】Pod 的创建过程详解 showyoui 云原生 kubernetes 容器云原生开源 pod
KubernetesPod创建过程深度解析概述Pod是Kubernetes中最小的可部署单元，理解Pod的创建过程对于深入掌握Kubernetes的工作原理至关重要。本文将详细解析从用户提交Pod创建请求到Pod成功运行的完整流程，帮助您深入理解Kubernetes的内部机制。Pod创建的核心组件在深入了解创建过程之前，我们先来认识参与Pod创建的核心组件：APIServer:Kubernetes
Milvus 资源调度系统的核心部分：「查询节点」「资源组」「数据库」背太阳的牧羊人 milvus数据库 milvus 数据库
Milvus的资源管理分为三层：查询节点、资源组和数据库。查询节点：处理查询任务的组件。它在物理机或容器（如Kubernetes中的pod）上运行。资源组：查询节点的集合，充当逻辑组件（数据库和Collections）与物理资源之间的桥梁。您可以将一个或多个数据库或集合分配给一个资源组。下面我将详细解释这三个概念。总体图（打个比方）你可以把整个Milvus系统想象成一个「大型图书馆系统」，里头有：
Jenkins JNLP与SSH节点连接方式对比及连接断开问题解决方案 tianyuanwo devops jenkins ssh 运维
一、JNLPvsSSH连接方式优缺点对比对比维度JNLP（JavaWebStart）SSH（SecureShell）核心原理代理节点主动连接Jenkins主节点，通过加密通道通信，支持动态资源分配。Jenkins通过SSH协议远程登录代理节点执行命令，需预先配置SSH服务。适用场景容器化环境（如Kubernetes）、需要跨平台或动态扩缩容的场景。传统物理机/虚拟机、静态节点或简单命令执行场景。安
ASP.NET Core 健康监控：从入门到实战 Net分享 asp.net 后端
在ASP.NETCore中，HealthCheck是一种用于监控应用程序运行状况的内置机制。允许你定义和运行检查，以确保你的应用程序及其依赖项（如数据库、缓存、外部服务等）正常运行。HealthCheck通常用于微服务架构、容器化环境（如Kubernetes）或需要高可用性的场景。简介HealthCheck提供了一种标准化的方式，通过HTTP端点（通常是/health）返回应用程序的健康状态。He
Kubernetes在混合云平台中的应用：跨云容器编排实战 AI云原生与云计算技术学院 AI云原生与云计算 kubernetes 容器云原生 ai
Kubernetes在混合云平台中的应用：跨云容器编排实战关键词：Kubernetes，混合云平台，跨云容器编排，容器化，云原生摘要：本文围绕Kubernetes在混合云平台中的应用展开，详细阐述了跨云容器编排的相关技术。首先介绍了混合云及Kubernetes的背景知识，接着深入剖析Kubernetes跨云容器编排的核心概念与架构，讲解了相关算法原理和操作步骤，并通过数学模型进行了理论分析。通过具
Go语言与云原生：Kubernetes Operator开发全流程科技苑云原生开发语言
一、在云原生技术浪潮中，Kubernetes已成为容器编排领域的事实标准，而Go语言凭借其高效的性能、原生的并发支持和简洁的语法，成为Kubernetes生态开发的首选语言。KubernetesOperator作为扩展Kubernetes能力的重要工具，通过自定义资源（CRD）和控制器模式，实现对复杂应用的自动化管理。本文将深入解析如何使用Go语言进行KubernetesOperator的全流程开
Kubernetes 网络方案全解析：Flannel、Calico 与 Cilium 对比与选择 XMYX-0 K8S kubernetes 网络容器
文章目录Kubernetes网络方案全解析：Flannel、Calico与Cilium对比与选择Flannel——轻量级基础网络简介核心特性适用场景Calico——高性能与安全兼备的成熟方案简介核心特性适用场景Cilium——基于eBPF的下一代网络方案简介核心特性适用场景深入对比与选择建议安全性性能与扩展性部署与运维复杂性社区支持与未来发展总结与选择建议对比表格Kubernetes网络方案全解析
Kubernetes控制平面组件：Kubelet详解（五）：切换docker运行时为containerd grahamzhu 云原生学习专栏 kubernetes 容器 kubelet cri containerd k8s 容器运行时
云原生学习路线导航页（持续更新中）kubernetes学习系列快捷链接Kubernetes架构原则和对象设计（一）Kubernetes架构原则和对象设计（二）Kubernetes架构原则和对象设计（三）Kubernetes控制平面组件：etcd（一）Kubernetes控制平面组件：etcd（二）Kubernetes控制平面组件：APIServer详解（一）Kubernetes控制平面组件：API
Kubernetes控制平面组件：Kubelet详解（四）：gRPC 与 CRI gRPC实现 grahamzhu 云原生学习专栏 kubernetes kubelet grpc protobuf proto-gen-go proto rpc
云原生学习路线导航页（持续更新中）kubernetes学习系列快捷链接Kubernetes架构原则和对象设计（一）Kubernetes架构原则和对象设计（二）Kubernetes架构原则和对象设计（三）Kubernetes控制平面组件：etcd（一）Kubernetes控制平面组件：etcd（二）Kubernetes控制平面组件：APIServer详解（一）Kubernetes控制平面组件：API
k8s-diagrams：直观展现Kubernetes架构的利器汤力赛Frederica
k8s-diagrams：直观展现Kubernetes架构的利器k8s-diagramsAcollectionofkubernetes-relateddiagrams项目地址:https://gitcode.com/gh_mirrors/k8s/k8s-diagrams在当今的云计算时代，Kubernetes（简称K8s）作为容器编排的事实标准，其复杂而灵活的架构常常令人感到难以理解。k8s-di
Kubernetes、Docker Swarm 与 Nomad 容器编排方案深度对比与选型指导浅沫云归后端技术栈小结 Kubernetes Docker Nomad
Kubernetes、DockerSwarm与Nomad容器编排方案深度对比与选型指导在微服务和云原生时代，容器编排已成为保证应用可用性与扩展性的核心技术。本文将从问题背景出发，深入对比Kubernetes、DockerSwarm和Nomad三大主流编排方案，分析各自优缺点，并结合真实生产环境场景给出选型建议与实践验证，帮助后端开发与运维团队做出合理决策。1.问题背景介绍随着应用规模和复杂度的提升
k8s云原生技术栈(脑图) 晴空06 云原生 kubernetes 容器
Kubernetes(K8s)是一种开源的容器编排引擎，用于自动化应用程序容器的部署、扩展和操作。它由Google设计并捐赠给CloudNativeComputingFoundation（CNCF）进行维护。Kubernetes提供了一个强大的平台，用于构建和管理容器化应用程序的解决方案。K8s基础概念Kubernetes集群架构Master节点组件APIServerKubernetesAPI服务
Kubernetes集群架构详情弓长三虎 kubernetes 架构 java 容器云原生
Kubernetes属于典型的Server-Client形式的二层架构，在程序级别，Master主要由APIServer(kube-apiserver)、ControllerManager(kube-controller-manager)和Scheduler(kubescheduler)这3个组件，以及一个用于集群状态存储的etcd存储服务组成，它们构成整个集群的控制平面；而每个Node节点则主要
Kubernetes架构及核心部件程序员半支烟 kubernetes 架构容器 docker
Kubernetes有哪些核心部件，架构图和流程图又是怎样的，kubectl和kubelet经常分不清，声明式API和命令式API又有什么区别，本文一一详说。1、Kubernetes集群概述1.1、概述Kubernetes是一个容器编排平台，它使用共享网络将多个主机（物理服务器或虚拟机）构建成集群。分为MasterNode（主节点）和WorkerNode（工作节点），Master负责管理整个集群，
Kubernetes架构及安装——详细流程 WantEnergy kubernetes 容器云原生
目录一、基础环境准备（两台设备都要执行）第一步：修改主机名第二步：添加hosts第三步：清空防火墙和关闭selinux和swap第四步：fstab加注释符二、修改内核参数三、安装docker四、设置镜像站五、安装kubelet、kubectl、kubeadm修改kubelet运行时六、初始化集群（以下操作都在master节点操作）七、设置kubectl八、设置补齐九、配置网络插件十、工作节点nod
Kubernetes架构解析老兵发新帖 kubernetes 架构容器
Kubernetes技术栈的深度解析，涵盖架构设计、核心组件、生态工具及二次开发实践，结合实战案例说明其内在关联：一、Kubernetes架构设计核心分层模型调度运行容器ControlPlaneWorkerNodesPodDocker/containerd1.控制平面（ControlPlane）APIServer：唯一入口，RESTful接口，认证/授权（如RBAC）etcd：分布式键值存储，保存
安装k8s时，安装依赖出现错误阳光正好2024 kubernetes 容器云原生
安装依赖，输入以下指令：rpm-ivh*.rpm出现不能安装问题，报错：警告：0f2a2afd740d476ad77c508847bad1f559afc2425816c1f2ce4432a62dfe0b9d-kubernetes-cni-1.2.0-0.x86_64.rpm:头V4RSA/SHA512Signature,密钥ID3e1ba8d5:NOKEY警告：conntrack-tools-1.
75道Kubernetes高频题整理(附答案背诵版) 编程大全面试题 Kubernetes Kubernetes面试题
简述ETCD及其特点?ETCD是etcd的简称，是一个开源的分布式键值存储系统，常用于存储分布式系统中的关键数据。它由CoreOS团队开发并开源，具有以下特点：简单：ETCD提供了简单易用的HTTPAPI，使用起来非常方便。存储：数据以分层的形式存储在文件目录中，类似于我们日常使用的文件系统。Watch机制：可以Watch指定的键或前缀目录的更改，并对更改时间进行通知。安全通信：支持SSL证书验证
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数