最爱喝酸奶

10. Kubernetes的日志与监控

Kubernetes的日志处理

日志对比：

传统服务的日志：

    固定机器、固定目录
    
    不受重启影响
    
    不用关注stdout、stderr

k8s服务的日志：

    节点不固定
    
    重启服务会漂移
    
    需要关注stdout、stderr

常见方案：

1. 远程日志     kafka、elasticsearch

2. SideCar      每个pod中运行一个sidecar，与主容器共享volume

3. LogAgent     每个node运行一个agent，daemonset方式运行

实践方案：

采用LogAgent方案，LogPilot + Elasticsearch + Kibana

关于LogPilot：

智能的容器日志采集工具

自动发现机制

开源 https://github.com/AliyunContainerService/log-pilot

主机说明：

ip	角色	cpu	内存	hostname
192.168.1.51	master	>=2	>=2G	master1
192.168.1.52	master	>=2	>=2G	master2
192.168.1.53	master	>=2	>=2G	master3
192.168.1.54	node	>=2	>=2G	node1
192.168.1.55	node	>=2	>=2G	node2
192.168.1.56	node	>=2	>=2G	node3

# kubectl get nodes

NAME    STATUS   ROLES    AGE   VERSION
node1   Ready    <none>   18h   v1.14.0
node2   Ready    <none>   18h   v1.14.0
node3   Ready    <none>   18h   v1.14.0

这里master节点不作为集群工作节点，所以没有显示，属于正常情况。

部署es：

# cd /software

# mkdir elk && cd elk

# vim elasticsearch.yaml

---
apiVersion: v1
kind: Service
metadata:
  name: elasticsearch-api
  namespace: kube-system
  labels:
    name: elasticsearch
spec:
  selector:
    app: es
  ports:
  - name: transport
    port: 9200
    protocol: TCP
---
apiVersion: v1
kind: Service
metadata:
  name: elasticsearch-discovery
  namespace: kube-system
  labels:
    name: elasticsearch
spec:
  selector:
    app: es
  ports:
  - name: transport
    port: 9300
    protocol: TCP
---
apiVersion: apps/v1beta1
kind: StatefulSet
metadata:
  name: elasticsearch
  namespace: kube-system
  labels:
    kubernetes.io/cluster-service: "true"
spec:
  replicas: 3
  serviceName: "elasticsearch-service"
  selector:
    matchLabels:
      app: es
  template:
    metadata:
      labels:
        app: es
    spec:
      tolerations:
      - effect: NoSchedule
        key: node-role.kubernetes.io/master
      serviceAccountName: dashboard-admin
      initContainers:
      - name: init-sysctl
        image: busybox:1.27
        command:
        - sysctl
        - -w
        - vm.max_map_count=262144
        securityContext:
          privileged: true
      containers:
      - name: elasticsearch
        image: registry.cn-hangzhou.aliyuncs.com/imooc/elasticsearch:5.5.1
        ports:
        - containerPort: 9200
          protocol: TCP
        - containerPort: 9300
          protocol: TCP
        securityContext:
          capabilities:
            add:
              - IPC_LOCK
              - SYS_RESOURCE
        resources:
          limits:
            memory: 4000Mi
          requests:
            cpu: 100m
            memory: 2000Mi
        env:                #es配置
          - name: "http.host"
            value: "0.0.0.0"
          - name: "network.host"
            value: "_eth0_"
          - name: "cluster.name"
            value: "docker-cluster"
          - name: "bootstrap.memory_lock"
            value: "false"
          - name: "discovery.zen.ping.unicast.hosts"
            value: "elasticsearch-discovery"
          - name: "discovery.zen.ping.unicast.hosts.resolve_timeout"
            value: "10s"
          - name: "discovery.zen.ping_timeout"
            value: "6s"
          - name: "discovery.zen.minimum_master_nodes"
            value: "2"
          - name: "discovery.zen.fd.ping_interval"
            value: "2s"
          - name: "discovery.zen.no_master_block"
            value: "write"
          - name: "gateway.expected_nodes"
            value: "2"
          - name: "gateway.expected_master_nodes"
            value: "1"
          - name: "transport.tcp.connect_timeout"
            value: "60s"
          - name: "ES_JAVA_OPTS"
            value: "-Xms2g -Xmx2g"
        livenessProbe:
          tcpSocket:
            port: transport
          initialDelaySeconds: 20
          periodSeconds: 10
        volumeMounts:
        - name: es-data
          mountPath: /data
      terminationGracePeriodSeconds: 30
      volumes:
      - name: es-data
        hostPath:
          path: /es-data

# kubectl apply -f elasticsearch.yaml

service/elasticsearch-api created
service/elasticsearch-discovery created
statefulset.apps/elasticsearch created

# kubectl get svc -n kube-system

NAME                      TYPE        CLUSTER-IP       EXTERNAL-IP   PORT(S)         AGE
calico-typha              ClusterIP   10.254.126.91    <none>        5473/TCP        18h
elasticsearch-api         ClusterIP   10.254.249.131   <none>        9200/TCP        9s
elasticsearch-discovery   ClusterIP   10.254.90.241    <none>        9300/TCP        9s
kube-dns                  ClusterIP   10.254.0.2       <none>        53/UDP,53/TCP   18h
kubernetes-dashboard      NodePort    10.254.3.71      <none>        443:8401/TCP    18h

# kubectl get statefulsets.apps -n kube-system

NAME            READY   AGE
elasticsearch   3/3     29s

部署logpilot：

# vim log-pilot.yaml

---
apiVersion: extensions/v1beta1
kind: DaemonSet             #daemonset类型
metadata:
  name: log-pilot
  namespace: kube-system
  labels:
    k8s-app: log-pilot
    kubernetes.io/cluster-service: "true"
spec:
  template:
    metadata:
      labels:
        k8s-app: log-es
        kubernetes.io/cluster-service: "true"
        version: v1.22
    spec:
      tolerations:
      - key: node-role.kubernetes.io/master
        effect: NoSchedule
      serviceAccountName: dashboard-admin
      containers:
      - name: log-pilot
        image: registry.cn-hangzhou.aliyuncs.com/imooc/log-pilot:0.9-filebeat             #基于filebeat实现日志收集
        resources:
          limits:
            memory: 200Mi
          requests:
            cpu: 100m
            memory: 200Mi
        env:                #log-pilot配置
          - name: "FILEBEAT_OUTPUT"
            value: "elasticsearch"
          - name: "ELASTICSEARCH_HOST"
            value: "elasticsearch-api"
          - name: "ELASTICSEARCH_PORT"
            value: "9200"
          - name: "ELASTICSEARCH_USER"
            value: "elastic"
          - name: "ELASTICSEARCH_PASSWORD"
            value: "changeme"
        volumeMounts:
        - name: sock
          mountPath: /var/run/docker.sock
        - name: root
          mountPath: /host
          readOnly: true
        - name: varlib
          mountPath: /var/lib/filebeat
        - name: varlog
          mountPath: /var/log/filebeat
        securityContext:
          capabilities:
            add:
            - SYS_ADMIN
      terminationGracePeriodSeconds: 30
      volumes:
      - name: sock
        hostPath:
          path: /var/run/docker.sock
      - name: root
        hostPath:
          path: /               #配置对容器具有读写权限
      - name: varlib
        hostPath:
          path: /var/lib/filebeat
          type: DirectoryOrCreate
      - name: varlog
        hostPath:
          path: /var/log/filebeat
          type: DirectoryOrCreate

# kubectl apply -f log-pilot.yaml

daemonset.extensions/log-pilot created

# kubectl get ds -n kube-system

NAME          DESIRED   CURRENT   READY   UP-TO-DATE   AVAILABLE   NODE SELECTOR   AGE
calico-node   3         3         3       3            3           <none>          18h
log-pilot     3         3         3       3            3           <none>          6s

部署kibana：

# vim kibana.yaml

---
apiVersion: v1
kind: Service
metadata:
  name: kibana
  namespace: kube-system
  labels:
    component: kibana
spec:
  selector:
    component: kibana
  ports:
  - name: http
    port: 80
    targetPort: http
---
apiVersion: extensions/v1beta1
kind: Ingress
metadata:
  name: kibana
  namespace: kube-system
spec:
  rules:
  - host: kibana.lzxlinux.cn
    http:
      paths:
      - path: /
        backend:
          serviceName: kibana
          servicePort: 80
---
apiVersion: apps/v1beta1
kind: Deployment
metadata:
  name: kibana
  namespace: kube-system
  labels:
    component: kibana
spec:
  replicas: 1
  selector:
    matchLabels:
     component: kibana
  template:
    metadata:
      labels:
        component: kibana
    spec:
      containers:
      - name: kibana
        image: registry.cn-hangzhou.aliyuncs.com/imooc/kibana:5.5.1
        env:                #kibana配置
        - name: CLUSTER_NAME
          value: docker-cluster
        - name: ELASTICSEARCH_URL
          value: http://elasticsearch-api:9200/
        resources:
          limits:
            cpu: 1000m
          requests:
            cpu: 100m
        ports:
        - containerPort: 5601
          name: http

# kubectl apply -f kibana.yaml

service/kibana created
ingress.extensions/kibana created
deployment.apps/kibana created

# kubectl get deploy -n kube-system

NAME                   READY   UP-TO-DATE   AVAILABLE   AGE
calico-typha           1/1     1            1           18h
coredns                1/1     1            1           18h
kibana                 1/1     1            1           6s
kubernetes-dashboard   1/1     1            1           18h

# kubectl get svc -n kube-system

NAME                      TYPE        CLUSTER-IP       EXTERNAL-IP   PORT(S)         AGE
calico-typha              ClusterIP   10.254.126.91    <none>        5473/TCP        18h
elasticsearch-api         ClusterIP   10.254.249.131   <none>        9200/TCP        100s
elasticsearch-discovery   ClusterIP   10.254.90.241    <none>        9300/TCP        100s
kibana                    ClusterIP   10.254.169.82    <none>        80/TCP          24s
kube-dns                  ClusterIP   10.254.0.2       <none>        53/UDP,53/TCP   18h
kubernetes-dashboard      NodePort    10.254.3.71      <none>        443:8401/TCP    18h

访问kibana：

在Windows电脑hosts文件中添加本地dns：

192.168.1.54 kibana.lzxlinux.cn

提示创建索引，kibana正常启动。此时可以查看log-pilot容器日志，看其是否启动正常。任选一个node节点查看，

# docker ps |grep log-pilot

787ee06e64da        80a82e076691                 "/pilot/entrypoint"      5 minutes ago       Up 5 minutes                            k8s_log-pilot_log-pilot-lx6fr_kube-system_8d1a3dab-1bc7-11ea-a74e-000c290f0358_0
036d26b99443        k8s.gcr.io/pause-amd64:3.1   "/pause"                 5 minutes ago       Up 5 minutes                            k8s_POD_log-pilot-lx6fr_kube-system_8d1a3dab-1bc7-11ea-a74e-000c290f0358_0

# docker logs 787ee06e64da

enable pilot: filebeat
time="2019-12-11T03:37:29Z" level=debug msg="787ee06e64da1d6632e4144da0dce5c38d352e5b249e2bf8a3e551246b5d5d8d has not log config, skip" 
time="2019-12-11T03:37:29Z" level=debug msg="036d26b994435efa5c5a9e8091f0b3cce3309a3ef59fc7c2c97cb695fd12a4ac has not log config, skip" 
time="2019-12-11T03:37:29Z" level=debug msg="61d447b30b1679935b88cf7860399aed2c3985c7c1ba571fde6ed19ab922209d has not log config, skip" 
time="2019-12-11T03:37:29Z" level=debug msg="7618fdf1bda3ef5b8df9ba7bb4b6ab41d2c47b63120dd1172fb15d2de4d3e998 has not log config, skip" 
time="2019-12-11T03:37:29Z" level=debug msg="851a74a68960cc6fa540da8124d7a64fc0f2a496cc2a8fefcb40470d14d6f657 has not log config, skip" 
time="2019-12-11T03:37:29Z" level=debug msg="540351c879ff8a6aba5f9dc6c77fda3270f4a84798c367525c0016590ec44728 has not log config, skip" 
time="2019-12-11T03:37:29Z" level=debug msg="0a93aaef53a96f418c12b80160e79eeece8f6a038e2936b706fb50b71d1bb500 has not log config, skip" 
time="2019-12-11T03:37:29Z" level=debug msg="0a4546f201fe0627564d870a1ea11e2a88e72629ba93c41c4697df0691866db7 has not log config, skip" 
time="2019-12-11T03:37:29Z" level=debug msg="85c0e9949d85648ace2cc8d0dd3fe6e30396120403fb607090d8fa91969b3950 has not log config, skip" 
time="2019-12-11T03:37:29Z" level=debug msg="43a060f199d2408e54620fd2f66b6496e4d98921cd86fec8b895cde689f6abfd has not log config, skip" 
time="2019-12-11T03:37:29Z" level=debug msg="5127010d7f9640473e4e20c8fa3058051d00049fd5f5e6fa29138615b1011769 has not log config, skip" 
time="2019-12-11T03:37:29Z" level=info msg="start filebeat" 
time="2019-12-11T03:37:29Z" level=info msg="filebeat watcher start" 
time="2019-12-11T03:37:29Z" level=info msg="Reload gorouting is ready" 
time="2019-12-11T03:37:54Z" level=debug msg="Process container start event: 80ed62ec95e8476ec12d16dde92f0f7817d8ebaec19989160742fd83be97e10f" 
time="2019-12-11T03:37:54Z" level=debug msg="80ed62ec95e8476ec12d16dde92f0f7817d8ebaec19989160742fd83be97e10f has not log config, skip" 
time="2019-12-11T03:37:55Z" level=debug msg="Process container start event: a49e0011afacb8ed5e042ee8e33db4eb8b78699e86d3bbe4f47a5eebf06aef4c" 
time="2019-12-11T03:37:55Z" level=debug msg="a49e0011afacb8ed5e042ee8e33db4eb8b78699e86d3bbe4f47a5eebf06aef4c has not log config, skip"

可以看到log-pilot正常启动，由于当前没有采集日志的配置，所以全为skip。

配置日志采集：

部署一个项目，同时配置日志采集。

# vim web.yaml

apiVersion: apps/v1
kind: Deployment
metadata:
  name: web-demo
spec:
  selector:
    matchLabels:
      app: web-demo
  replicas: 3
  template:
    metadata:
      labels:
        app: web-demo
    spec:
      containers:
      - name: web-demo
        image: hub.lzxlinux.cn/kubernetes/web:latest
        imagePullPolicy: Always
        ports:
        - containerPort: 8080
        env:
        - name: aliyun_logs_catalina
          value: "stdout"
        - name: aliyun_logs_access
          value: "/usr/local/tomcat/logs/*"
        volumeMounts:
        - mountPath: /usr/local/tomcat/logs
          name: accesslogs
      volumes:
      - name: accesslogs
        emptyDir: {}
      imagePullSecrets:
      - name: hub-secret
---
apiVersion: v1
kind: Service
metadata:
  name: web-demo
spec:
  ports:
  - port: 80
    protocol: TCP
    targetPort: 8080
  selector:
    app: web-demo
  type: ClusterIP

---
apiVersion: extensions/v1beta1
kind: Ingress
metadata:
  name: web-demo
spec:
  rules:
  - host: web.lzxlinux.cn
    http:
      paths:
      - path: /
        backend:
          serviceName: web-demo
          servicePort: 80

# kubectl apply -f web.yaml

deployment.apps/web-demo created
service/web-demo created
ingress.extensions/web-demo created

# kubectl get pods

NAME                        READY   STATUS    RESTARTS   AGE
web-demo-5fd5f57698-7wtkq   1/1     Running   0          6s
web-demo-5fd5f57698-bn5jc   1/1     Running   0          6s
web-demo-5fd5f57698-qw6bq   1/1     Running   0          6s

kibana创建索引：

使用access*作为索引，创建该索引。接着再使用catalina*创建一个索引（上面web.yaml中使用的索引），

到Discover中查看，

然后访问web.lzxlinux.cn/hello?name=lzx，多刷新几次页面，

接着到kibana页面搜索访问日志，

可以看到，访问日志已经在kibana页面展示出来。

通过这种方式，可以实现kubernetes的容器日志处理。

Kubernetes的监控告警

监控介绍

监控目的：

及时发现已经出现的问题

提前预警可能发生的问题

监控什么：

系统基础指标

服务基础信息

服务个性化信息

日志

如何监控：

数据采集
    ↓
数据存储（时间序列数据库）
    ↓
定义告警规则
    ↓
配置通知方式

常见监控方案：

Zabbix

OpenFalcon

Prometheus

kubernetes的监控：

每个节点的基础指标

每个容器的基础指标

kubernetes的基础组件

kubernetes组件监控：

etcd    https://${HOST}:2379/metrics
    
apiserver   https://${HOST}:6443/metrics

controllermanager   https://${HOST}:10252/metrics

scheduler   https://${HOST}:10251/metrics

prometheus适用于kubernetes的监控。

prometheus介绍：

prometheus是一系列服务的组合，同时也是系统和服务的监控告警平台。

特征：

由metric名称和kv标识的多维数据模型

灵活的查询语言（PromQL）

支持pull、push方式添加数据

支持基于kubernetes服务发现的动态配置

架构：

value的数据类型：

Counter     累计值，只增不减

Gauge       常规数值

Histogram && Summary    统计分析

部署Prometheus

部署方式：

手动

Helm

Prometheus Operator

Helm + Prometheus Operator

本文通过helm + prometheus operator部署prometheus，该方式非常优雅。

helm部署：

类似CentOS中的yum、Ubuntu的apt-get，helm是kubernetes的包管理工具。对于helm，一个包就是一个chart（一个目录）。

官方下载地址：https://github.com/helm/helm/releases

百度云地址（推荐）：https://pan.baidu.com/s/1CBeGImHY18R7PaIIHrFDLA
提取码：sjwi

首先需要保证部署helm的节点必须可以正常执行kubectl。helm客户端安装，

# cd /software

# curl -O https://storage.googleapis.com/kubernetes-helm/helm-v2.14.3-linux-amd64.tar.gz

# tar xf helm-v2.14.3-linux-amd64.tar.gz

# mv linux-amd64/helm /usr/local/bin/

# echo 'export PATH=$PATH:/usr/local/bin/' >> /etc/profile

# source /etc/profile

# helm version

Client: &version.Version{SemVer:"v2.14.3", GitCommit:"0e7f3b6637f7af8fcfddb3d2941fcc7cbebb0085", GitTreeState:"clean"}
Error: could not find tiller

tiller是以deployment方式部署在kubernetes集群中的。每个集群节点安装socat，

# yum install -y socat

否则后面会报错：unable to do port forwarding: socat not found.

tiller安装，

指向阿里云的仓库
# helm init --client-only --stable-repo-url https://aliacs-app-catalog.oss-cn-hangzhou.aliyuncs.com/charts/

# helm repo add incubator https://aliacs-app-catalog.oss-cn-hangzhou.aliyuncs.com/charts-incubator/

# helm repo update

因为官方的镜像无法拉取，使用-i指定自己的镜像
# helm init --service-account tiller --upgrade -i registry.cn-hangzhou.aliyuncs.com/google_containers/tiller:v2.14.3 --stable-repo-url https://kubernetes.oss-cn-hangzhou.aliyuncs.com/charts
 
创建TLS认证服务端
# helm init --service-account tiller --upgrade -i registry.cn-hangzhou.aliyuncs.com/google_containers/tiller:v2.14.3 --tiller-tls-cert /etc/kubernetes/ssl/tiller001.pem --tiller-tls-key /etc/kubernetes/ssl/tiller001-key.pem --tls-ca-cert /etc/kubernetes/ssl/ca.pem --tiller-namespace kube-system --stable-repo-url https://kubernetes.oss-cn-hangzhou.aliyuncs.com/charts

创建serviceaccount
# kubectl create serviceaccount --namespace kube-system tiller

创建角色绑定
# kubectl create clusterrolebinding tiller-cluster-rule --clusterrole=cluster-admin --serviceaccount=kube-system:tiller

查看Tiller的serviceaccount，需要跟我们创建的名字一致：tiller
# kubectl get deploy --namespace kube-system tiller-deploy -o yaml|grep serviceAccount
      serviceAccount: tiller
      serviceAccountName: tiller

验证pods
# kubectl -n kube-system get pods|grep tiller
tiller-deploy-749f694975-c9vlq          1/1     Running   0          64s

验证版本
# helm version
Client: &version.Version{SemVer:"v2.14.3", GitCommit:"0e7f3b6637f7af8fcfddb3d2941fcc7cbebb0085", GitTreeState:"clean"}
Server: &version.Version{SemVer:"v2.14.3", GitCommit:"0e7f3b6637f7af8fcfddb3d2941fcc7cbebb0085", GitTreeState:"clean"}

可以看到，helm部署完成。

部署prometheus：

prometheus operator的实现原理：kubernetes的自定义资源类型（CRD）+ 自定义控制器。

# cd /software

# git clone https://gitee.com/zuiaihesuannaiyo/prometheus-operator.git

# ls prometheus-operator/
charts  Chart.yaml  ci  CONTRIBUTING.md  hack  OWNERS  README.md  requirements.lock  requirements.yaml  templates  values.yaml

修改values.yaml，

# vim /software/prometheus-operator/values.yaml             #修改下面内容

alertmanager:
  enabled: true
  
  config:
    global:
      resolve_timeout: 5m
      smtp_smarthost: 'smtp.163.com:25'
      smtp_from: '[email protected]'               #发件人
      smtp_auth_username: '[email protected]'
      smtp_auth_password: 'aA111111'
    route:
      group_by: ['job']
      group_wait: 30s
      group_interval: 5m
      repeat_interval: 12h
      receiver: 'email-alerts'
      routes:
      - match:
          alertname: .*
        receiver: 'email-alerts'
    receivers:
    - name: 'email-alerts'
      email_configs:
      - to: '[email protected]'              #收件人，自己的邮箱
        send_resolved: true             #问题解决时也发送邮件
  
kubelet:
  enabled: true
  namespace: kube-system

  serviceMonitor:  
    https: false
    
kubeControllerManager:
  enabled: true
  
  endpoints:
  - 192.168.1.51
  - 192.168.1.52
  - 192.168.1.53
    
kubeEtcd:
  enabled: true

  endpoints:
  - 192.168.1.51
  - 192.168.1.52
  - 192.168.1.53

  serviceMonitor:
    caFile: "/etc/prometheus/secrets/etcd-certs/ca.pem"
    certFile: "/etc/prometheus/secrets/etcd-certs/etcd.pem"
    keyFile: "/etc/prometheus/secrets/etcd-certs/etcd-key.pem"

kubeScheduler:
  enabled: true

  endpoints:
  - 192.168.1.53
  - 192.168.1.52
  - 192.168.1.53

  serviceMonitor:
      https: false
    
prometheus:
  enabled: true
  
    secrets:
    - etcd-certs

所有master节点修改相关服务文件，以master1节点为例，

# vim /etc/systemd/system/kube-scheduler.service

[Unit]
Description=Kubernetes Scheduler
Documentation=https://github.com/GoogleCloudPlatform/kubernetes

[Service]
ExecStart=/opt/kubernetes/bin/kube-scheduler \
  --address=192.168.1.51 \              #修改为对应ip
  --kubeconfig=/etc/kubernetes/kube-scheduler.kubeconfig \
  --leader-elect=true \
  --alsologtostderr=true \
  --logtostderr=false \
  --log-dir=/var/log/kubernetes \
  --v=2
Restart=on-failure
RestartSec=5

[Install]
WantedBy=multi-user.target

# systemctl daemon-reload && systemctl restart kube-scheduler

# netstat -lntp |grep 10251
tcp        0      0 192.168.1.51:10251      0.0.0.0:*               LISTEN      7604/kube-scheduler

# vim /etc/systemd/system/kube-controller-manager.service

[Unit]
Description=Kubernetes Controller Manager
Documentation=https://github.com/GoogleCloudPlatform/kubernetes

[Service]
ExecStart=/opt/kubernetes/bin/kube-controller-manager \
  --port=0 \
  --secure-port=10252 \
  --bind-address=192.168.1.51 \             #修改为对应ip
  --kubeconfig=/etc/kubernetes/controller-manager.kubeconfig \
  --service-cluster-ip-range=10.254.0.0/16 \
  --cluster-name=kubernetes \
  --cluster-signing-cert-file=/etc/kubernetes/pki/ca.pem \
  --cluster-signing-key-file=/etc/kubernetes/pki/ca-key.pem \
  --allocate-node-cidrs=true \
  --cluster-cidr=172.10.0.0/16 \
  --experimental-cluster-signing-duration=8760h \
  --root-ca-file=/etc/kubernetes/pki/ca.pem \
  --service-account-private-key-file=/etc/kubernetes/pki/ca-key.pem \
  --leader-elect=true \
  --feature-gates=RotateKubeletServerCertificate=true \
  --controllers=*,bootstrapsigner,tokencleaner \
  --horizontal-pod-autoscaler-use-rest-clients=true \
  --horizontal-pod-autoscaler-sync-period=10s \
  --tls-cert-file=/etc/kubernetes/pki/controller-manager.pem \
  --tls-private-key-file=/etc/kubernetes/pki/controller-manager-key.pem \
  --use-service-account-credentials=true \
  --alsologtostderr=true \
  --logtostderr=false \
  --log-dir=/var/log/kubernetes \
  --v=2
Restart=on-failure
RestartSec=5

[Install]
WantedBy=multi-user.target

# systemctl daemon-reload && systemctl restart kube-controller-manager

# netstat -lntp |grep 10252
tcp        0      0 192.168.1.51:10252      0.0.0.0:*               LISTEN      8803/kube-controlle

在helm install之前在所有node节点手动拉取镜像，

# docker pull quay.io/prometheus/node-exporter:v0.17.0

# docker pull quay.io/coreos/prometheus-operator:v0.29.0

# docker pull quay.io/prometheus/alertmanager:v0.16.2

# docker pull quay.io/coreos/prometheus-config-reloader:v0.29.0

# docker pull quay.io/prometheus/prometheus:v2.9.1

执行helm install，

# helm install prometheus-operator/ --name prom --namespace monitoring

helm install后遇到两个报错：

# kubectl describe pod -n monitoring alertmanager-prom-prometheus-operator-alertmanager-0

Back-off restarting failed container

# kubectl logs alertmanager-prom-prometheus-operator-alertmanager-0 alertmanager -n monitoring

Failed to resolve alertmanager-prom-prometheus-operator-alertmanager-0.alertmanager-operated.monitoring.svc:6783: lookup alertmanager-prom-prometheus-operator-alertmanager-0.alertmanager-operated.monitoring.svc on 10.254.0.2:53: no such host

# kubectl describe pod -n monitoring prometheus-prom-prometheus-operator-prometheus-0

MountVolume.SetUp failed for volume "secret-etcd-certs" : secret "etcd-certs" not found

解决报错：

# kubectl create secret generic etcd-certs -n monitoring --from-file=/etc/kubernetes/pki/ca.pem --from-file=/etc/kubernetes/pki/etcd-key.pem --from-file=/etc/kubernetes/pki/etcd.pem

# vim /software/prometheus-operator/values.yaml             #更改alertmanager镜像版本

alertmanager:
  enabled: true
  
  alertmanagerSpec:
    podMetadata: {}

    image:
      repository: quay.io/prometheus/alertmanager
      tag: v0.14.0

然后删除monitoring相关的资源对象，

# helm delete prom --purge

# kubectl get crd |grep coreos

# kubectl delete crd alertmanagers.monitoring.coreos.com

# kubectl delete crd prometheuses.monitoring.coreos.com

# kubectl delete crd prometheusrules.monitoring.coreos.com

# kubectl delete crd servicemonitors.monitoring.coreos.com

再次执行helm install，

# helm install prometheus-operator/ --name prom --namespace monitoring

# kubectl get all -n monitoring

NAME                                                       READY   STATUS    RESTARTS   AGE
pod/alertmanager-prom-prometheus-operator-alertmanager-0   2/2     Running   0          18s
pod/prom-grafana-d4f9475c5-nz5rq                           2/2     Running   0          24s
pod/prom-kube-state-metrics-fffc48566-5qn7h                1/1     Running   0          24s
pod/prom-prometheus-node-exporter-9j49w                    1/1     Running   0          24s
pod/prom-prometheus-node-exporter-w2r6z                    1/1     Running   0          24s
pod/prom-prometheus-node-exporter-zs2n5                    1/1     Running   0          24s
pod/prom-prometheus-operator-operator-59dc6859c9-8bt7n     1/1     Running   0          24s
pod/prometheus-prom-prometheus-operator-prometheus-0       3/3     Running   1          11s

NAME                                            TYPE        CLUSTER-IP       EXTERNAL-IP   PORT(S)             AGE
service/alertmanager-operated                   ClusterIP   None             <none>        9093/TCP,6783/TCP   18s
service/prom-grafana                            ClusterIP   10.254.66.23     <none>        80/TCP              25s
service/prom-kube-state-metrics                 ClusterIP   10.254.136.131   <none>        8080/TCP            25s
service/prom-prometheus-node-exporter           ClusterIP   10.254.177.222   <none>        9100/TCP            25s
service/prom-prometheus-operator-alertmanager   ClusterIP   10.254.160.213   <none>        9093/TCP            25s
service/prom-prometheus-operator-operator       ClusterIP   10.254.172.150   <none>        8080/TCP            25s
service/prom-prometheus-operator-prometheus     ClusterIP   10.254.4.212     <none>        9090/TCP            25s
service/prometheus-operated                     ClusterIP   None             <none>        9090/TCP            11s

NAME                                           DESIRED   CURRENT   READY   UP-TO-DATE   AVAILABLE   NODE SELECTOR   AGE
daemonset.apps/prom-prometheus-node-exporter   3         3         3       3            3           <none>          25s

NAME                                                READY   UP-TO-DATE   AVAILABLE   AGE
deployment.apps/prom-grafana                        1/1     1            1           25s
deployment.apps/prom-kube-state-metrics             1/1     1            1           25s
deployment.apps/prom-prometheus-operator-operator   1/1     1            1           25s

NAME                                                           DESIRED   CURRENT   READY   AGE
replicaset.apps/prom-grafana-d4f9475c5                         1         1         1       25s
replicaset.apps/prom-kube-state-metrics-fffc48566              1         1         1       24s
replicaset.apps/prom-prometheus-operator-operator-59dc6859c9   1         1         1       24s

NAME                                                                  READY   AGE
statefulset.apps/alertmanager-prom-prometheus-operator-alertmanager   1/1     18s
statefulset.apps/prometheus-prom-prometheus-operator-prometheus       1/1     11s

上面就是helm部署的结果，接下来为prometheus配置ingresss。

配置ingress：

# kubectl get svc -n monitoring prom-prometheus-operator-prometheus -o yaml

apiVersion: v1
kind: Service
metadata:
  creationTimestamp: "2019-12-26T03:38:14Z"
  labels:
    app: prometheus-operator-prometheus
    chart: prometheus-operator-5.5.0
    heritage: Tiller
    release: prom
  name: prom-prometheus-operator-prometheus
  namespace: monitoring
  resourceVersion: "1041537"
  selfLink: /api/v1/namespaces/monitoring/services/prom-prometheus-operator-prometheus
  uid: 25df39e2-2791-11ea-ac82-000c291749f6
spec:
  clusterIP: 10.254.4.212
  ports:
  - name: web
    port: 9090
    protocol: TCP
    targetPort: 9090
  selector:
    app: prometheus
    prometheus: prom-prometheus-operator-prometheus
  sessionAffinity: None
  type: ClusterIP
status:
  loadBalancer: {}

# vim ingress-prometheus.yaml

apiVersion: extensions/v1beta1
kind: Ingress
metadata:
  name: prometheus
  namespace: monitoring
spec:
  rules:
  - host: prometheus.lzxlinux.cn
    http:
      paths:
      - backend:
          serviceName: prom-prometheus-operator-prometheus
          servicePort: web
        path: /

# kubectl apply -f ingress-prometheus.yaml

在Windows电脑hosts文件中添加本地dns：

192.168.1.54 prometheus.lzxlinux.cn

查看监控目标：

当前kube-controller-manager监控存在问题，提示server returned HTTP status 403 Forbidden。

查看告警邮件：

与prometheus页面提示一致，kube-controller-manager 100% down

解决该问题：

# vim /software/prometheus-operator/values.yaml

kubeControllerManager:
  enabled: true

  endpoints:
  - 192.168.1.51
  - 192.168.1.52
  - 192.168.1.53
  
  serviceMonitor:
  
    interval: ""
    https: false

所有master节点修改相关服务文件，以master1节点为例，

# vim /etc/systemd/system/kube-controller-manager.service

[Unit]
Description=Kubernetes Controller Manager
Documentation=https://github.com/GoogleCloudPlatform/kubernetes

[Service]
ExecStart=/opt/kubernetes/bin/kube-controller-manager \
  --port=10252 \
  --secure-port=0 \             #关闭https
  --bind-address=192.168.1.51 \
  --kubeconfig=/etc/kubernetes/controller-manager.kubeconfig \
  --service-cluster-ip-range=10.254.0.0/16 \
  --cluster-name=kubernetes \
  --cluster-signing-cert-file=/etc/kubernetes/pki/ca.pem \
  --cluster-signing-key-file=/etc/kubernetes/pki/ca-key.pem \
  --allocate-node-cidrs=true \
  --cluster-cidr=172.10.0.0/16 \
  --experimental-cluster-signing-duration=8760h \
  --root-ca-file=/etc/kubernetes/pki/ca.pem \
  --service-account-private-key-file=/etc/kubernetes/pki/ca-key.pem \
  --leader-elect=true \
  --feature-gates=RotateKubeletServerCertificate=true \
  --controllers=*,bootstrapsigner,tokencleaner \
  --horizontal-pod-autoscaler-use-rest-clients=true \
  --horizontal-pod-autoscaler-sync-period=10s \
  --tls-cert-file=/etc/kubernetes/pki/controller-manager.pem \
  --tls-private-key-file=/etc/kubernetes/pki/controller-manager-key.pem \
  --use-service-account-credentials=true \
  --alsologtostderr=true \
  --logtostderr=false \
  --log-dir=/var/log/kubernetes \
  --v=2
Restart=on-failure
RestartSec=5

[Install]
WantedBy=multi-user.target

# systemctl daemon-reload && systemctl restart kube-controller-manager

到prometheus页面查看，

可以看到kube-controller-manager监控恢复正常。

配置Grafana

配置ingress：

# kubectl get svc -n monitoring prom-grafana -o yaml

apiVersion: v1
kind: Service
metadata:
  creationTimestamp: "2019-12-26T06:06:23Z"
  labels:
    app: grafana
    chart: grafana-3.3.6
    heritage: Tiller
    release: prom
  name: prom-grafana
  namespace: monitoring
  resourceVersion: "1058812"
  selfLink: /api/v1/namespaces/monitoring/services/prom-grafana
  uid: d8383b4d-27a5-11ea-ac82-000c291749f6
spec:
  clusterIP: 10.254.194.116
  ports:
  - name: service
    port: 80
    protocol: TCP
    targetPort: 3000
  selector:
    app: grafana
    release: prom
  sessionAffinity: None
  type: ClusterIP
status:
  loadBalancer: {}

# vim ingress-grafana.yaml

apiVersion: extensions/v1beta1
kind: Ingress
metadata:
  name: prom-grafana
  namespace: monitoring
spec:
  rules:
  - host: grafana.lzxlinux.cn
    http:
      paths:
      - backend:
          serviceName: prom-grafana
          servicePort: 80
        path: /

# kubectl apply -f ingress-grafana.yaml

在Windows电脑hosts文件中添加本地dns：

192.168.1.54 grafana.lzxlinux.cn

登录grafana：

# vim /software/prometheus-operator/charts/grafana/values.yaml

adminUser: admin

admin:
  existingSecret: ""
  userKey: admin-user
  passwordKey: admin-password

# kubectl get secrets -n monitoring prom-grafana -o yaml

apiVersion: v1
data:
  admin-password: cHJvbS1vcGVyYXRvcg==
  admin-user: YWRtaW4=
  ldap-toml: ""
kind: Secret
metadata:
  creationTimestamp: "2019-12-26T06:06:23Z"
  labels:
    app: grafana
    chart: grafana-3.3.6
    heritage: Tiller
    release: prom
  name: prom-grafana
  namespace: monitoring
  resourceVersion: "1058761"
  selfLink: /api/v1/namespaces/monitoring/secrets/prom-grafana
  uid: d7b207d8-27a5-11ea-ac82-000c291749f6
type: Opaque

通过BASE64解码，账号为admin，密码为prom-operator，登录grafana。

查看grafana：

grafana的图表比较丰富，包含了kubernetes集群的集群信息，本质上是通过PromQL查询得到的数据。

至此，kubernetes集群的监控 prometheus + grafana 部署完成。

你可能感兴趣的:(Kubernetes,kubernetes)

【k8s应用管理】kubernetes HPA+rancher Karoku066 kubernetes rancher 容器运维云原生
文章目录KubernetesHPA部署指南概述部署metrics-server部署HPARancher管理Kubernetes集群指南实验环境安装及配置RancherKubernetesHPA部署指南概述KubernetesHPA（HorizontalPodAutoscaling）可以根据Pod的CPU利用率自动调整Deployment、ReplicationController或ReplicaS
前端504错误分析 ox0080 #北漂+滴滴出行 Web VIP 激励前端
前端出现504错误（网关超时）通常是由于代理服务器未能及时从上游服务获取响应。以下是详细分析步骤和解决方案：1.确认错误来源504含义：代理服务器（如Nginx、Apache）在等待后端服务响应时超时。常见架构：前端→代理服务器→后端服务，问题通常出在代理与后端之间。2.排查步骤（1）检查后端服务状态确认服务是否运行：通过日志或监控工具（如systemctlstatus,KubernetesPod
网络流量如何从公共互联网抵达Kubernetes容器 Pod? 硅基创想家 #Kubernetes实战与经验 kubernetes 容器云原生
“解释网络流量如何从公共互联网抵达Kubernetes容器（Pod）”，这是DevOps技术面试中相当常见的问题。对这个问题给出准确且详尽的回答，能体现出DevOps工程师对Kubernetes各项流程的熟悉程度。在本文中，我将以在AWSEKS上运行Kubernetes为例，梳理这一过程。简短的答案可以概括为：用户请求→域名系统（DNS）→弹性负载均衡器（ELB）→Ingress控制器（可选）→K
Kubernetes的Ingress和Service有什么区别？硅基创想家 #Kubernetes实战与经验 kubernetes 容器云原生
在Kubernetes中，Ingress和Service是两个不同的概念，它们在功能、作用范围、应用场景等方面存在明显区别，具体如下：功能Ingress：主要用于管理集群外部到内部服务的HTTP和HTTPS流量路由。它可以根据域名、路径等规则，将外部请求精确地路由到集群内不同的Service，实现更细粒度的流量控制和多服务共享一个IP等功能。Service：主要用于在Kubernetes集群内部为
Kubernetes的Ingress 资源是什么？硅基创想家 #Kubernetes实战与经验 kubernetes 容器云原生
在Kubernetes中，Ingress资源是一种用于管理集群外部对内部服务访问的API对象，主要用于将不同的外部请求路由到集群内的不同服务，以下是关于它的详细介绍：定义与作用Ingress资源定义了从集群外部到内部服务的HTTP和HTTPS路由规则。通过Ingress，可以将多个不同域名或不同路径的请求，根据定义的规则，导向到集群内不同的Kubernetes服务，从而实现对集群内服务的统一外部访
Kubernetes & 容器自动伸缩失败：解决方案及阿里云如何帮助 Anna_Tong kubernetes 阿里云容器负载均衡云原生弹性计算自动伸缩
随着容器技术的普及，Kubernetes（K8s）已成为构建现代云原生应用的核心平台。自动伸缩（AutoScaling）功能可以帮助应用在流量波动时动态调整资源，提高效率并节约成本。然而，很多企业在配置水平自动伸缩（HorizontalPodAutoscaler，HPA）或ECS扩容策略时，常常遇到配置错误或无法触发扩容的问题，导致资源无法及时扩展或收缩，影响系统的稳定性和用户体验。本文将为您分享
Kubernetes 服务发现背后的秘密武器——CoreDNS weixin_42587823 dns kubernetes 服务发现容器 coredns
Kubernetes服务发现背后的秘密武器——CoreDNS在Kubernetes集群中，CoreDNS是一个关键的基础组件，负责域名解析和服务发现。无论是内部服务通信还是访问外部域名，CoreDNS都为我们提供了高效、灵活的支持。本文将通俗易懂地介绍CoreDNS的作用、工作流程，并通过一些常见的配置案例帮助你更好地理解它的功能。CoreDNS的作用服务名称解析CoreDNS负责将Kuberne
一文读懂Ingress-Nginx以及实战教程努力的小T Kubernetes Linux 云计算运维基础 nginx 运维服务器 linux kubernetes 云原生
Ingress-Nginx简介Ingress-Nginx是Kubernetes的一个入口控制器，它允许您将外部HTTP和HTTPS流量路由到集群内的服务。除了标准的HTTP/HTTPS路由功能外，Ingress-Nginx还支持WebSocket、gRPC、TCP和UDP协议。实战教程：从零开始部署Ingress-Nginx步骤1：环境准备确保您的Kubernetes集群版本为v1.29.7，并且
HoRain云--浅析CoreDNS的工作机制 HoRain 云小助手贪心算法算法 CoreDNS
HoRain云小助手：个人主页⛺️生活的理想，就是为了理想的生活!⛳️推荐前些天发现了一个超棒的服务器购买网站，性价比超高，大内存超划算！忍不住分享一下给大家。点击跳转到网站。目录⛳️推荐一、插件化架构1.常见插件类型2.插件执行顺序二、动态配置（Corefile）1.配置结构2.热重载机制三、请求处理流程四、Kubernetes集成1.服务解析规则2.自动更新机制五、性能优化1.缓存加速2.并发
rancher k3s 默认应用服务，内部DNS访问域名是什么 santer_x rancher
rancherk3s默认应用服务，内部DNS访问域名是什么默认集群域名服务域名格式Rancher自身服务的域名特殊情况与注意事项示例场景在Rancher管理的K3s集群中，默认的内部DNS访问域名遵循Kubernetes的DNS规范。具体规则如下：默认集群域名K3s默认使用的集群域名为cluster.local。这一配置与Kubernetes标准一致，可通过修改Kubelet的--cluster-
2025年如何选择合适的云原生架构工具 zxzy_org 云原生架构 ai
随着云原生技术的不断发展，市场上涌现出大量的工具和平台，供开发者选择。2025年，如何在这些工具中选择适合自己项目需求的架构工具，成为技术决策的重要议题。选择合适的云原生工具，首先需要根据项目的规模、复杂度以及团队的技能水平进行综合考虑。首先，容器化技术是云原生架构的核心。Docker是最受欢迎的容器化工具，适用于大多数开发场景。如果项目规模较大，Kubernetes将成为不可或缺的容器编排平台，
在SpringBoot项目中有k8s配置，但报错柠檬编程工作室 go&k8s 运维 spring boot kubernetes 后端
如下报错一般是你没有将k8s的config拷贝到项目里，你可以将k8s主节点的config拷贝一下到项目中。2025-02-1309:27:21.873ERROR1671---[.models.V1Pod-1]i.k.c.informer.cache.ReflectorRunnable:classio.kubernetes.client.openapi.models.V1Pod#Reflector
Kubernetes源码分析之kubelet 「已注销」 runtime 操作系统运维
本节所有的代码基于1.13.4版本。启动分析Kubelet的启动参数有两种，kubeletFlags和kubeletConfig。其中，kubeletFlags与我们使用的kubelet的--参数命令保持一致；kubeletConfig通过解析特定的配置文件完成参数的配置，它们共同构成kubelet启动参数的配置。如图基本参数配置完成之后，接下来就是配置启动的Run方法。Kubelet启动的Run
5、pod 详解（kubernetes） Sundayday47 k8s kubernetes 容器云原生 harbor
pod详解（kubernetes）Pod的基础概念pause容器Pod的分类与创建自主式Pod控制器管理的Pod静态PodPod容器的分类基础容器（infrastructurecontainer）初始化容器（initcontainers）应用容器（Maincontainer）镜像拉取策略（imagePullPolicy）k8s部署harbor创建私有项目部署harbor仓库harbor登录凭据资源
红队视角出发的k8s敏感信息收集——Kubernetes API 扩展与未授权访问周周的奇妙编程 kubernetes 容器云原生
针对Kubernetes第三方组件与Operator的详细攻击视角分析，涵盖ServiceMesh、HelmReleases和DatabaseOperators的潜在风险及利用方法。攻击链示例1.攻击者通过未授权的Tiller服务部署恶意HelmChart→2.创建后门Pod并横向移动至Istio控制平面→3.提取Envoy配置发现未加密的数据库服务→4.通过MySQLOperator创建管理员账
义父们，支持我兄弟参加CSDN博客之星2024！他是一名优秀的运维工程师！ qq_42856429 运维 java 开发语言
标题：支持我兄弟参加CSDN博客之星2024！他是一名优秀的运维工程师！大家好，今天想为大家推荐一位非常优秀的技术博主——XMYX-0。他是一名专注于运维领域的开发者，尤其擅长Kubernetes（K8s）和Python自动化运维。他正在参加CSDN博客之星2024活动，希望大家能够为他投上宝贵的一票！为什么支持他？Kubernetes（K8s）领域的深度实践者在K8s领域有着丰富的实战经验。他的
从零开始入门 K8s | Kubernetes 网络模型进阶 jishulaozhuanjia
个人博客导航页（点击右侧链接即可打开个人博客）：互联网老兵带你入门技术栈本文整理自《CNCFxAlibaba云原生技术公开课》第25讲，点击直达课程页面。关注“阿里巴巴云原生”公众号，回复关键词**“入门”**，即可下载从零入门K8s系列文章PPT。导读：本文将基于之前介绍的基本网络模型，进行更深入的一些了解，希望给予读者一个更广更深的认知。首先简单回顾一下容器网络的历史沿革，剖析一下Kubern
从入门到跑路（六）k8s配置ingress-nginx m0_74825678 面试学习路线阿里巴巴 kubernetes nginx 容器
Ingress-NGINX是一个基于NGINX的KubernetesIngress控制器，旨在将外部HTTP和HTTPS流量路由到Kubernetes集群中的服务。它是Kubernetes官方推荐的Ingress控制器之一，并且广泛应用于各种生产环境中。Ingress-NGINX介绍主要作用在Kubernetes集群中，Ingress-NGINX的作用是作为IngressController来处理
Kubernetes（K8s）之DNS方案 james二次元微服务 docker kubernetes 容器云原生 dns hosts
在使用k8s过程中，有时需要配置自定义的host文件做主机名解析。如果在镜像中修改/etc/hosts文件，而容器启动初始化时，会覆盖掉该文件。就需要利用k8s自身提供的机制解决类似的问题。具体如下：1.hostAliaseshostAliases是Kubernetes中的一项功能，用于在Pod中的/etc/hosts文件中添加自定义主机名与IP地址的映射。这个功能允许开发者为每个Pod手动定义主
k8s 中的 service 如何找到绑定的 Pod 以及如何实现 Pod 负载均衡「已注销」 kubernetes 负载均衡 docker
前言Service资源主要用于为Pod对象提供一个固定、统一的访问接口及负载均衡的能力。service是一组具有相同labelpod集合的抽象，集群内外的各个服务可以通过service进行互相通信。当创建一个service对象时也会对应创建一个endpoint对象，endpoint是用来做容器发现的，service只是将多个pod进行关联，实际的路由转发都是由kubernetes中的kube-pr
【K8S系列】Kubernetes 集群中的网络常见面试题颜淡慕潇 K8S系列深入解析K8S 网络 kubernetes 云原生集群网络
在Kubernetes面试中，网络是一个重要的主题。理解Kubernetes网络模型、服务发现、网络策略等概念对候选人来说至关重要。以下是一些常见的Kubernetes网络面试题及其答案，帮助你准备面试。1.Kubernetes的网络模型是什么样的？问题：Kubernetes的网络模型是怎样的？答案：Kubernetes网络模型遵循“每个Pod都有一个唯一的IP地址”的原则。每个Pod都可以直接通
ubuntu安装k8s qq_41369135 ubuntu kubernetes linux
centos：centos：K8Sv1.28.2集群搭建-docker版-一毛丶丶-博客园centos：Kubernetes详细安装教程_kubernetes安装-CSDN博客准备工作：1、主机名解析：确保每台机器的主机名能够被解析（可以通过/etc/hosts或DNS）。#三台机子分别执行sudohostnamectlset-hostnamek8s-mastersudohostnamectlse
红队视角出发的k8s敏感信息收集——持久化存储与数据泄露周周的奇妙编程 kubernetes 容器云原生
在Kubernetes集群中，持久化存储卷如同数据的保险箱，承载着应用运行所必需的各类敏感信息。然而，从红队视角出发，这些存储卷也可能成为攻击者觊觎的目标。通过巧妙地利用配置不当或已知漏洞，攻击者能够从中收集到包括密钥、访问凭证在内的大量敏感数据，进而导致数据泄露事件的发生。攻击链示例：攻击者通过容器逃逸进入Pod→发现挂载的EBS卷并创建快照→共享快照至攻击者AWS账户→还原快照窃取数据库凭据→
Kubernetes 使用自定义资源（CRD）扩展API zhangj1125 Go kubernetes 容器 go
K8sCRD即KubernetesCustomResourceDefinition，是Kubernetes提供的一种扩展机制，允许用户在Kubernetes集群中定义和使用自定义的资源类型。通过定义CRD，用户可以在Kubernetes集群中创建、读取、更新和删除自定义资源对象，就像使用原生的Pod、Service等资源一样。本文主要介绍如何使用kubebuilder快速创建自定义资源类型。完成g
kubernetes 核心技术-Secret 咖啡の猫 kubernetes 容器云原生
在Kubernetes环境中，管理敏感信息（如密码、API密钥和证书等）的安全性至关重要。直接将这些敏感信息硬编码到容器镜像或配置文件中不仅违反了最佳实践，还可能导致严重的安全风险。为了解决这个问题，Kubernetes引入了Secret对象，它提供了一种安全地存储和使用敏感数据的方法。本文将详细介绍Secret的概念、类型以及如何在实际项目中应用。什么是Secret？基本概念Secret是Kub
Github 2025-02-13Go开源项目日报 Top10 老孙正经胡说 github 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，今日(2025-02-13统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Go项目10TypeScript项目1InnoSetup项目1Kubernetes:容器化应用程序管理系统创建周期：3618天开发语言：Go协议类型：ApacheLicense2.0Star数量：106913个Fork数量：38445次关注人数：10
Flink-k8s弹性扩缩容原理和部署步骤 spring208208 flink kubernetes 贪心算法
背景和现状目前行内提交flink作业采用Nativekubernetes模式，提交作业时会指定并行度和taskmanager使用的内存及cpu数量。这种情况下会导致在作业运行高峰可能存在资源不足问题运行低峰又会造成资源浪费，这种粗放的使用资源的模式在实时计算业务量不多的时候还可以勉强接受，而随着实时计算业务的增多，则会造成大量的资源浪费和性能瓶颈。为了使存储和计算资源得到更加合理有效的使用，能跟据
Debian1 KubernetesV1.32 NFS搭建十八点四零 k8s nfs 动态供给
1、NFS1.1服务端#服务端安装aptinstall-ynfs-kernel-server#写入共享存储目录cat>>/etc/exports<
高流量Web服务器Kubernetes架构优化完颜振江前端服务器 kubernetes
一、基础设施层优化1.节点自动扩展策略#集群自动扩缩容配置（GKE示例）apiVersion:clusterautoscaler.kubernetes.io/v1beta2kind:AutoscalingPolicymetadata:name:web-cluster-policyspec:minNodeCount:5maxNodeCount:50scaleDown:utilizationThres
人工智能爆火下，关于软件技术专业的发展思考 yzx991013 人工智能
软件技术专业作为信息技术领域的核心学科，其发展方向始终与技术进步和社会需求紧密相关。以下是软件技术专业未来发展的关键方向及学习建议：一、技术方向与前沿领域1.云原生与分布式架构方向：云原生技术（Kubernetes、Docker、Serverless）、微服务架构、分布式系统设计。原因：企业全面上云已成趋势，需要高效、弹性的云原生解决方案。学习建议：掌握AWS/Azure/GCP等云平台，学习服务
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s