idea77

spring-cloud on kubernetes 实践

spring-cloud kubernetes 实践

随着公司业务量和产品线的增加，项目越来越多，普通运维系统架构对整个软件研发生命周期的管理越来越难，效率低下，难以统一管理。近年来docker统一了容器标准，对于软件开发流程产生了深远的影响，docker可以一次打包，处处运行。过去几年Kubernetes平台发展日新月益，Kubernetes统一了容器排编王者的地位，我个人认为kubernetes可以说是对普通运维架构一次突破性的革命。利用kubrenets集群平台可以很方便的对容器服务进行集中管理，可以非常高效的对容器服务进行编排、调度、扩容、升级、回滚、监控、集中收集日志等，基本上把传统运维架构需要考虑的问题全部解决了，而devops容器化也是整个软件开发流程的必经之路，因此我们对现有老旧的运维平台进行替换，统一利用kubernetes对所有业务进行管理。

原有运维系统缺点

原有业务布署在虚拟机ecs kvm ，脚本分散，日志分散难于集中收集管理，监控无法统一，cpu、内存、磁盘资源得用率低，运维效率极低，无法集中管理。
新业务布署需要开通新的虚拟机，需要单独定制监控，各种crontab ,配置脚本，效率低下，ci-cd jenkins配置繁琐。

k8s容器化优势

利用k8s容器平台namespaces对不同环境进行区分,建产不同dev、test 、stage、prod环境,实现隔离。
通过容器化集中布署所有业务，实现一键布署所需环境业务。
统一集中监控报警所有容器服务异常状态。
统一集中收集所有服务日志至elk集群, 利用kibana面板进行分类，方便开发查日志。
基于k8s命令行二次开发，相关开发、测试人员、直接操作容器。
基于rbac对不同的环境授于不同的开发、测试访问k8s权限，防止越权。
通过jenkins 统一ci-cd编译发布过程。
项目容器化后, 整体服务器cpu、内存、磁盘、资源利用减少%50，运维效率提高%60，原来需要N个运维做的事，现在一个人即可搞定。

k8s本身是一套分布式系统，要用好会遇到很多问题，不是说三天两头就能搞定，需要具备网络、linux系统、存储，等各方面专业知识，在使用过程中我们也踩了不少坑, 我们是基于二进制方试安装，我们k8s版本为1.10，经过一段时间的实践，k8s对于我们整个开发、测试、发布、运维流程帮助非常大，值得大力推广。

网络方案选择

flanneld vxlan udp以及 hsot-gw 所有节点同步路由，使用简单，方便，稳定，k8s入门首选。
calico 基于BGP协议的路由方案，支持acl ，部署复杂，出现问题难排查。
Weave UDP广播，本机建立新的BR，通过PCAP互通，国内使用比较少。
Open vSwitch UDP广播，本机建立新的BR，通过PCAP互通，openshift 以及混合云使用比较多。

我们对各个网络组件进行过调研对比，网络方案选择的是flanneld-hostgw+ipvs，在k8s1.9之前是不支持ipvs，kube-proxy负责所有svc规则的同步，使用的iptables,一个service会产生n条iptables记录。如果svc增加到上万条，iptables-svc同步会很慢，得几分钟，使用ipvs之后，所有节点的svc由ipvs lvs来负载，更快，更稳定。而且简单方便，使用门槛低， host-gw会在所有节同步路由表，每个容器都分配了一个IP地址，可用于与同一主机上的其他容器进行通信。对于通过网络进行通信，容器与主机的IP地址绑定。flanneld-hostgw性能接近calico，相对来说falnneld配置布署比calico简单很多。顺便提下flanneld-vxlan这种方式，需要通过udp封包解包，效率较低，适用于一些私有云对网络封包有限制，禁止路由路由表添加等有限制的平台。

flanneld 通过为每个容器提供可用于容器到容器通信的IP来解决问题。它使用数据包封装来创建跨越整个群集的虚拟覆盖网络。更具体地说，flanneld为每个主机提供一个IP子网（默认为/ 24），Docker守护程序可以从中为每个主机分配IP。
flannel使用etcd来存储虚拟IP和主机地址之间的映射。一个flanneld守护进程在每台主机上运行，并负责维护ETCD信息和路由数据包。
在此提一下，在使用flannled使用过程中遇到过严重bug 即租约失效，flanneld会shutdown 节点网络组件，节点网络直接崩掉，解决办法是设置永久租期：https://coreos.com/flannel/docs/latest/reservations.html#reservations

传统业务迁移至k8s遇到的问题和痛点，devops遇到问题？

使用k8s会建立两套网络，服务之间调用通过svc域名，默认网络、域名和现有物理网络是隔离的，开发，测试，运维无法像以前一样使用虚拟机一样，postman ip+端口调试服务，网络都不通，这些都是问题。

pod网络和物理网络不通，windows办公电脑、linux虚拟机上现有的业务和k8s是隔离的。
svc网络和物理网络不通，windows办公电脑、linux虚拟机上现有的业务和k8s是隔离的。
svc域名和物理网络不通，windows办公电脑、linux虚拟机上现有的业务和k8s是隔离的。
原有nginx 配置太多的location 几百层，不好迁移到ingress-nginx，ingress只支持简单的规则。
svc-nodeport访问，在所有node上开启端口监听，占用node节点端口资源，需要记住端口号。
ingress http 80端口，必需通过域名引入，ingress http 80端口必需通过域名引入，原来简单nginx的location可以通过ingress引入。
tcp–udp–ingress tcp udp 端口访问需要配置一个ingress lb，很麻烦，要先规划好lb节点同样也需要仿问lb端口。
原有业务不能停，继续运行，同时要能兼容k8s环境,和k8s集群内服务互相通讯调用，网络需要通。

传统虚拟机架构我们只需要一个地址+端口直接访问调试各种服务，k8s是否能做到不用改变用户使用习惯，无感知使用呢？答案是打通devops全链路，像虚拟机一样访部k8s集群服务 , 我们打通k8s网络和物理网理直通，物理网络的dns域名直接调用k8s-dns域名服务直接互访，所有服务互通。公司原有业务和现有k8s集群无障碍互访。

配置一台k8s node节点机做路由转发，配置不需要太高，布署成路由器模式,所有外部访问k8s集群流量经该节点, 本机ip: 192.168.2.71 。

vim /etc/sysctl.conf
net.ipv4.ip_forward = 1

设置全网路由通告,交换机或者linux、windows主机加上静态路由，打通网络。

route add -net 172.20.0.0 netmask 255.255.0.0 gw 192.168.2.71
route add -net 172.21.0.0 netmask 255.255.0.0 gw 192.168.2.71

增加dns服务器代理，外部服务需要访问k8s svc域名，首先需要解析域名，k8s服务只对集群内部开放，此时需要外部要能调用kube-dns 53号端口，所有办公电脑，业务都来请求kube-dns肯定撑不住，实时上确实是撑不住，我们做过测试，此时需要配置不同的域名进行分流策略，公网域名走公网dns,内部.svc.cluster.local走kube-dns。

建立dns代理服务器，ingress建立一个nginx-ingress服务反代kube-dns,ingress-nginx绑定到dns节点运行，在节点上监听 dns 53 端口。

[root@master1 kube-dns-proxy-1.10]# cat tcp-services-configmap.yaml
kind: ConfigMap
apiVersion: v1
metadata:
  name: tcp-services
  namespace: ingress-nginx
data:
  53: "kube-system/kube-dns:53"
[root@master1 kube-dns-proxy-1.10]# cat udp-services-configmap.yaml
kind: ConfigMap
apiVersion: v1
metadata:
  name: udp-services
  namespace: ingress-nginx
data:
  53: "kube-system/kube-dns:53"
[root@master1 kube-dns-proxy-1.10]# cat ingress-nginx-deploy.yaml
apiVersion: extensions/v1beta1
kind: Deployment
metadata:
  name: nginx-ingress-controller-dns
  namespace: ingress-nginx
spec:
  replicas: 1
  selector:
    matchLabels:
      app: ingress-nginx-dns
  template:
    metadata:
      labels:
        app: ingress-nginx-dns
      annotations:
        prometheus.io/port: '10254'
        prometheus.io/scrape: 'true'
    spec:
      hostNetwork: true
      serviceAccountName: nginx-ingress-serviceaccount
      containers:
        - name: nginx-ingress-controller-dns
          image: registry-k8s.novalocal/public/nginx-ingress-controller:0.12.0
          args:
            - /nginx-ingress-controller
            - --default-backend-service=$(POD_NAMESPACE)/default-http-backend
           # - --configmap=$(POD_NAMESPACE)/nginx-configuration
            - --tcp-services-configmap=$(POD_NAMESPACE)/tcp-services
            - --udp-services-configmap=$(POD_NAMESPACE)/udp-services
            - --annotations-prefix=nginx.ingress.kubernetes.io
          env:
            - name: POD_NAME
              valueFrom:
                fieldRef:
                  fieldPath: metadata.name
            - name: POD_NAMESPACE
              valueFrom:
                fieldRef:
                  fieldPath: metadata.namespace
          ports:
          - name: http
            containerPort: 80
          #- name: https
          #  containerPort: 443
          livenessProbe:
            failureThreshold: 3
            httpGet:
              path: /healthz
              port: 10254
              scheme: HTTP
            initialDelaySeconds: 10
            periodSeconds: 10
            successThreshold: 1
            timeoutSeconds: 1
          readinessProbe:
            failureThreshold: 3
            httpGet:
              path: /healthz
              port: 10254
              scheme: HTTP
            periodSeconds: 10
            successThreshold: 1
            timeoutSeconds: 1
      nodeSelector:
        node: dns

最简单快捷的方式是安装dnsmasq，当然你也可以用bind ,powerdns,croedns等改造，上游dns配置为上一步骤增加nginx-ingress dns的地址，所有办公，业务电脑全部设置dns为此机,dnsmasq.conf 配置分流策略

no-resolv
server=/local/192.168.1.97
server=114.114.114.114

完成以上步骤 k8s podip svcip svc域名和办公，现有ecs、虚拟机完美融合，无缝访问，容器网络问题搞定。
windows访问k8s svc畅通无组，开发测试，完美无缝对接。

ingress-nginx 服务入口接入

服务发布后最终对接的是用户，用户访问k8s服务需要通过nginx或其它http服务器接入，对于服务接入我们同时使用两种不同的方案,取决于nginx location 复杂度，location规则简单的我们使用第一种方案，由于各种问题，location复杂我们使用第二种方案。

client-------ingress-nginx-----upstream----podip，对于ingress-nginx官方使用的原始方案，先配置ingress规则路由，ingress对接不同的svc-dns域名，ingress自动发现后端 podip ,通过upstream 负载不同的后端podip ,不同的域名路由到不同的k8s后端podip, 用户客户端访问流量会负载到不同的pod上。
client------nginx-------upstream------svc-----podip 改造现有nginx兼容k8s, 对接k8s-svc服务。对于nginx location规则过多，不能很好的兼容nginx-ingress导致使用k8s非常困难，难以普及，在不变更现有nginx配置的情况下如何对接k8s这是一个问题，经过前面网络打通的步骤我们所有网络的问题都已解决。现在只需改动很小部分即可兼容，由于k8s podip是漂移的，ip总是会变的，nginx只能是对接svc域名才能持久，但是nginx解析域名有个bug，只解析一次，如果在此期间删除了yaml,nginx会找不到后端svcip，所以这里要设置代理变量set $backend，设置resolver的dns为代理dns地址，设置解析域名时间和变量解决该问题。

    location /tomcat/ {
            resolver 192.168.1.97 valid=3600s;
            set $backend "tomcat.dac-prod.svc.cluster.local";
            error_log  logs/dac_error.log  error;
            access_log  logs/dac_access.log  main;
            proxy_set_header X-real-ip $remote_addr;
            proxy_read_timeout 300;
            proxy_connect_timeout 300;
            proxy_redirect     off;
            client_max_body_size 100M;
            proxy_pass http://${backend}:9090;
    }

大家可能担心eureka和k8s-svc有冲突，spring-cloud本身自带服务发现eureka，组件之间的调用通过eureka注册调用，其实你直接布署就行了，eureka和service没任何冲突，和普通java应用一样用。

监控方案

目前使用的k8s官方的heapster，monitoring-influxdb-grafana +自定议脚本+自定义grafana面板可以灵活报警
监控面板按业务环境dev/test/stage/prod/对cpu/内存/网络等分类进行展示
节点资源监控

pod cpu、内存，网络等监控

监控脚本，可以很灵活跟据设定参数进行钉钉报警，报告有问题的pod,node，自动处理有问题的服务。

#!/bin/bash
#最大内存排除的node节点
exclude_node="node7|node1|node2|node3|master1"
exclude_pod="redis|kafka|mongo|zookeeper|Evicted|Completed"
#node使用的最大报警内存%比
node_mem_max="100"
#node最大使用cpu百分比
node_cpu_max="80"
#pod使用的最大报警内存MB
pod_mem_max="4096"
pod_top="5"
pod_top_cpu="10"
#pod的启动错误时间，单位为秒s
pod_error_m_time="120"
pyding="$HOME/k8s-dev/dingd-zabbix.python"
#pod的内存以及cpu的使用状态
pod_mem=$(/usr/local/bin/kubectl top pod --all-namespaces  |sort -n -k4 )
#node的内存使用状态
node_status=$(/usr/local/bin/kubectl top node|egrep -v "${exclude_node}" |egrep -v "MEMORY%")
#pod的运行状态
pod_status=$(/usr/local/bin/kubectl get pod --all-namespaces -o wide|grep -v NAMESPACE)
#设定有问题的pod存取文件路径
alert_error_pod="/tmp/alert-error-pod.txt"
#设定最大内存占用节点上pod的文件列表路径
alert_list="/tmp/alert-mem-list.txt"
#监控cpu百分比文件输出路径
alert_node_cpu_list="/tmp/alert_node_cpu_list.txt"
#取node内存的百分比数字值
#node_pre_mem=$(echo "${node_mem}"|awk '{print $5}'|sed -e "s/%//g")
#监控node的内存百分比，列出占用内存最高的应用并重启top5应用
node_mem_mon () {
        echo "${node_status}" |awk '{print $1,$5}'|sed -e "s/%//g" |while read node_name node_mem_status;do
        #echo $node_name $node_mem_status
                if [ "${node_mem_status}" -gt "${node_mem_max}" ];then
                         >${alert_list}
                        #找到该节点上的所有的pod名
                        find_pod=$(echo "${pod_status}"|egrep ${node_name}|awk '{print $2}')
                        #找到所有节点倒排序使用最大的内存的pod列表
                        for i in $(echo "${find_pod}");do
                                echo "${pod_mem}"|grep $i  >>${alert_list}
                        done
                        date_time=`date +'%F-%T'`
                        echo -e "\n${node_name}最大内存超过 %${node_mem_max} 以下pod应用将被重启 ------------------\n"
                        cat ${alert_list}|sort -n -k 4|tail -${pod_top}
                        python ${pyding}  "`echo -e "\n ${date_time} ${node_name}当前内存为${node_mem_status}%,最大内存超过 %${node_mem_max} 以下pod应用将被重启 ------------------\n" ;cat ${alert_list}|sort -n -k 4|egrep -v "$exclude_pod"|tail -${pod_top}` "
                        cat ${alert_list}|sort -n -k 4|egrep -v "$exclude_pod"|tail -${pod_top}|egrep -v "应用将被重启" | awk '{print  "/usr/local/bin/kubectl delete pod  "$2" -n "$1" " | "/bin/bash"}'
                fi
        done
}

钉钉报警图

k8s集群 yaml容器编排管理

k8s通过yaml对容器进行管理，yaml配置编排文件是管理整个容器生命周期重要的一部份，管理好yaml非常重要。我开发了一套类似于helm的模板的脚本框架，用于所有环境的yml初始化工作，自己写脚本的好处就是可以灵活控制，比如哪个组件要挂载存储，共享卷，要配置私有hosts等，我可以一次性定制好，初始化时只需要init-yml直接批量搞定，不需要每个yml单独去修改，之后就是kubectl create 直接用。
容器编yaml排文件按空间环境dev-test-stage-prod进行模板base分类,复制一套模板即可生它其它各环境, 容器编排按业务类型模块配置conf app-list。

[root@master1 config]# ls
  public-dev_app_list.conf      public-test-base.yml     
  public-dev-base.yml           sms-test_app_list.conf   
  public-pretest_app_list.conf  sms-test-base.yml        
  public-pretest-base.yml       wbyh-dev_app_list.conf   
  public-stage_app_list.conf    wbyh-dev-base.yml        
  public-stage-base.yml         wbyh-stage_app_list.conf 
  public-test_app_list.conf     wbyh-stage-base.yml

通过k8s核心排编脚本进行init-yml初始化对应环境, 生成所有pod 的yaml排编文件，每套环境可以生成环境对应的 mysql redis kafka mongo等，直接启动即可调用。

[root@master1 k8s-dev]# ./k8s wbyh-stage init-yml
/root/k8s-dev/config
[root@master1 k8s-dev]# tree
wbyh-stage/
├── app
│   ├── dac-api-center
│   │   └── dac-api-center.yml
│   ├── dac-app-web
│   │   └── dac-app-web.yml
│   ├── dac-config-server
│   │   └── dac-config-server.yml
│   ├── dac-eureka-server
│   │   └── dac-eureka-server.yml
│   ├── dac-task
│   │   └── dac-task.yml
│   ├── dac-task-apply
│   │   └── dac-task-apply.yml
│   ├── dac-task-h5
│   │   └── dac-task-h5.yml
│   ├── dac-web
│   │   └── dac-web.yml
│   ├── dac-message-center
│   │   └── dac-message-center.yml
│   ├── dac-quartz-jfdata
│   │   └── dac-quartz-jfdata.yml
│   ├── dac-quartz-mach
│   │   └── dac-quartz-mach.yml
│   ├── dac-quartz-dac
│   │   └── dac-quartz-dac.yml
│   ├── dac-resources-center
│   │   └── dac-resources-center.yml
│   ├── dac-resources-item
│   │   └── dac-resources-item.yml
│   ├── dac-usercenter-web
│   │   └── dac-usercenter-web.yml
│   └── tomcat
│       └── tomcat.yml
└── stateful-sets
    ├── kafka
    │   ├── 10kafka-config-0420yml
    │   ├── 10kafka-config.yml
    │   ├── 20dns.yml
    │   └── 50kafka.yml
    ├── mongo
    │   └── mongo-statefulset.yml
    ├── redis
    │   ├── primary.yml
    │   └── redis-configmap.yml
    └── zookeeper
        ├── 10zookeeper-config.yml
        ├── 30service.yml
        └── 50pzoo.yml

22 directories, 26 files

通过k8s 脚本调用kubectl 可以直接批量创建该空间下所有服务

[root@master1 k8s-dev]# ./k8s wbyh-stage create_all
/root/k8s-dev/config
configmap "dac-eureka-server-filebeat-config" created
service "dac-eureka-server" created
deployment.extensions "dac-eureka-server" created
configmap "dac-config-server-filebeat-config" created
service "dac-config-server" created
deployment.extensions "dac-config-server" created
configmap "tomcat-filebeat-config" created
service "tomcat" created
deployment.extensions "tomcat" created

所有代码存入gitlab做版本管理，即基础设施即代码

    add svn-jar-version ll item

commit 29dc05530d839c826130eef81541ce96a155107b
Author: idea77 <[email protected]>
Date:   Thu Sep 20 16:11:00 2018 +0800

    mod ossfs to /Rollback/oss

commit 880bcd9483a6ee1f5ca440fef017b30ba7cd14fe
Author: idea77 <[email protected]>
Date:   Wed Sep 19 16:57:43 2018 +0800

存储方案

目前公司一部份用应用挂载的卷为nfs，读写要求不高的可以配置nfs, 一部份要求比较高的用的ceph，如mysql kafka之类的就需要ceph支撑,对于持需要持久化的db类型存储的管理用storageclass 存储类对接管理，很方便自动建立存储卷pv-pvc对接，共享卷类型可以直接挂载卷。

nfs配置需要在每个node节点安装nfs-utils ,配置yml, 注意centeos7 低版本nfs-server有bug导致服务器重启，升到4以上内核解决问题。

      - name: tomcat-img
        nfs:
          path: /home/k8s-nfs-data/dac-test-tomcat-img
          server: 192.168.8.30

ceph k8s node节点安装ceph-common,配置storageclass

ceph-class.yaml
apiVersion: storage.k8s.io/v1beta1
kind: StorageClass
metadata:
   name: ceph-db
provisioner: kubernetes.io/rbd
parameters:
  monitors: 192.168.1.31:6789
  adminId: admin
  adminSecretName: ceph-secret
  adminSecretNamespace: kube-system
  pool: rbd 
  userId: admin
  userSecretName: ceph-secret

jenkins ci-cd编译发布阶段

jenkins -ci-cd 控制台完成整个jar包编译，dockerfile编译、docker push 、k8s deployment 镜像滚动升级功能。
jenkins Manage and Assign Roles 授权不同的开发、测试组不同的用户权限，隔离不同的项目编译发布权限。

目前没有完全用上流水线服务，完全流水线需要构建不报错，一报错也就无法完成，不是很灵活，构建jar包和发布docker-image是分开的，需要跟据公司业务来。
编译阶段我们做了钉钉通知，每个项目拉了自己的群，编译jar包是否成功整个组都有通知，同样update也是一样发布是不成功都有提示，群内可见。

目前我们k8s容器启动分为两种架构

容器发布后启动基础jdk镜相，wget去http服务器下载对应目录编译好的jar包，然后启动，即无镜像模式，适合频繁发布类型的业务，push jar to oss有一部份业务是跑虚拟机，需要jar包，oss可以做共享。
容器发布按照标准的方式打image update-imae模式，适合出错及时回滚的业务，即编译dockerfile-push-docke-image-update-deployment

build-$namespace 通过空间变量名拟写对应脚本，基本是做一个通用模板base，复制生成对应项目的build.sh供jenkins传参调用,每套环境有自己的基础镜像base，基础镜像就是打入jdk等一些私有的配置，编译的时候在基础镜像上加上jar包。

if [[ $MY_POD_NAMESPACE =~ -dev ]];then
    #定义启动基础镜相
    base_image="registry-k8s.novalocal/public/yh-centos7-jdk-1.8"
    #定义APP镜像仓库地址
    image_path="registry-k8s.novalocal/xl_public/$MY_POD_NAMESPACE/${APP}"
elif [[ $MY_POD_NAMESPACE =~ "-test" ]];then
    #定义启动基础镜相
    base_image="registry-k8s.novalocal/public/yh-centos7-jdk-1.8"
    #定义APP镜像仓库地址
    image_path="registry-k8s.novalocal/xl_public/$MY_POD_NAMESPACE/${APP}:${date_time}"
elif [[ $MY_POD_NAMESPACE =~ -stage ]];then
    #定义启动基础镜相
    base_image="registry-k8s.novalocal/xl_public/wbyh-base/centos7-jdk-1.8"
    #定义idc镜相仓库路径
    image_path="registry.cn-hangzhou-idc.com/xl_dac/wbyh-stage-${APP}:${date_time}"
    vpc_image_path="registry-vpc.cn-hangzhou-idc.com/wbyh-stage-${APP}:${date_time}"
 fi
       #初始化dockerfile
        init_dockerfile () {
                #生成Dockerfile
                cd /Rollback/build-docker/
                echo "" >$MY_POD_NAMESPACE/${APP}/Dockerfile
                #生成基础镜像地址
                echo -e "${base_image}"  >>${MY_POD_NAMESPACE}/${APP}/Dockerfile
                #生成docker作者
                echo -e "MAINTAINER [email protected]" >>${MY_POD_NAMESPACE}/${APP}/Dockerfile
                echo -e "USER root"  >>${MY_POD_NAMESPACE}/${APP}/Dockerfile
                #获取启动脚本
                \cp -f  start-sh/${MY_POD_NAMESPACE}-sh/${APP}.sh  $MY_POD_NAMESPACE/${APP}/
                echo -e "ADD ./${APP}.sh /home/deploy/" >>${MY_POD_NAMESPACE}/${APP}/Dockerfile
                #添加 jar包到/home/deploy/
                echo -e "${add_jar}" >>${MY_POD_NAMESPACE}/${APP}/Dockerfile
                #暴露端口
                echo -e "EXPOSE 9090"  >>${MY_POD_NAMESPACE}/${APP}/Dockerfile
                #添加docker入口启动文件
                \cp -f  start-sh/templates/docker-entrypoint.sh $MY_POD_NAMESPACE/${APP}/
                echo -e "ADD ./docker-entrypoint.sh  /docker-entrypoint.sh" >>$MY_POD_NAMESPACE/$APP/Dockerfile
                echo -e "RUN  chown -R deploy:deploy /home/deploy &&  chown -R deploy:deploy /docker-entrypoint.sh && ls -t --full /home/deploy " >>$MY_POD_NAMESPACE/$APP/Dockerfile
                echo -e "USER deploy"  >>$MY_POD_NAMESPACE/$APP/Dockerfile
                echo -e 'ENTRYPOINT ["/docker-entrypoint.sh"]' >>$MY_POD_NAMESPACE/$APP/Dockerfile

                if [[ ${MY_POD_NAMESPACE} =~ -prod ]];then
                        docker images |grep xl_prod|grep ${APP}|awk '{print $1":"$2}'|xargs docker rmi -f
                else
                        docker images |grep min-test|grep ${APP}|awk '{print $1":"$2}'|xargs docker rmi -f
                fi
                name="${MY_POD_NAMESPACE},build ${image_path}-${svn_version}"
                cd /Rollback/build-docker/$MY_POD_NAMESPACE/$APP/
                docker build  --no-cache -t ${image_path}-${svn_version} .
                check
                if [[ $MY_POD_NAMESPACE =~ -stage  ]];then
                        #vpc专有镜相地址修改到yml文件
                        sed -i "[email protected]/xl_public\(.*\)@${vpc_image_path}-${svn_version}@g"    /home/deploy/k8s-dev/${MY_POD_NAMESPACE}/app/$APP/$APP.yml

                elif [[ $MY_POD_NAMESPACE =~ -test  ]];then
                        sed -i "[email protected]/xl_public/\(.*\)@${image_path}-${svn_version}@g"    /home/deploy/k8s-dev/${MY_POD_NAMESPACE}/app/$APP/$APP.yml

                fi

                name="push ${APP}"
                docker push  ${image_path}-${svn_version}
                check
}

jenkins 触发

build-----push------updae-deployment-----image 整个过程是流水线形式，一次性连续完成，完成后通过机器人通知到各业务组，中间有任何问题，机器人会告诉我们在哪个阶段出错，很方便排查问题，镜像的版本号跟据git或svn的版本号来获取，然后加上当前时间戳，在jar包编译阶段版本号会写入特定文件，jenkins会跟据当前编译的版本生成对应的docker镜像版本。

k8s 日志方案

普通虚拟机日志分散，难管理，需要登陆虚拟机一个个查看，k8s-docker可以很方便帮我们收集管理日志，日志方案有几种。

应用打到docker stdout 前台输出，docker输出到/var/lib/containers, 通过filebeat、fluentd 、daemonsets组件收集，这种对于小量日志还可以，大量日志性能很差，写入很慢.
pod挂载host-path 把日志打到宿主机，宿主机启动filebeat， fluentd 、daemonsets 收集,无法判断来自哪个容器，pod namespaces。
pod的yml中定义两个 container ,同时启动一个附加的filebeat，两个container挂载一个共享卷来收集日志
我们用的第三种方案，通过一个附加容器filebeat来收集所有日志, filebeat–kakfa–logstash–es,自定义编译filebeat 镜相，为filebeat打上podip空间svc名等标签，方便识别来自哪个容器，哪个namespace，配置config-map以及yml。

filebeat----kafkacluster-----logstash----es

apiVersion: v1
kind: ConfigMap
metadata:
  namespace: dac-prod
  name: dac-config-server-filebeat-config
data:
  filebeat.yml: |
    filebeat.prospectors:
    - input_type: log
      fields:
        namespace: dac-prod
        service-name: dac-config-server
        #pod-ip:
      paths:
        - "/mnt/*.log"
      multiline:
        pattern: '^[0-9]{4}-[0-9]{2}-[0-9]{2} [0-9]{2}:[0-9]{2}:[0-9]{2}.[0-9]{3}'
        negate: true
        match: after
    #output.elasticsearch:
    output.kafka:
      hosts: ["10.31.222.108:9092", "10.31.222.109:9092", "10.31.222.110:9092"]
      topic: applog
      required_acks: 1
      compression: gzip
    # Available log levels are: critical, error, warning, info, debug
    logging.level: info
---
apiVersion: v1
kind: Service
metadata:
  name: dac-config-server
  namespace: dac-prod
spec:
  ports:
  - port: 9090
    name: http
  selector:
    app: dac-config-server
---
apiVersion: apps/v1
kind: Deployment
metadata:
  name: dac-config-server
  namespace: dac-prod
  labels:
    app: dac-config-server
spec:
  replicas: 1
  strategy:
    rollingUpdate:
      maxSurge: 1
      maxUnavailable: 1
    type: RollingUpdate
  selector:
    matchLabels:
      app: dac-config-server
  template:
    metadata:
      labels:
        app: dac-config-server
    spec:
      affinity:
        podAntiAffinity:
          requiredDuringSchedulingIgnoredDuringExecution:
          - labelSelector:
              matchExpressions:
              - key: app
                operator: In
                values:
                - dac-config-server
            topologyKey: "kubernetes.io/hostname"
      imagePullSecrets:
        - name: myregistrykey
      containers:
      - image: registry-vpc.cn-hangzhou-idc.com/dac-prod-dac-config-server:v1
       name: dac-config-server
        imagePullPolicy: Always
        resources:
          limits:
            cpu: 4000m
            memory: 4096Mi
          requests:
            cpu: 150m
            memory: 1024Mi
        env:
        - name: APP
          value: dac-config-server
      #public
        - name: JAVA_OPTS
          value: "-Xms4g -Xmx4g"
        - name: CONTAINER_CORE_LIMIT
          value: "4"
        - name: POD_IP
          valueFrom:
            fieldRef:
              fieldPath: status.podIP
        - name: MY_POD_NAMESPACE
          valueFrom:
            fieldRef:
              fieldPath: metadata.namespace
        readinessProbe:
          tcpSocket:
            port: 9090
          initialDelaySeconds: 60
          timeoutSeconds: 3
        livenessProbe:
          tcpSocket:
            port: 9090
          initialDelaySeconds: 60
          timeoutSeconds: 3
        ports:
        - name: http
          containerPort: 9090
        volumeMounts:
        #- name: opt-data
          #mountPath: /home/deploy
        - name: logs
          mountPath: /home/deploy/logs
        - name: host-time
          mountPath: /etc/localtime
          readOnly: true
      - image: registry-vpc.cn-hangzhou-idc.com/dac_prod/filebeat:6.0.0
        name: filebeat
        imagePullPolicy: Always
        env:
        - name: POD_IP
          valueFrom:
            fieldRef:
              fieldPath: status.podIP
        volumeMounts:
        - name: logs
          mountPath: /mnt
        - name: filebeat-conf
          mountPath: /etc/filebeat
        - name: host-time
          mountPath: /etc/localtime
          readOnly: true
      nodeSelector:
        node: public
      volumes:
      - name: logs
        emptyDir: {}
      - name: filebeat-conf
        configMap:
          name: dac-config-server-filebeat-config
      #- name: opt-data
        #nfs:
          #path: /home/k8s-nfs-data/public-dev-base
          #server: 10.10.1.30
      - name: host-time
        hostPath:
          path: /etc/localtime

filebeat收集日志打上关键字标签，namespace ，svc，podip 等

kibana 集中日志展示，建立dashboard分类，用户可以按namespce 分类不同环境，过滤选择查看不同模块的应用日志

RBAC+二次开发k8s脚本

简化kubectl 命令, 提供给研发团队使用。实际上这里功能和jenkins以及kibana上是重复的，但是必需考虑到所有团队成员的使用感受，有人喜欢命令行，有人喜欢界面，简单好用就够。我打个比方，比如看日志，有人可能喜欢用命令行tail -f 看日志，用grep过滤等，有人喜欢用kibana看，那怎么办？于就有了两种方案，喜欢用图形界面的就去jenkins或kibana，你想用命令行的就给你命令行，满足你一切需求。统一集中通过指定的机器提供给开发、测试、运维、使用，方便调试，排障。通过统一的入口可以直接对容器进行服务创建，扩容，重启，登陆，查看日志，查看java启动参数等，方便整个团队沟通。

在这里我们通过k8s rbac 授权身份认证生产证书key kube-config key，授于不同项目组不同的管理权限，不同的项目组只有自己项目的权限，权限做了细分，不同研发、测试团队互不干扰。

[deploy@185 app]# k8s dac-test  get_all
NAME                          READY     STATUS    RESTARTS   AGE       IP             NODE
accountant-3536198527-dtrc9   2/2       Running   0          21h       172.20.1.5     node3.k8s.novalocal
analyzer-1843296997-vz9nc     2/2       Running   0          21h       172.20.87.15   node5.k8s.novalocal
api-1260757537-gxrp2          2/2       Running   0          21h       172.20.71.6    k8s-monitor.novalocal
calculator-1151720239-pr69x   2/2       Running   0          21h       172.20.1.12    node3.k8s.novalocal
consul-0                      1/1       Running   0          21h       172.20.87.3    node5.k8s.novalocal
dispatcher-2608806384-kp433   2/2       Running   0          21h       172.20.4.6     lb1.k8s.novalocal
geo-1318383076-c7th2          2/2       Running   0          5m        172.20.94.6    node6.k8s.novalocal
greeter-79754259-s3bs2        2/2       Running   0          21h       172.20.19.5    jenkins-master.k8s.novalocal
kafka-0                       1/1       Running   0          21h       172.20.1.4     node3.k8s.novalocal
mqtt-0                        1/1       Running   0          21h       172.20.94.15   node6.k8s.novalocal
mysql-0                       2/2       Running   0          21h       172.20.47.7    elk-k8sdata.novalocal
pusher-2834145138-lfs21       2/2       Running   0          21h       172.20.19.6    jenkins-master.k8s.novalocal
recovery-261893050-70s3w      2/2       Running   0          21h       172.20.32.13   node4.k8s.novalocal
redis-0                       1/1       Running   0          21h       172.20.4.5     lb1.k8s.novalocal
robot-1929938921-6lz6f        2/2       Running   0          21h       172.20.47.8    elk-k8sdata.novalocal
scheduler-3437011440-rsnj6    2/2       Running   0          21h       172.20.5.10    db.k8s.novalocal
valuation-2088176974-5kwbr    2/2       Running   0          21h       172.20.94.20   node6.k8s.novalocal
zookeeper-0                   1/1       Running   0          21h       172.20.4.4     lb1.k8s.novalocal

注意，如何操作用户自己有权限的空间，必需填写default-namespace.conf
注意，当gitlab master分支有合并的时候，目前我们ci自动会构建编译最新的jar版本，推送至nexus仓库，k8s容器里的jar包可以指定更新

k8s  init-yml        #初始化生成用户自己本人的yml文件
k8s  get_all         #查看用户自己本人空间下的所有运行的容器
k8s  create_all      #创建用户自己本人所有服务
k8s  delall_app      #删除本人空间下所有app服务，除基础服务mysql、 consul、 kafka、 redis、 zookeeper、mqtt 以外的所有服务
k8s  apply  api      #修改了用户自己本人yml配置文件，应用配置生效
k8s  create api      #用户自己本人空间下创建一个api服务
k8s  delete api      #用户自己本人空间下删除一个api服务
k8s  scale  api 2    #用户自己本人空间下把api服务扩容成2个pod
k8s  login  api      #用户本人空间下登录api所在的docker容器

k8s  logs   api      #用户自己本人空间用tail -f 命令的方式查看容器内/home/deploy/api/logs/api.log 的日志
k8s  error-logs api  #用户自己本人空间用tail -f 命令的方式查看容器内/home/deploy/api/logs/api.error.log 的日志
k8s  clean api       #如果编译出错，在用户自己本人空间用gradlew clean清理命令的方式清理编译
k8s  push_jar        #更新本人空间下所有容器的jar包版本，重启所有容器，默认拉取backend / push-envelope -git最终版本，该版本为合并编译成功后的最新版本号
k8s  push_jar  20170927-1731   #选择指定的jar版本号20170927-1731 进行更新 ，重启所有容器
k8s  reinit-mysql    #重新更新所有容器jar版本后api无法启动，清空用户空间下的数据库，重新创建导入数据

批量操作
k8s  scale  api-geo 2 #在dev用户下把api和geo 扩容
k8s  delete api-geo   #在dev用户下删除api 和geo服务
k8s  create api-geo   #在dev用户下创建api和geo服务

所有人员通用命令，要操作某个用户的资源，必需先生成所需要的yml文件
但是必需指定第二个参数名dev test stage等。

k8s stage init-yml       #初始化生成stage用户的yml文件 注意要操作stage用户的容器要先成配置文件
k8s test init-yml        #初始化生成test空间的yml文件
k8s dev init-yml         #初始化生成dev空间的yml文件
k8s dev  get_all         #查看dev用户空间下的所有运行的容器
k8s dev  create_all      #创建dev空间下所有服务
k8s dev  delall_app       #删除dev空间下的app服务，除基础服务mysql、 consul、 kafka、 redis、 zookeeper、mqtt 以外的所有服务
k8s dev  apply  api      #修改了yml配置文件，应用配置生效
k8s dev  create api      #dev空间下创建一个api服务
k8s dev  delete api      #dev空间下删除一个api服务
k8s dev  scale  api 2    #dev空间下把api服务扩容成2个pod
k8s dev  login  api      #dev空间下登录api所在的docker容器
k8s dev  logs   api      #dev空间用tail -f 命令的方式查看容器内/home/deploy/api/logs/api.log 的日志
k8s dev  error-logs api  #dev空间用tail -f 命令的方式查看容器内/home/deploy/api/logs/api.error.log 的日志
k8s dev  push_jar        #更新dev空间下所有容器的jar包版本，重启所有容器，默认拉取backend /-git最终版本，该版本为合并编译成功后的最新版本号
k8s dev  push_jar  20170927-1731   #选择指定的jar版本号20170927-1731 进行更新 ，重启所有容器
k8s dev  clean api       #如果编译出错，dev用户空间用gradlew clean清理命令的方式清理编译
k8s dev  reinit-mysql    #重新更新所有容器jar版本后api无法启动，清空dev空间下的数据库，重新创建导入数据

批量操作
k8s dev  scale api-geo 2  #在dev空间把api和geo 扩容
k8s dev  delete api-geo  #在dev空间删除api 和geo服务
k8s dev  create api-geo  #在dev空间下创建api和geo服务


管理员专用命令，注意管理员第二个参数一定要填
k8s dev  create_rsync    #创建dev空间的rsync配置
k8s dev  create_passwd   #创建dev空间的解压密码下发密钥
k8s dev  create   rbac   #创建dev空间的集群授权认证
k8s dev  delete   rbac   #删除dev空间的集群授权认证
k8s dev  delete_all      #删除dev空间下所有服务

k8s集群规划和问题总结

集群资源规划request +limit+maxpods+eviction参数需要计算好再配置，配置有问题可能导致资源利用均，一部份利用过高，一部份利用过低。
k8s node节点一定要留有足够的磁盘空间，跟据pod个数和image大小决定磁盘空间数。
jdk无法获取正确的cpu数，默认获取的是宿主机cpu，会致创建的线程数过多，系统崩溃，可以通过：https://github.com/obmarg/libsysconfcpus.git 解决。

if [ "x$CONTAINER_CORE_LIMIT" != "x" ]; then
  LIBSYSCONFCPUS="$CONTAINER_CORE_LIMIT"
  if [ ${LIBSYSCONFCPUS} -lt 2 ]; then
     LIBSYSCONFCPUS=2
  fi
  export LIBSYSCONFCPUS
fi
export LD_PRELOAD="/usr/local/lib/libsysconfcpus.so:$LD_PRELOAD"

nfs-server一定要用async 充份利用缓存加快写入速度，注意内核版本bug。
应用产生的日志必需要设置轮转数和大小，防止过大日志撑暴宿主机磁盘。
发布版本越多，随着下载镜像版本越来越多，磁盘会撑爆，合理配置kubelet image gc参数，配置gc回收优化磁盘空间。
docker-ce以前的版本经常会出现docker 失控，使用过程中整个节点容器无法删除，无法创建，只能重启，对业务影响很大，建议全部更新到18-ce版本，和k8s容性更好。
节点的亲和性和反亲和Affinity一定要提前规划好，为了达到高可用目的，多副本必需配置。
应用异常检测，跟据实际情况配置探针readinessProbe,livenessProbe 防止应用假死，k8s提前剔除有问题的pod容器。

你可能感兴趣的:(k8s)

ARM64环境部署EFK8.15.3收集K8S集群容器日志 llody_55 kubernetes 容器云原生运维 es java elasticsearch
环境规划主机IP系统部署方式ES版本CPU架构用户名密码192.168.1.225Ubuntu22.04.4LTSdockerelasticsearch:8.15.3ARM64elasticllodyi4TMmZDES集群部署创建持久化目录(所有节点)mkdir-p/data/es/{data,certs,logs,plugins}mkdir-p/data/es/certs/{ca,es01}服务
docker和kubectl客户端安装Linux yyytucj docker linux 容器
在现代软件开发和运维领域，Docker和Kubernetes已成为不可或缺的工具。Docker是一个开源的应用容器引擎，允许开发者打包应用及其依赖包到一个可移植的容器中，然后发布到任何流行的Linux机器或者Windows机器上。Kubernetes（简称K8s）是一个开源的容器编排工具，用于自动化容器的部署、扩展和管理。在Linux环境中安装Docker和Kubernetes客户端（kubect
CICD系列之k8s john137724 DEV-OPS k8s
k8s安装操作系统配置主机规划hosts配置(所有主机都要配置)防火墙配置(所有主机都要配置)内核配置参数(所有主机都要配置)selinux和swap配置(所有主机都要配置)ipvs配置(所有主机都要配置)安装docker安装k8s组件配置k8s组件安装yum源安装kubelet,kubeadm,kubectl(所有节点都要安装，工作节点不用安装kubectl)设置kubelet开机自启动初始化集
curl不通 k8s_【K8S排错】在集群的POD内不能访问clusterIP和service weixin_39950057 curl不通 k8s
排错背景：在一次生产环境的部署过程中，配置文件中配置的访问地址为集群的Service，配置好后发现服务不能正常访问，遂启动了一个busybox进行测试，测试发现在busybox中，能通过coredns正常的解析到IP，然后去ping了一下service，发现不能ping通，pingclusterIP也不能ping通。排错经历：首先排查了kube-proxy是否正常，发现启动都是正常的，然后也重启了
在K8S中，svc底层是如何实现的？ Dusk_橙子 K8S kubernetes 容器云原生
在Kubernetes中，Service是集群内部的一个抽象层，用于定义一组Pod的逻辑分组，并提供统一的访问入口点，同时还可以对这些Pod提供负载均衡和网络代理功能。Service底层的实现主要包括以下几个关键组件和技术：标签选择器（LabelSelectors）Kubernetes中的Service并不直接指向具体的PodIP地址，而是通过标签选择器（LabelSelectors）关联到具有匹
K8s 1.27.1 实战系列（六）Pod 白昼ron K8s kubernetes 容器 K8s Pod yaml
一、Pod介绍1、Pod的定义与核心设计Pod是Kubernetes的最小调度单元，由一个或多个容器组成，这些容器共享网络、存储、进程命名空间等资源，形成紧密协作的应用单元。Pod的设计灵感来源于“豌豆荚”模型，容器如同豆子，共享同一环境但保持隔离性。其核心设计目标包括：轻量性：Pod本身不负责资源分配，仅作为容器的逻辑封装单元，高效利用集群资源。临时性：Pod生命周期短暂，故障或任务完成后会被销
部署skywalking进行链路跟踪 BUG弄潮儿 skywalking
1.前言本实验文档基于单机es7作为skywalking的后端存储，使用nfs动态卷storageclass，es没有使用账号密码。2.环境k8s集群：v1.20.4版本k8s-master1192.168.110.235k8s-node1192.168.110.236k8s-node2192.168.110.237nfs192.168.110.239elasticsearch：7.12.0sky
使用ansible搭建k8s集群--单节点部署+work节点扩展 chennuan1991 kubernetes
单节点部署：1.基础系统配置准备一台虚机配置内存2G/硬盘30G以上最小化安装Ubuntu16.04server或者CentOS7Minimal配置基础网络、更新源、SSH登录等2.下载文件下载工具脚本easzup，举例使用kubeasz版本2.0.2https://github.com/easzlab/kubeasz/blob/master/docs/setup/quickStart.md如果下
k8s下部署ansible进行node-export二安装 BUG弄潮儿 kubernetes ansible 容器云原生
下载node-exporterhttps://github.com/prometheus/node_exporter/releases下载ansiblehttps://github.com/ansible/ansible/releases启动node-exporterservice文件node-exporter.service[Unit]Description=node_exporterRequi
K8S学习之基础十九：k8s的四层代理Service 云上艺旅 K8S学习 kubernetes 容器云原生
K8S四层代理Service四层负载均衡Service在k8s中，访问pod可以通过ip+端口的方式，但是pod是由生命周期的，pod在重启的时候ip地址往往会发生变化，访问pod就需要新的ip地址，这样就会很麻烦，每次pod地址改变就要修改访问ip。Service的引进解决了这种问题，通过定义Service资源对象，Service定义一个服务访问的入口，客户端可以通过这个入口访问对应的pod，就
Kubernetes/k8s 灰度发布 (deployment分批发布）江南飞羽 k8s kubernetes 运维 java
为何需要灰度发布生产环境从来都需要心存敬畏的，一旦变更失误会严重影响公网顾客的访问和体验，且实践过程中发现，发布和变更是两个重要的故障来源。IDC迁移到K8S后，虽然K8S配置rolling策略可实现maxSurge=1/n，分批升级工作负载deployment，但分批之间是没有停停顿疼点1）缺陷：假设deployment_v1一组有10个pod，内置rolling方式，发布pod_1更新代码为v
K8s 1.18.6版本基于 ingress-nginx 实现金丝雀发布（灰度发布） zerchin kubernetes ingress-nginx kubernetes ingress-nginx
K8s1.18.6版本基于ingress-nginx实现金丝雀发布（灰度发布）环境软件版本kubernetesv1.18.6nginx-ingress-controller0.32.0Rancherv2.4.5本次实验基于Rancher-v2.4.5部署了1.18.6版本的k8s集群，nginx-ingress版本为0.32.0，理论上ingress-nginx>=0.21.0都是可以的。介绍金丝
k8s灰度/金丝雀发布竹浅共春枝 kubernetes 容器云原生 canary
灰度及蓝绿发布是为新版本服务创建一个与老版本服务完全一致的生产环境，在不影响老版本服务的前提下，按照一定的规则把部分流量切换到新版本，当新版本试运行一段时间没有问题后，将用户的全量流量从老版本迁移至新版本。灰度发布的方式通常用于AB测试，是指一部分用户继续使用老版本的服务，将一部分用户的流量切换到新版本，如果新版本运行稳定，则逐步将所有用户迁移到新版本。金丝雀发布是指在生产环境中逐步推出新版本应用
Apache Doris 现行版本 Docker-Compose 运行教程 atbigapp.com 大数据 doris 大数据 mpp
特别注意！DorisOnDocker部署方式仅限于开发环境或者功能测试环境，不建议生产环境部署！如有生产环境或性能测试集群部署诉求，请使用裸机/虚机部署或K8SOperator部署方案！原文阅读：ApacheDoris现行版本Docker-Compose运行教程引言随着ApacheDoris项目的火热，很多想尝鲜或者试用的小伙伴都希望通过Docker来快速拉起一个功能测试或者开发的集群，但由于一些
K8s 1.27.1 实战系列（二）安装集群并初始化白昼ron K8s kubernetes 容器 K8s 部署 containerd kubeadm kubelet
一、安装kubeadm、kubelet和kubectl（所有节点）1、配置k8s的yum源地址cat<
Kubernetes_15_k8s交付jenkins并集成docker/k8s/java/maven环境 hellowordx007 Kubernetes kubernetes 服务器 linux
配置jenkins镜像并集成Docker环境在运维机执行[root@wwwjenkins]#pwd/opt/sortware/jenkins[root@wwwjenkins]#vimDockerfile##配置Dockerfile集成Docker环境FROMjenkins/jenkins:2.287USERrootADDkubectl/usr/bin/kubectlADDget-docker.sh
K8s面试题总结（十一） a_j58 kubernetes 容器云原生
1.如何优化docker镜像的大小？使用多阶段构建（multi-stagebuild）选择更小的基础镜像（如alpine）减少镜像层数，合并RUN命令2.请解释Docker中的网络模式（如bridge,host,none)Bridge：默认模式，容器通过虚拟网络桥接与主机通信Host：容器直接使用主机的网络栈none：容器没有网络接口3.如何将本地开发的Docker容器部署到Kubernetes集
K8S 集群节点扩容小小大胖子3 kubernetes java 容器
环境说明：主机名IP地址CPU/内存角色K8S版本Docker版本k8s231192.168.99.2312C4Gmaster1.23.1720.10.24k8s232192.168.99.2322C4Gwoker1.23.1720.10.24k8s233（需上线）192.168.99.2332C4Gwoker1.23.1720.10.24当现有集群中的节点资源不够用，此时就需要给集群扩容添加机器
大数据运维实战指南：零基础入门与核心技术解析（第一篇） emmm形成中大数据运维
大数据运维实战指南：零基础入门与核心技术解析（第一篇）系列文章目录第一篇：大数据运维概述与核心技能体系第二篇：Hadoop生态体系与集群部署实战第三篇：分布式存储系统运维与优化第四篇：资源调度框架YARN/K8s深度解析第五篇：实时计算框架Flink/Spark运维指南第六篇：大数据监控体系与自动化运维第七篇：云原生时代的大数据运维实践第八篇：数据安全与合规性管理第九篇：性能调优与故障排查案例集第
【K8S问题系列 | 10】在K8S集群怎么查看各个pod占用的资源大小？【已解决】颜淡慕潇 kubernetes 容器云原生后端问题解决
要查看Kubernetes集群中各个Pod占用的资源大小（包括CPU和内存），可以使用以下几种方法：1.使用kubectltop命令kubectltop命令可以快速查看当前Pod的CPU和内存使用情况。需要确保已安装并配置了MetricsServer。查看所有Pod的资源使用情况kubectltoppods--all-namespaces示例输出NAMESPACENAMECPU(cores)MEM
K8s（八）：如何进行 Kubernetes 集群健康检查？ Seal^_^ #Kubernetes 【云原生】容器化与编排技术持续集成 kubernetes 容器云原生 K8s 集群健康检查
K8s（八）：如何进行Kubernetes集群健康检查？1、节点健康检查1.1、使用kubectl查看节点状态1.2、查看节点详细信息1.3、检查节点资源使用情况2、Pod健康检查2.1、使用kubectl查看Pod状态2.2、查看特定Pod的详细信息，包括事件和条件3、服务健康检查3.1、使用kubectl查看服务状态3.2、查看特定服务的详细信息，包括端口和端点4、使用kubectl查看存储状
k8s scheduler源码阅读全是操作 k8s kubernetes 容器云原生
目标通过源码加深对k8sscheduler的了解源码阅读环境准备源码在kubernetes仓库中,如何调试scheduler在我的另一篇文章《kubeadm搭建k8s源码阅读环境》里面有演示。在本篇文章中就不再赘述了。调试命令如下dlv--headless--listen=:8005--api-version=2--accept-multiclientexec/root/kubernetes/_o
玛卡巴卡的k8s知识点问答题（二）小刘爱喇石( ˝ᗢ̈˝ ) kubernetes docker 容器
5.部署安装K8s为什么要关闭swap分区？（1）资源管理失效，k8s无法感知swap的使用情况，因为他只监控物理内存，若启用了swap，pod可能会使用swap空间，导致k8s误判节点的使用情况。（2）性能下降：swap的读写速度远远低于物理内存，使用swap会导致应用性能明显下降。（3）Pod驱逐机制失效：k8s通过内存压力来触发Pod的驱逐机制，如果节点启用了swap，内存不足时系统会优先使
玩转Linux网络命名空间：手把手实现跨命名空间通信冯·诺依曼的操作系统 ➔Linux linux 网络运维容器
一、网络命名空间简介网络命名空间（NetworkNamespace）是Linux内核提供的一种网络隔离机制，它允许不同命名空间拥有独立的：网络设备接口IP地址和路由表防火墙规则（iptables/nftables）端口号范围这种技术被广泛应用于容器化（Docker/K8s）、虚拟化等场景，是实现网络隔离的重要基础。二、实战：跨命名空间通信配置1.环境准备#清空已有测试命名空间（避免冲突）ipnet
docker版本实现MySQL主从架构互联网老辛从零开始学k8s docker
下载MySQL镜像[root@k8s-master~]#dockerpullmysql:5.75.7:Pullingfromlibrary/mysql72a69066d2fe:Pullcomplete93619dbc5b36:Pullcomplete99da31dd6142:Pullcomplete626033c43d70:Pullcomplete37d5d7efb64e:Pullcomplete
k8s--vxlan的使用网络传输协议
在Linux系统中可以使用命令行工具来创建和测试VXLAN网络确定物理网卡首先要明确VXLAN隧道所基于的物理网卡，一般可以使用ipaddr命令查看当前系统的网络接口信息。例如，假设物理网卡名为eth0。创建VXLAN接口iplinkaddvxlan100typevxlanid100deveth0dstport4789vxlan100：这是新创建的VXLAN接口的名称，你可以根据需求自定义。id1
云原生边缘计算：重塑分布式智能的时空边界桂月二二云原生边缘计算分布式
引言：算力向数据源头迁移的革命特斯拉自动驾驶系统每小时产生20TB边缘数据，时延要求低于50ms。中国移动5G边缘云实现ARPU值提升38%，华为云IEF平台将工业质检响应速度提升至15ms以内。ABIResearch预测2026年边缘AI芯片市场规模达520亿美元，KubeEdge管理边缘节点数突破千万级，单节点资源开销仅为K8s的1/8。一、边缘计算架构范式演进1.1技术架构对比矩阵特征维度中
K8s 1.27.1 实战系列（五）Namespace 白昼ron K8s kubernetes 容器 K8s Namespace 命名空间 yaml ns
Kubernetes1.27.1中的Namespace（命名空间）是集群中实现多租户资源隔离的核心机制。以下从功能、操作、配置及实践角度进行详细解析：一、核心功能与特性1、资源隔离Namespace将集群资源划分为逻辑组，实现Pod、Service、Deployment等资源的虚拟隔离。例如，开发环境与生产环境的资源可独立管理，避免相互干扰。非完全隔离性：默认仅逻辑隔离，网络和存储仍互通，需通过N
K8s - 结合实战场景的深度问题小马不敲代码云原生 kubernetes 容器云原生
1:存活探针（LivenessProbe）、就绪探针（ReadinessProbe）、启动探针（StartupProbe）的区别及适用场景？1、存活探针（LivenessProbe）•目的：检测容器是否处于运行状态，若失败则重启容器。•适用场景：•应用程序因死锁或死循环无法响应请求时自动恢复。•例如：Web服务长时间无响应需强制重启。•配置示例livenessProbe:httpGet:path:
K8S常见的面试题水月清辉 k8s
kubernetes面试题汇总1、k8s是什么？请说出你的了解？答：Kubenetes是一个针对容器应用，进行自动部署，弹性伸缩和管理的开源系统。主要功能是生产环境中的容器编排。K8S是Google公司推出的，它来源于由Google公司内部使用了15年的Borg系统，集结了Borg的精华。2、K8s架构的组成是什么？答：和大多数分布式系统一样，K8S集群至少需要一个主节点（Master）和多个计算
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1