kjh2007abc

生产环境kubernetes集群安装部署-1.15.3

版本介绍


NAME                   VERSION   INTERNAL-IP         
cnvs-kubm-101-103      v1.15.3   172.20.101.103   

OS-IMAGE                KERNEL-VERSION              CONTAINER-RUNTIME
CentOS Linux 7 (Core)   5.2.9-1.el7.elrepo.x86_64   docker://18.6.1

项目地址：

https://gitlab.com/PtmindDev/devops/kub-deploy/tree/cn-k8s-prod

分支：
cn-k8s-prod

集群介绍

#master
[kub-m]
172.20.101.103 name=cnvskubm-101-103  
172.20.101.104 name=cnvskubm-101-104  
172.20.101.105 name=cnvskubm-101-105  

#node
[kub-n]
172.20.101.106 name=cnvs-kubnode-101-106 
172.20.101.107 name=cnvs-kubnode-101-107
172.20.101.108 name=cnvs-kubnode-101-108
172.20.101.118 name=cnvs-kubnode-101-118 
172.20.101.120 name=cnvs-kubnode-101-120
172.20.101.122 name=cnvs-kubnode-101-122
172.20.101.123 name=cnvs-kubnode-101-123 
172.20.101.124 name=cnvs-kubnode-101-124

ansible 安装环境：

cd /workspace/kub-deploy/roles

1:升级内核 -按需

ansible-playbook  1-kernelup.yaml

验证效果

ansible kub-all -a "uname -a"

Linux kubm-01 5.2.9-1.el7.elrepo.x86_64 #1 SMP Fri Aug 16 08:17:55 EDT 2019 x86_64 x86_64 x86_64 GNU/Linux

系统初始化

ansible-playbook 2-basic.yml

#单独指定其中一台运行：
ansible-playbook -i /etc/ansible/hosts 2-basic.yml --limit 172.20.101.103

安装nginx

ansible-playbook 3-nginx.yaml

验证

#版本
[root@kubm-01 roles]# ansible kub-m -a "nginx -v"     

172.20.101.103 | CHANGED | rc=0 >>
nginx version: nginx/1.16.1
....

#端口
ansible kub-m -m shell -a  "lsof -n -i:16443"

172.20.101.103 | CHANGED | rc=0 >>
COMMAND   PID  USER   FD   TYPE DEVICE SIZE/OFF NODE NAME
nginx   21392  root    5u  IPv4 434526      0t0  TCP *:16443 (LISTEN)
。。。。

安装keepalived

ansible-playbook 4-keepalived.yml

********
ok: [172.20.101.103] => {
    "output.stdout_lines": [
        "    inet 172.20.101.253/32 scope global eth0"
    ]
.......
ok: [172.20.101.105] => {
    "output.stdout_lines": []
}

监测 vip

[root@kubm-01 roles]# ping 172.20.101.253
PING 172.20.101.253 (172.20.101.253) 56(84) bytes of data.
64 bytes from 172.20.101.253: icmp_seq=1 ttl=64 time=0.059 ms

新建安装部署目录

mkdir -p /etc/kubeinstall
cd /etc/kubeinstall

创建一个初始初始化文件（kubm-01执行）

我使用的flannel 网络插件需要配置网络参数 --pod-network-cidr=10.244.0.0/16 。

cat < /etc/kubeinstall/kubeadm-config.yaml
apiVersion: kubeadm.k8s.io/v1beta2
bootstrapTokens:
- groups:
  - system:bootstrappers:kubeadm:default-node-token
  token: abcdef.0123456789abcdef
  ttl: 24h0m0s
  usages:
  - signing
  - authentication
kind: InitConfiguration
localAPIEndpoint:
  advertiseAddress: 172.20.101.103
  bindPort: 6443
nodeRegistration:
  criSocket: /var/run/dockershim.sock
  name: cnvs-kubm-101-103
  taints:
  - effect: NoSchedule
    key: node-role.kubernetes.io/master
---
apiServer:
  timeoutForControlPlane: 4m0s
apiVersion: kubeadm.k8s.io/v1beta2
certificatesDir: /etc/kubernetes/pki
clusterName: cn-k8s-prod
controlPlaneEndpoint: "172.20.101.253:16443"
controllerManager: {}
dns:
  type: CoreDNS
etcd:
  local:
    dataDir: /var/lib/etcd
imageRepository: k8s.gcr.io
kind: ClusterConfiguration
kubernetesVersion: v1.15.0
networking:
  dnsDomain: cluster.local
  serviceSubnet: 10.245.0.0/16
  podSubnet: "10.244.0.0/16"
scheduler: {}
EOF

注意我使用nginx做的代理

master上面都配置Nginx反向代理 API Server;
172.20.101.253 是master节点的vip;
Nginx 代理端口为 16443 端口；
API Server使用 6443 端口；

使用config指定初始化集群。

kubeadm init \
--config=/etc/kubeinstall/kubeadm-config.yaml \
--upload-certs

master 节点：

[kub-m]
172.20.101.103 name=cnvs-kubm-101-103  
172.20.101.104 name=cnvs-kubm-101-104  
172.20.101.105 name=cnvs-kubm-101-105

第一台master节点初始化返回结果

To start using your cluster, you need to run the following as a regular user:

  mkdir -p $HOME/.kube
  sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
  sudo chown $(id -u):$(id -g) $HOME/.kube/config

You should now deploy a pod network to the cluster.
Run "kubectl apply -f [podnetwork].yaml" with one of the options listed at:
  https://kubernetes.io/docs/concepts/cluster-administration/addons/

You can now join any number of the control-plane node running the following command on each as root:

  kubeadm join 172.20.101.253:16443 --token hgep1g.fwo8y7rt8o8xqjml \
    --discovery-token-ca-cert-hash sha256:08462cf2017a1e3292ea355a7fc56c49ac713b84d5af45b649d7c8be539b97cf \
    --control-plane --certificate-key 1c20a3656bbcc9be4b5a16bcb4c4bab5445d221d4721900bf31b5b196b733cec

Please note that the certificate-key gives access to cluster sensitive data, keep it secret!
As a safeguard, uploaded-certs will be deleted in two hours; If necessary, you can use 
"kubeadm init phase upload-certs --upload-certs" to reload certs afterward.

Then you can join any number of worker nodes by running the following on each as root:

kubeadm join 172.20.101.253:16443 --token hgep1g.fwo8y7rt8o8xqjml \
    --discovery-token-ca-cert-hash sha256:08462cf2017a1e3292ea355a7fc56c49ac713b84d5af45b649d7c8be539b97cf

在执行节点上执行如下操作，初始化k8s环境。

mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config

节点验证：

[root@cnvs-kubnode-101-103 kubeinstall]# 

mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config

#节点状态
[root@cnvs-kubnode-101-103 kubeinstall]# kubectl get nodes
NAME                STATUS     ROLES    AGE     VERSION
cnvs-kubm-101-103   NotReady   master   3m35s   v1.15.3    <=== 状态 NotReady，安装网络插件后恢复

#服务状态
[root@cnvs-kubnode-101-103 kubeinstall]# kubectl get cs
NAME                 STATUS    MESSAGE             ERROR
controller-manager   Healthy   ok                  
scheduler            Healthy   ok                  
etcd-0               Healthy   {"health":"true"}

部署flannel网络

使用与podSubnet上面配置匹配的pod CIDR 安装CNI插件,按照实际情况修改。

kubernetes 版本更新较快，推荐部署前阅读相关文档，使用匹配版本网络插件。！！！
https://github.com/coreos/flannel#flannel

  kubeadm join 172.20.101.253:16443 --token hgep1g.fwo8y7rt8o8xqjml \
    --discovery-token-ca-cert-hash sha256:08462cf2017a1e3292ea355a7fc56c49ac713b84d5af45b649d7c8be539b97cf \
    --control-plane --certificate-key 1c20a3656bbcc9be4b5a16bcb4c4bab5445d221d4721900bf31b5b196b733cec

验证节点状态：

[root@cnvs-kubnode-101-103 kubeinstall]# kubectl get nodes
NAME                STATUS   ROLES    AGE     VERSION
cnvs-kubm-101-103   Ready    master   4m51s   v1.15.3     <=== Ready

#服务状态全部为running
root@cnvs-kubm-101-103 kubeinstall]# kubectl get pods -n kube-system
NAME                                        READY   STATUS    RESTARTS   AGE
coredns-5c98db65d4-kl66m                    1/1     Running   0          83s
coredns-5c98db65d4-xjlkl                    0/1     Running   0          83s
etcd-cnvs-kubm-101-103                      1/1     Running   0          40s
kube-apiserver-cnvs-kubm-101-103            1/1     Running   0          25s
kube-controller-manager-cnvs-kubm-101-103   1/1     Running   0          27s
kube-flannel-ds-amd64-jln7d                 1/1     Running   0          17s
kube-proxy-g2b2p                            1/1     Running   0          83s
kube-scheduler-cnvs-kubm-101-103            1/1     Running   0          35s

添加第(2 ~ 3)master节点执行如下操作

  kubeadm join 172.20.101.253:16443 --token m1n5s7.ktdbt3ce3yj4czm1 \
    --discovery-token-ca-cert-hash sha256:0eca032dcb2354f8c9e4f3ecfd2a19941b8a7b0c6cc4cc0764dc61a3a8e5ff68 \
    --control-plane --certificate-key e5b5fe5b9576a604b7107bbe12a8aa09d4ddc309c9d9447bc5552fdd481df627

在执行节点上执行如下操作，初始化一下k8s环境。

mkdir -p $HOME/.kube
sudo cp -i /etc/kubernetes/admin.conf $HOME/.kube/config
sudo chown $(id -u):$(id -g) $HOME/.kube/config

验证

所有master节点ready

[root@cnvs-kubm-101-105 ~]# kubectl get nodes
NAME                STATUS   ROLES    AGE     VERSION
cnvs-kubm-101-103   Ready    master   4m35s   v1.15.3
cnvs-kubm-101-104   Ready    master   96s     v1.15.3
cnvs-kubm-101-105   Ready    master   22s     v1.15.3

所有node节点,执行如下操作

[kub-n]
172.20.101.106
172.20.101.107
172.20.101.108
172.20.101.118
172.20.101.120
172.20.101.122
172.20.101.123
172.20.101.124

单节点安装

kubeadm join 172.20.101.253:16443 --token hgep1g.fwo8y7rt8o8xqjml \
    --discovery-token-ca-cert-hash sha256:08462cf2017a1e3292ea355a7fc56c49ac713b84d5af45b649d7c8be539b97cf

ansible 安装

ansible kub-n -m shell -a "kubeadm join 172.20.101.253:16443 --token hgep1g.fwo8y7rt8o8xqjml \
    --discovery-token-ca-cert-hash sha256:08462cf2017a1e3292ea355a7fc56c49ac713b84d5af45b649d7c8be539b97cf"

[preflight] Running pre-flight checks
[preflight] Reading configuration from the cluster...
[preflight] FYI: You can look at this config file with 'kubectl -n kube-system get cm kubeadm-config -oyaml'
[kubelet-start] Downloading configuration for the kubelet from the "kubelet-config-1.15" ConfigMap in the kube-system namespace
[kubelet-start] Writing kubelet configuration to file "/var/lib/kubelet/config.yaml"
[kubelet-start] Writing kubelet environment file with flags to file "/var/lib/kubelet/kubeadm-flags.env"
[kubelet-start] Activating the kubelet service
[kubelet-start] Waiting for the kubelet to perform the TLS Bootstrap...

This node has joined the cluster:
* Certificate signing request was sent to apiserver and a response was received.
* The Kubelet was informed of the new secure connection details.

Run 'kubectl get nodes' on the control-plane to see this node join the cluster.

验证：

[root@cnvs-kubm-101-104 ~]# kubectl get node
NAME                   STATUS   ROLES    AGE     VERSION
cnvs-kubm-101-103      Ready    master   8m32s   v1.15.3
cnvs-kubm-101-104      Ready    master   5m33s   v1.15.3
cnvs-kubm-101-105      Ready    master   4m19s   v1.15.3
cnvs-kubnode-101-106   Ready       28s     v1.15.3
cnvs-kubnode-101-107   Ready       28s     v1.15.3
cnvs-kubnode-101-108   Ready       28s     v1.15.3
cnvs-kubnode-101-118   Ready       28s     v1.15.3
cnvs-kubnode-101-120   Ready       28s     v1.15.3
cnvs-kubnode-101-122   Ready       13s     v1.15.3
cnvs-kubnode-101-123   Ready       13s     v1.15.3
cnvs-kubnode-101-124   Ready       2m31s   v1.15.3

添加标签

为部署traefik做准备

kubectl label nodes {cnvs-kubnode-101-106,cnvs-kubnode-101-107} traefik=traefik-outer --overwrite

kubectl label nodes {cnvs-kubnode-101-123,cnvs-kubnode-101-124} traefik=traefik-inner --overwrite

验证

[root@cnvs-kubm-101-103 kub-deploy]# kubectl get node  -l "traefik=traefik-outer"
NAME                   STATUS   ROLES    AGE     VERSION
cnvs-kubnode-101-106   Ready       5m25s   v1.15.3
cnvs-kubnode-101-107   Ready       5m25s   v1.15.3

[root@cnvs-kubm-101-103 kub-deploy]# kubectl get node  -l "traefik=traefik-inner"
NAME                   STATUS   ROLES    AGE     VERSION
cnvs-kubnode-101-123   Ready       5m18s   v1.15.3
cnvs-kubnode-101-124   Ready       7m36s   v1.15.3

集群总体验证

#所有服务状态均为 running
[root@cnvs-kubm-101-103 kub-deploy]# kubectl get pods -n kube-system
NAME                                        READY   STATUS    RESTARTS   AGE
coredns-5c98db65d4-kl66m                    1/1     Running   0          13m
coredns-5c98db65d4-xjlkl                    1/1     Running   0          13m
etcd-cnvs-kubm-101-103                      1/1     Running   0          13m
etcd-cnvs-kubm-101-104                      1/1     Running   0          7m57s
etcd-cnvs-kubm-101-105                      1/1     Running   0          5m26s
kube-apiserver-cnvs-kubm-101-103            1/1     Running   0          13m
kube-apiserver-cnvs-kubm-101-104            1/1     Running   1          7m47s
kube-apiserver-cnvs-kubm-101-105            1/1     Running   0          4m8s
kube-controller-manager-cnvs-kubm-101-103   1/1     Running   1          13m
kube-controller-manager-cnvs-kubm-101-104   1/1     Running   0          6m38s
kube-controller-manager-cnvs-kubm-101-105   1/1     Running   0          4m11s
kube-flannel-ds-amd64-2nfbb                 1/1     Running   2          88s
kube-flannel-ds-amd64-2pbqs                 1/1     Running   1          104s
kube-flannel-ds-amd64-4w7cb                 1/1     Running   2          92s
kube-flannel-ds-amd64-gxzhw                 1/1     Running   1          3m58s
kube-flannel-ds-amd64-jln7d                 1/1     Running   0          12m
kube-flannel-ds-amd64-lj9t4                 1/1     Running   2          92s
kube-flannel-ds-amd64-mbp8k                 1/1     Running   2          91s
kube-flannel-ds-amd64-r8t9c                 1/1     Running   1          7m57s
kube-flannel-ds-amd64-rdsfm                 1/1     Running   0          3m5s
kube-flannel-ds-amd64-w8gww                 1/1     Running   1          5m26s
kube-flannel-ds-amd64-x7rh7                 1/1     Running   2          92s
kube-proxy-4kxjv                            1/1     Running   0          5m26s
kube-proxy-4vqpf                            1/1     Running   0          92s
kube-proxy-677lf                            1/1     Running   0          92s
kube-proxy-b9kr2                            1/1     Running   0          104s
kube-proxy-dm9kd                            1/1     Running   0          3m5s
kube-proxy-g2b2p                            1/1     Running   0          13m
kube-proxy-m79jv                            1/1     Running   0          3m58s
kube-proxy-snqhr                            1/1     Running   0          92s
kube-proxy-t7mkx                            1/1     Running   0          91s
kube-proxy-z2f67                            1/1     Running   0          7m57s
kube-proxy-zjpwn                            1/1     Running   0          88s
kube-scheduler-cnvs-kubm-101-103            1/1     Running   1          13m
kube-scheduler-cnvs-kubm-101-104            1/1     Running   0          7m4s
kube-scheduler-cnvs-kubm-101-105            1/1     Running   0          4m32s

#所有节点状态为ready
[root@cnvs-kubm-101-103 kub-deploy]# kubectl get nodes
NAME                   STATUS   ROLES    AGE     VERSION
cnvs-kubm-101-103      Ready    master   15m     v1.15.3
cnvs-kubm-101-104      Ready    master   9m32s   v1.15.3
cnvs-kubm-101-105      Ready    master   7m1s    v1.15.3
cnvs-kubnode-101-106   Ready       3m6s    v1.15.3
cnvs-kubnode-101-107   Ready       3m19s   v1.15.3
cnvs-kubnode-101-108   Ready       3m7s    v1.15.3
cnvs-kubnode-101-118   Ready       3m7s    v1.15.3
cnvs-kubnode-101-120   Ready       3m7s    v1.15.3
cnvs-kubnode-101-122   Ready       3m3s    v1.15.3
cnvs-kubnode-101-123   Ready       4m40s   v1.15.3
cnvs-kubnode-101-124   Ready       5m33s   v1.15.3

批量清理集群

kubectl delete node --all
ansible kub-all -m shell -a "kubeadm reset -f"
ansible kub-all -m shell -a "rm -rf /etc/kubernetes && rm -rf /var/lib/etcd && rm -rf /var/lib/kubelet && rm -rf /var/lib/kubelet && rm -rf $HOME/.kube/config "
ansible kub-all -m shell -a "iptables -F && iptables -t nat -F && iptables -t mangle -F && iptables -X"
ansible kub-all -m shell -a "systemctl restart docker && systemctl enable kubelet"
ansible kub-all -m shell -a "ip link del flannel.1 && ip a|grep flannel "

参考文档

https://www.cnblogs.com/net2817/p/10513369.html
https://k8smeetup.github.io/docs/reference/setup-tools/kubeadm/kubeadm-config/

基于Python的搜索引擎的设计与实现 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据 java python javascript kotlin golang 架构人工智能
搜索引擎,Python,爬虫,自然语言处理,信息检索,索引,算法,数据库1.背景介绍在信息爆炸的时代，海量数据无处不在，高效地获取所需信息变得至关重要。搜索引擎作为信息获取的桥梁，扮演着不可或缺的角色。传统的搜索引擎往往依赖于庞大的服务器集群和复杂的算法，对资源消耗较大，且难以满足个性化搜索需求。基于Python的搜索引擎设计，则凭借Python语言的易学易用、丰富的第三方库和强大的社区支持，为开
网络流量如何从公共互联网抵达Kubernetes容器 Pod? 硅基创想家 #Kubernetes实战与经验 kubernetes 容器云原生
“解释网络流量如何从公共互联网抵达Kubernetes容器（Pod）”，这是DevOps技术面试中相当常见的问题。对这个问题给出准确且详尽的回答，能体现出DevOps工程师对Kubernetes各项流程的熟悉程度。在本文中，我将以在AWSEKS上运行Kubernetes为例，梳理这一过程。简短的答案可以概括为：用户请求→域名系统（DNS）→弹性负载均衡器（ELB）→Ingress控制器（可选）→K
Kubernetes的Ingress和Service有什么区别？硅基创想家 #Kubernetes实战与经验 kubernetes 容器云原生
在Kubernetes中，Ingress和Service是两个不同的概念，它们在功能、作用范围、应用场景等方面存在明显区别，具体如下：功能Ingress：主要用于管理集群外部到内部服务的HTTP和HTTPS流量路由。它可以根据域名、路径等规则，将外部请求精确地路由到集群内不同的Service，实现更细粒度的流量控制和多服务共享一个IP等功能。Service：主要用于在Kubernetes集群内部为
Kubernetes的Ingress 资源是什么？硅基创想家 #Kubernetes实战与经验 kubernetes 容器云原生
在Kubernetes中，Ingress资源是一种用于管理集群外部对内部服务访问的API对象，主要用于将不同的外部请求路由到集群内的不同服务，以下是关于它的详细介绍：定义与作用Ingress资源定义了从集群外部到内部服务的HTTP和HTTPS路由规则。通过Ingress，可以将多个不同域名或不同路径的请求，根据定义的规则，导向到集群内不同的Kubernetes服务，从而实现对集群内服务的统一外部访
k8s rook-ceph MountDevice failed for volume pvc An operation with the given Volume ID already exists 时空无限 Kubernetes kubernetes ceph
https://github.com/rook/rook/issues/4896环境kubeadm搭建的k8s集群，rook-ceph部署的ceph存储，monpod所在宿主机和挂载客户端机器pod所在机器不在一个二层网络里。故障pod挂载不上pvc，describepod信息如下MountDevicefailedforvolumepvcAnoperationwiththegivenVolumeI
rook-ceph无法登录dashboard 时空无限 Kubernetes ceph ceph kubernetes
环境ubuntu22.04tlsk8s1.20.2现象搭建好ceph集群环境后，执行如下命令获取admin登录账号的密码kubectl-nrook-cephgetsecretrook-ceph-dashboard-password-ojsonpath="{['data']['password'
Docker 私有仓库 Harbor 详解 drebander docker docker 容器运维
1.什么是Harbor？Harbor是一个开源的Docker镜像仓库管理平台，旨在提供更强大的企业级功能，支持私有Docker镜像仓库的管理。Harbor为Docker提供了集中式的镜像管理服务，支持用户和权限管理、镜像版本控制、安全扫描、LDAP集成等功能，是Docker镜像管理的最佳选择之一，特别适合需要高安全性、可扩展性的生产环境。Harbor的主要特点：企业级安全性：提供镜像扫描、安全策略
Redis安全机制与数据备份：保障数据安全与高可用性一碗黄焖鸡三碗米饭 Redis技术全景解析 redis 安全数据库缓存架构开发语言
Redis安全机制与数据备份：保障数据安全与高可用性作为一个高效的内存数据库，Redis因其卓越的性能和灵活的应用场景，成为了分布式缓存、消息队列、实时分析等领域的核心组件。然而，在大规模的生产环境中，Redis不仅需要关注性能，还需要具备高安全性和高可用性，以保障数据的完整性和持续服务。为此，Redis提供了一些安全机制和数据备份方案，帮助用户应对各种潜在的风险。本文将深入探讨Redis的安全机
Docker 安全基础：权限、用户、隔离机制 drebander docker docker 安全容器
Docker是一个强大的容器化平台，广泛用于开发、部署和运行应用。由于Docker提供了强大的隔离性和便捷的容器管理功能，它成为了现代DevOps和微服务架构的重要组成部分。然而，随着Docker在生产环境中的广泛应用，容器的安全性也变得至关重要。在本文中，我们将探讨Docker的权限管理、用户管理以及隔离机制，帮助开发者更好地理解和实施Docker安全最佳实践。1.Docker安全基础概述Doc
kubeadm拉起的k8s集群证书过期的做法集群已奔溃也可以解决 KTKong kubernetes 容器云原生
kubeadm拉起的k8s集群证书过期的做法这个是很久之前遇到的了，今天有空（心血来潮）就都回忆回忆写在这里为爱发光，部分内容来自arch先生（死党）的帮助。有时候有很多部门提了建k8s的需求，有些是临时的，有些没有说具体用多久，但是某天，他们和你说集群坏了，这时候你上去一看证书过期了，这里又有两种情况我们分别说明：集群还活着集群已归西1、备份数据2、报错内容及分析3、生成证书4、证书内容合并5、
虚拟机安装k8s集群开着拖拉机寻找春天 kubernetes 容器云原生
环境准备-主节点（MasterNode）:IP地址:192.168.40.100主机名:k8s-master-工作节点（WorkerNode）:IP地址:192.168.40.101主机名:k8s-node1步骤1:配置虚拟机环境1.1设置主机名在每台虚拟机上设置唯一的主机名：#在主节点上执行sudohostnamectlset-hostnamek8s-master#在工作节点上执行sudohos
Kubernetes & 容器自动伸缩失败：解决方案及阿里云如何帮助 Anna_Tong kubernetes 阿里云容器负载均衡云原生弹性计算自动伸缩
随着容器技术的普及，Kubernetes（K8s）已成为构建现代云原生应用的核心平台。自动伸缩（AutoScaling）功能可以帮助应用在流量波动时动态调整资源，提高效率并节约成本。然而，很多企业在配置水平自动伸缩（HorizontalPodAutoscaler，HPA）或ECS扩容策略时，常常遇到配置错误或无法触发扩容的问题，导致资源无法及时扩展或收缩，影响系统的稳定性和用户体验。本文将为您分享
GPU通信革命：跨平面网络效率提升300%的秘密武器 CodePatentMaster 人工智能深度学习机器学习自然语言处理微服务服务器 AIGC
「无需CPU中转，多平面网络RDMA通信时延降低50%」——Deepseek专利CN118612157A一、技术解析：突破AI算力瓶颈的底层创新1.技术背景：终结多平面网络CPU中转困境传统多平面网络中，跨平面GPU通信必须经过CPU内存拷贝，导致两大痛点：20-30%的通信带宽浪费在CPU中转环节大规模集群训练时，网络拥塞引发训练任务停滞该专利通过构建GPU直连通道，实现跨平面网络的零拷贝通信，
常用的高性能计算工具有哪些这题有点难度人工智能学习
在当今数字化时代，高性能计算（HPC）已成为推动科学、工程、技术以及商业创新的核心力量。无论是模拟宇宙的起源、设计新型航空器，还是训练复杂的人工智能模型，HPC都扮演着不可或缺的角色。本文将深入探讨高性能计算的定义、其背后的强大工具，以及它们如何助力各领域的突破性发展。一、高性能计算：定义与意义高性能计算（HPC）是一种利用超级计算机或大规模集群来处理复杂计算任务的技术。它通过并行计算和优化算法，
Hadoop01-入门&集群环境搭建--非原创（test） xl.liu 大数据 Test
Hadoop01-入门&集群环境搭建今日内容Hadoop的介绍集群环境搭建准备工作Linux命令和Shell脚本增强集群环境搭建来来来大数据概述大数据:就是对海量数据进行分析处理，得到一些有价值的信息，然后帮助企业做出判断和决策.处理流程:1:获取数据2:处理数据3:展示结果1：Hadoop介绍Hadoop是一个分布式系基础框架,它允许使用简单的编程模型跨大型计算机的大型数据集进行分布式处理.它主
使用 Docker 部署 Apache Spark 集群教程努力的小T docker docker spark linux 运维服务器云计算容器
简介ApacheSpark是一个强大的统一分析引擎，用于大规模数据处理。本文将详细介绍如何使用Docker和DockerCompose快速部署一个包含一个Master节点和两个Worker节点的Spark集群。这种方法不仅简化了集群的搭建过程，还提供了资源隔离、易于扩展等优势。前置条件在开始之前，请确保你的环境中已经准备好了以下组件：安装并运行DockerEngine。安装DockerCompos
海量日志接入 Serverless 应用降本70%以上
概述随着互联网业务的快速发展，日志数据量日益庞大，传统的日志处理方式面临着成本高、扩展性差等问题。为了应对这一挑战，越来越多的企业开始转向更先进的解决方案——阿里云ElasticsearchServerless。本文档将探讨在日志场景下，使用阿里云ElasticsearchServerless相较于基于ECS自建Elasticsearch集群的成本与性能优势，展示如何通过Serverless架构实
Nacos 何避免并发读写冲突问题?
Nacos作为一个分布式服务注册和配置管理平台，为了避免并发读写冲突，采用了多种技术和策略来保证系统的数据一致性、可靠性和性能。以下是Nacos避免并发读写冲突的几种关键机制：1.强一致性协议(Raft协议)Nacos使用了Raft协议来确保集群中多个节点的数据一致性。Raft协议是一种分布式共识协议，它通过保证集群中多数节点的一致性，避免了因为网络分区或节点故障而导致的数据不一致。Raft协议的
【Linux】FTP文件服务器 FixPng 运维服务器 linux 网络
FTP文件服务器一、FTP介绍二、应用场景三、FTP的权限四、FTP的工作模式五、FTP安装部署六、FTP配置文件6.1）相关文件6.2）主配文件详解七、FTP客户端访问7.1）文本界面登陆7.2）FTP客户端常用命令八、基于虚拟用户配置安全的ftp8.1）修改配置文件8.2）生成虚拟用户账号密码文件8.3）配置pam认证，注意先后顺序8.3）重启服务生效8.4）验证登陆一、FTP介绍FTP(Fi
nohup: ignoring input and redirecting stderr to stdout 大油油
在生产环境下启jar包时，发现原来好好的nohup信息输出到指定文件中的功能，突然出问题了。现象是控制台输出的信息一部分输出到了我指定的文件，另一部分却输出到了nohup.out，而我是不想让它产生nohup.out文件，不知道是什么原因。我的启动命令是这样的：nohupjava-jareureka-server.jar>../logs/eureka-server.out&现在指行这个命令，会给我
Kafka Raft知识整理自东向西 Kafka 知识整理 kafka 分布式
背景Kafka2.8之后，移除了Zookeeper，而使用了自己研发的KafkaRaft。为什么移除Zookeeper？原来Zookeeper在Kafka中承担了Controller选举、Broker注册、TopicPartition注册和选举、Consumer/Producer元数据管理和负载均衡等。即承担了各种元数据的保存和各种选举。而Zookeeper并“不快”，集群规模大了之后，很容易成为
Kafka topic、producer、consumer的基础使用病妖 Kafka kafka big data 分布式
文章目录Kafka初级前言1.topic的增删改查2.生产者的消息发送3.消费者消费数据Kafka初级前言关于kafka的集群安装这里就先跳过，如果需要相关资料以及学习视频的可以在留言下留下联系信息（邮箱、微信、qq都可），我们直接从kafka的学习开始，这是初级阶段，这篇博主主要讲述kafka的命令行操作。1.topic的增删改查创建主题：切换到kafka的相关目录，进行以下命令行操作bin/k
Hadoop管理工具dfsadmin和fsck的使用脚本无敌 Hadoop hadoop npm 大数据
Hadoop提供了多个管理工具，其中dfsadmin和fsck是用于管理HDFS（Hadoop分布式文件系统）的重要工具。以下是它们的使用方法和常见命令。1.dfsadmin工具dfsadmin是用于管理HDFS集群的命令行工具，主要用于监控和管理HDFS的状态。常用命令查看HDFS状态hdfsdfsadmin-report显示HDFS集群的总体状态，包括数据节点（DataNode）的状态、存储容
Kafka的生产者和消费者模型 Java资深爱好者 kafka 分布式
Kafka的生产者和消费者模型是一种消息传递模式，以下是该模型的详细描述：一、生产者（Producer）定义：生产者是消息的生产者，它将消息发布到Kafka的主题（Topic）中。功能：生产者可以将消息发送到指定的分区（Partition）或让Kafka自行选择分区。生产者还可以控制消息的序列化和分区策略。工作原理：生产者通过Kafka提供的API与Kafka集群进行通信，将消息异步发送到指定的主
阶段 1：Kafka基础认知 AI航海家(Ethan) 分布式 kafka kafka 分布式
核心知识点Kafka三大核心角色：Producer（生产者）：负责向Kafkatopic推送数据。可以理解为数据流的发起者。Broker：Kafka服务器节点，负责存储数据流。Kafka集群由多个broker组成。Consumer（消费者）：负责从Kafkatopic中读取和处理数据，可以是日志分析服务、数据库服务器等。核心概念：Topic：Kafka的基本单元，类似于数据库的表结构，用于对数据进
DeepSeek在linux下的安装部署与应用测试一望无际的大草原 deepseek 后端大模型部署 linux 大模型 deepseek
结合上一篇文章，本篇文章主要讲述在Redhatlinux环境下如何部署和使用DeepSeek大模型，主要包括ollama的安装配置、大模型的加载和应用测试。关于OpenWebUI在docker的安装部署，OpenWebUI官网也提供了完整的docker部署说明，大家可参考github，但对于OpenWebUI前后端分离的部署没有详细说明，这需要修改一部分前后端代码，后面会陆续分享给大家。ollam
基于自动化发布流程，运用多个工具实现高效运维实战罗伯特之技术屋运维自动化
【摘要】生产部署曾经是一件令运维极为头痛的事，充满着大量沟通和手动操作，自动化发布完全解决了过去发布的痛点。而在经济大环境的影响下，很多企业都需要降本增效，Serverless正在被越来越多的引入到生产环境上来。目前在对于云上的发布的流程基本上是，Terraform部署基础架构->Jenkins类的CICD工具发布应用->无服务化部署定时和事件触发的作业。本文将从如何建设自动化发布流程的原理入手，
笔记：DataSphere Studio安装部署流程右边com Java 大数据
一、标准版部署标准版：有一定的安装难度，体现在Hadoop、Hive和Spark版本不同时，可能需要重新编译，可能会出现包冲突问题。适合于试用和生产使用，2~3小时即可部署起来。支持的功能有：数据开发IDE-Scriptis工作流实时执行信号功能和邮件功能数据可视化-Visualis数据质量-Qualitis(单机版)工作流定时调度-Azkaban(单机版)Linkis管理台二、基础环境准备2.1
Linux下部署MySQL8.0集群 - 一主两从模式(主从复制) ꯭ 瞎꯭扯꯭蛋꯭ Mysql 服务器部署 linux mysql
目录一、部署前准备1、查看系统信息#查看系统版本cat/etc/red*#查看系统位数getconfLONG_BIT[root@localhost~]#cat/etc/red*CentOSLinuxrelease7.5.1804(Core)[root@localhost~]#getconfLONG_BIT642、下载对应安装包进入MySQL官网：https://dev.mysql.com/down
Redis在实际应用中的最佳实践：缓存加速、分布式锁与消息队列一碗黄焖鸡三碗米饭 Redis技术全景解析 redis java 后端架构微服务
Redis在实际应用中的最佳实践：缓存加速、分布式锁与消息队列Redis作为一个高性能的内存数据库，凭借其高吞吐量、低延迟的特性，已成为开发者在构建现代应用时的首选技术之一。无论是在缓存加速、分布式锁，还是消息队列等多个应用场景中，Redis都展现出了卓越的性能。本文将围绕这三个核心场景，深入探讨Redis的最佳实践，帮助开发者更好地理解和应用Redis，在生产环境中提高系统的响应速度、稳定性与可
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&

生产环境kubernetes集群安装部署-1.15.3

版本介绍

项目地址：

集群介绍

ansible 安装环境：

1:升级内核 -按需

验证效果

系统初始化

安装nginx

验证

安装keepalived

返回

监测 vip

新建安装部署目录

创建一个初始初始化文件（kubm-01执行）

注意我使用nginx做的代理

使用config指定初始化集群。

master 节点：

第一台master节点初始化返回结果

在执行节点上执行如下操作，初始化k8s环境。

节点验证：

部署flannel网络

验证节点状态：

添加第(2 ~ 3)master节点执行如下操作

在执行节点上执行如下操作，初始化一下k8s环境。

验证

所有node节点,执行如下操作

单节点安装

ansible 安装

返回

验证：

添加标签

验证

集群总体验证

批量清理集群

推荐清理环境

参考文档

你可能感兴趣的:(生产环境kubernetes集群安装部署-1.15.3)

生产环境kubernetes集群安装部署-1.15.3

版本介绍

项目地址：

集群介绍

ansible 安装环境：

1:升级内核 -按需

验证效果

系统初始化

安装nginx

验证

安装keepalived

返回

监测 vip

新建安装部署目录

创建一个初始初始化文件 （kubm-01执行）

注意我使用nginx做的代理

使用config指定初始化集群。

master 节点：

第一台master节点初始化返回结果

在执行节点上执行如下操作，初始化k8s环境。

节点验证：

部署flannel网络

验证节点状态：

添加第(2 ~ 3)master节点执行如下操作

在执行节点上执行如下操作，初始化一下k8s环境。

验证

所有node节点,执行如下操作

单节点安装

ansible 安装

返回

验证：

添加标签

验证

集群总体验证

批量清理集群

推荐清理环境

参考文档

你可能感兴趣的:(生产环境kubernetes集群安装部署-1.15.3)

创建一个初始初始化文件（kubm-01执行）