张忠琳

【kubernetes/k8s概念】k8s 坑问题汇总

1. Pod始终处于Pending状态

如果Pod保持在Pending的状态，意味着无法被正常的调度到节点上。由于某种系统资源无法满足Pod运行的需求

系统没有足够的资源：已经用尽了集群中所有的CPU或内存资源。需要清理一些不在需要的Pod，调整它们所需的资源量，或者向集群中增加新的节点。
用户指定了hostPort：通过hostPort用户能够将服务暴露到指定的主机端口上，会限制Pod能够被调度运行的节点。

2. Pod始终处于Waiting状态

Pod处在Waiting的状态，说明已经被调度到了一个工作节点，却无法在那个节点上运行。可以使用kubectl describe 含有更详细的错误信息。最经常导致Pod始终Waiting的原因是无法下载镜像

3. Pod 处于 CrashLoopBackOff 状态

CrashLoopBackOff 状态说明容器曾经启动了，但又异常退出了。此时 Pod 的 RestartCounts 通常是大于 0

容器进程退出
健康检查失败退出
OOMKilled

5. Pod一直崩溃或运行不正常

可以使用kubectl describe以及kubectl logs排查问题，但是这个一般也不确定

情况有：健康检测失败，OOM情况，或者容器运行生命周期结束

6. 集群雪崩需给Kubelet预留资源

https://my.oschina.net/jxcdwangtao/blog/1629059

Node Allocatable Resource = Node Capacity - Kube-reserved - system-reserved - eviction-threshold

--eviction-hard=memory.available<1024Mi,nodefs.available<10%,nodefs.inodesFree<5% \

--system-reserved=cpu=0.5,memory=1G \ --kube-reserved=cpu=0.5,memory=1G \

--kube-reserved-cgroup=/system.slice/kubelet.service \

--system-reserved-cgroup=/system.slice \

--enforce-node-allocatable=pods,kube-reserved,system-reserved \

7. nfs挂载错误wrong fs type, bad option, bad superblock

根据错误提示，查看/sbin/mount.文件，果然发现没有/sbin/mount.nfs的文件，安装nfs-utils即可

8. kube-apiserver accept4: too many open files

http: Accept error: accept tcp 0.0.0.0:6443: accept4: too many open files; retrying in 1s

查看apiserver进程，lsof -p $pid，发现占用65540个，查看cat /proc/$pid/limits发现限制在65536个，查看占用的一大堆10250的某个kubelet，发现如下错误

perationExecutor.UnmountVolume started for volume "makepool1-web3" (UniqueName: "kubernetes.io/nfs/7be05590-3a46-11e9-906c-20040fedf0bc-makepool1-web3") pod "7be05590-3a46-11e9-906c-20040fedf0bc" (UID: "7be05590-3a46-11e9-906c-20040fedf0bc")

nestedpendingoperations.go:263] Operation for "\"kubernetes.io/nfs/7be05590-3a46-11e9-906c-20040fedf0bc-makepool1-web3\" (\"7be05590-3a46-11e9-906c-20040fedf0bc\")" failed. No retries permitted until 2019-03-07 12:31:28.78976568 +0800 CST m=+7328011.532812666 (durationBeforeRetry 2m2s). Error: "UnmountVolume.TearDown failed for volume \"makepool1-web3\" (UniqueName: \"kubernetes.io/nfs/7be05590-3a46-11e9-906c-20040fedf0bc-makepool1-web3\") pod \"7be05590-3a46-11e9-906c-20040fedf0bc\" (UID: \"7be05590-3a46-11e9-906c-20040fedf0bc\") : Unmount failed: exit status 16\nUnmounting arguments: /var/lib/kubelet/pods/7be05590-3a46-11e9-906c-20040fedf0bc/volumes/kubernetes.io~nfs/makepool1-web3\nOutput: umount.nfs: /var/lib/kubelet/pods/7be05590-3a46-11e9-906c-20040fedf0bc/volumes/kubernetes.io~nfs/makepool1-web3: device is busy\n\n"

目前解决方案：
kubectl delete --grace-period=0 --force
https://github.com/kubernetes/kubernetes/issues/51835

9. Kubernetes Pod无法删除,Docker: Device is busy问题的解决

参考： https://fav.snadn.cn/article/snapshot?id=131#问题发现

10. k8s 证书过期，一年时间，

2. 自动轮换 kubelet 证书

注：kubelet证书分为server和client两种， k8s 1.9默认启用了client证书的自动轮换，但server证书自动轮换需要用户开启。方法是：

2.1 增加 kubelet 参数

--feature-gates=RotateKubeletServerCertificate=true

2.2 增加 controller-manager 参数

--experimental-cluster-signing-duration=87600h0m0s
--feature-gates=RotateKubeletServerCertificate=true

2.3 创建 rbac 对象

创建rbac对象，允许节点轮换kubelet server证书：
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRole
metadata:
  annotations:
    rbac.authorization.kubernetes.io/autoupdate: "true"
  labels:
    kubernetes.io/bootstrapping: rbac-defaults
  name: system:certificates.k8s.io:certificatesigningrequests:selfnodeserver
rules:
- apiGroups:
  - certificates.k8s.io
  resources:
  - certificatesigningrequests/selfnodeserver
  verbs:
  - create
---
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRoleBinding
metadata:
  name: kubeadm:node-autoapprove-certificate-server
roleRef:
  apiGroup: rbac.authorization.k8s.io
  kind: ClusterRole
  name: system:certificates.k8s.io:certificatesigningrequests:selfnodeserver
subjects:
- apiGroup: rbac.authorization.k8s.io
  kind: Group
  name: system:nodes

11. k8s无法删除namespace 提示 Terminating

解决方法：

kubectl get ns ns-xxx-zhangzhonglin-444c6833 -o json > ns-delete.json

删除文件中spec.finalizers字段

"spec": {
},

注：在执行命令前，要先克隆一个新会话，执行 kubectl proxy --port=8081

curl -k -H "Content-Type: application/json" -X PUT --data-binary @ns-delete.json http://127.0.0.1:8081/api/v1/namespaces/ns-xxx-zhangzhonglin-444c6833/finalize

12. Kubernetes: No Route to Host

Error getting server version: Get https://10.200.0.1:443/version?timeout=32s: dial tcp 10.200.0.1:443: connect: no route to host

解决方法： iptables -F

苦

13. kubeadm kube-controller-manager does not have ceph rbd binary anymore

Error: "failed to create rbd image: executable file not found in $PATH, command output: "

https://github.com/kubernetes/kubernetes/issues/56990

yum install -y ceph-common

14. monclient: _check_auth_rotating possible clock skew, rotating keys expired way too early (before 2019-05-06 02:00:09.601676)

ceph osd问题，主要是时钟不同步问题

15. helm报这个错误 Helm: Error: no available release name found

因为 tiller没有正确的角色权限

kubectl create serviceaccount --namespace kube-system tiller

kubectl create clusterrolebinding tiller-cluster-rule --clusterrole=cluster-admin --serviceaccount=kube-system:tiller

kubectl patch deploy --namespace kube-system tiller-deploy -p '{"spec":{"template":{"spec":{"serviceAccount":"tiller"}}}}'

16. attachdetach-controller Multi-Attach error for volume "pvc-d0fde86c-8661-11e9-b873-0800271c9f15" Volume is already used by pod

The controller-managed attachment and detachment is not able to detach a rbd volume from a lost node #62061

https://github.com/kubernetes/kubernetes/issues/70349

https://github.com/kubernetes/kubernetes/pull/45346

https://github.com/kubernetes/kubernetes/issues/53059

https://github.com/kubernetes/kubernetes/pull/40148

Vsphere Cloud Provider: failed to detach volume from shutdown node #75342

Don't try to attach volumes which are already attached to other nodes #45346

Pods with volumes stuck in ContainerCreating after cluster node is deleted from OpenStack #50200

Don't try to attach volumes which are already attached to other nodes#40148

Pods with volumes stuck in ContainerCreating after cluster node is powered off in vCenter #50944

Pod mount Ceph RDB volumn failed due to timeout. "timeout expired waiting for volumes to attach or mount for pod" #75492 (没人跟帖)

17. kubelet 挂掉，csi-rbdplugin 依然建在（statefuleset）

18. k8s pv无法删除问题

pv始终处于“Terminating”状态，而且delete不掉

删除k8s中的记录 kubectl patch pv xxx -p '{"metadata":{"finalizers":null}}'

19. Volumes fail to clean up when kubelet restart due to race between actual and desired state #75345

Fix race condition between actual and desired state in kublet volume manager #75458

Pod is stuck in Terminating status forever after Kubelet restart #72604

20. when using ValidatingWebhookConfiguration for deployment subresource(scale) validation. `Internal error occurred: converting (extensions.Deployment).Replicas to (v1beta1.Scale).Replicas: Selector not present in src`

该问题已经修复，v15版本

https://github.com/kubernetes/kubernetes/pull/76849/commits

21. Error from server: Get https://master-node:10250/containerLogs/default/csi-hostpathplugin-0/node-driver-registrar: dial tcp: lookup master-node on 114.114.114.114:53: no such host

解决方法，在 /etc/hosts 添加 192.168.X.X master-node

22. 无法删除image报rbd: error: image still has watchers解决方法

参考. 无法删除image报rbd: error: image still has watchers解决方法

解决思路：

在Ceph集群日常运维中，管理员可能会遇到有的image删除不了的情况：
1）由于image下有快照信息，只需要先将快照信息清除，然后再删除该image即可
2）该image仍旧被一个客户端在访问，具体表现为该image中有watcher。如果该客户端异常了，那么就会出现无法删除该image的情况

对于第一种情况，很好解决，下面要说的是第二种情况该如何解决。解决之前先科普一下watcher相关的知识：
Ceph中有一个watch/notify机制(粒度是object)，它用来在不同客户端之间进行消息通知，使得各客户端之间的状态保持一致，而每一个进行watch的客户端，对于Ceph集群来说都是一个watcher。

解决方法：

1. 查看当前image上的watcher

查看方法一：
[root@node3 ~]# rbd status foo
watcher=192.168.197.157:0/1135656048 client.4172 cookie=1
这种查看方法简单快捷，值得推荐

查看方法二：

1）首先找到image的header对象
[root@node3 ~]# rbd info foo
rbd image 'foo':
        size 1024 MB in 256 objects
        order 22 (4096 kB objects)
        block_name_prefix: rbd_data.1041643c9869
        format: 2
        features: layering
        flags: 
        create_timestamp: Tue Oct 17 10:20:50 2017
由该image的block_name_prefix为 rbd_data.1041643c9869，可知该image的header对象为rbd_header.1041643c9869，得到了header对象后，查看watcher信息

2）查看该image的header对象上的watcher信息
[root@node3 ~]# rados -p rbd listwatchers rbd_header.1041643c9869
watcher=192.168.197.157:0/1135656048 client.4172 cookie=1
2. 删除image上的watcher

2.1 把该watcher加入黑名单：
[root@node3 ~]# ceph osd blacklist add 192.168.197.157:0/1135656048 
blacklisting 192.168.197.157:0/1135656048 until 2017-10-18 12:04:19.103313 (3600 sec)
2.2 查看占用该image的watcher：
[root@node3 ~]# rados -p rbd listwatchers  rbd_header.1041643c9869
[root@node3 ~]# 
异常客户端的watcher信息已经不存在了，之后我们就可以对该image进行删除操作了

2.3 删除该image：
[root@node3 ~]# rbd rm foo
Removing image: 100% complete...done.
3. 后续操作

实际上做完上面的已经解决了问题，不过最好还是把加入黑名单的客户端移除，下面是有关黑名单的相关操作

3.1 查询黑名单列表：
[root@node3 ~]# ceph osd blacklist ls
listed 1 entries
192.168.197.157:0/1135656048 2017-10-18 12:04:19.103313
3.2 从黑名单移出一个客户端：
[root@node3 ~]# ceph osd blacklist rm 192.168.197.157:0/1135656048 
un-blacklisting 192.168.197.157:0/1135656048
3.3 清空黑名单：
[root@node3 ~]# ceph osd blacklist clear
 removed all blacklist entries
参考文献

删除 Ceph 的image报rbd: error: image still has watchers

CentOS8下安装wget、wget2 奔跑吧邓邓子高效运维 linux centos wget wget2
提示：“奔跑吧邓邓子”的高效运维专栏聚焦于各类运维场景中的实际操作与问题解决。内容涵盖服务器硬件（如IBMSystem3650M5）、云服务平台（如腾讯云、华为云）、服务器软件（如Nginx、Apache、GitLab、Redis、Elasticsearch、Kubernetes、Docker等）、开发工具（如Git、HBuilder）以及网络安全（如挖矿病毒排查、SSL证书配置）等多个方面。无论
Docker 和 Kubernetes 小馋喵知识杂货铺性能 docker kubernetes 容器
Docker和Kubernetes(K8s)是当前最流行的容器化技术，用于开发、部署和管理应用程序。它们通常一起使用，提供从开发到生产的完整生命周期管理，特别是在微服务架构和云原生应用的开发中。1.Docker简介Docker是一个开源的容器化平台，它可以将应用及其所有依赖项打包在一个统一的容器中，从而简化了软件的开发、部署、运行和管理。容器化应用具有跨平台、一致性强、启动速度快等特点。容器：一个
Kubeadm自动化部署kubernetes 1.29.1 爱喝荔枝味嘉宾自动化 kubernetes docker
基础环境配置服务器：centos7.720191、规划网络环境：192.168.7.20k8s-master.linux.com2U4G192.168.7.21k8s-node01.linux.com2U8G192.168.7.22k8s-node02.linux.com2U8G！！！！注意以下步骤三个机器都需要执行2、配置master与node的主机名解析┌─[k8s-master]─[~]└─
《Kubernetes部署篇：基于麒麟V10+ARM64架构部署harbor v2.4.0镜像仓库》东城绝神《Linux运维实战总结》arm64 harbor
总结：整理不易，如果对你有帮助，可否点赞关注一下？更多详细内容请参考：企业级K8s集群运维实战一、环境信息K8S版本操作系统CPU架构服务版本1.26.15KylinLinuxAdvancedServerV10ARM64harborv2.4.0二、部署操作2.1、资源包下载说明：如果你从别处找来的镜像，redis提示报错ignore-warningsARM64-COW-BUG，可以重新编译redi
深入 Kubernetes 的健康奥秘：探针（Probe）究竟有多强？云计算
深入Kubernetes的健康奥秘：探针（Probe）究竟有多强？“Probe”——这是K8s世界里一个特别常见但又不够“高调”的单词。如果你第一次接触K8s，可能很难想象这个看似普通的小工具竟然是K8s自动化运维的核心之一。探针（Probe）的作用就像集群的“健康监护员”，负责检测和管理容器的健康状态。没有它，K8s的稳定性和高可用性可能会大打折扣。本文将从探针的原理讲起，结合实际场景深入解析它
在现有 Docker Desktop 环境下安装与配置独立 Kubernetes环境自学AI的鲨鱼儿 #环境安装 docker kubernetes 容器
在现有DockerDesktop环境下安装与配置独立Kubernetes集群环境目标在已安装DockerDesktop自带Kubernetes的情况下，搭建一个独立Kubernetes集群环境。配置独立的kubectl工具，使其默认管理独立的Kubernetes集群。保留DockerDesktop的Kubernetes环境，确保与独立环境互不干扰。实现多个Kubernetes环境之间的灵活切换。一
Nacos| Sentinel| K8S fhzmWJ 分布式+容器
目录NacosSentinelK8S集群NacosNacos是构建以服务为中心的现代应用架构(例如微服务范式、云原生范式)的服务基础设施。Nacos支持几乎所有主流类型的服务的发现、配置和管理：KubernetesServicegRPC&DubboRPCServiceSpringCloudRESTfulServiceNacos的关键特性包括:服务发现和服务健康监测Nacos支持基于DNS和基于RP
ctr、crictl和nerdctl命令介绍与常用命令列表篙芷容器
ctr、crictl和nerdctl命令区分ctr工具ctr是containerd提供的官方CLI（命令行工具），主要用于与containerd守护进程交互。它允许用户直接操作容器、镜像和任务等资源，是containerd的核心管理工具之一。crictl工具crictl是一个遵循CRI（ContainerRuntimeInterface）规范的命令行工具，用于检查和调试Kubernetes集群中的
Kubernetes v1.17 版本解读 | 云原生生态周报 Vol. 31 编程微思
作者|徐迪、李传云、黄珂、汪萌海、张晓宇、何淋波、陈有坤、李鹏审核|陈俊上游重要进展1.Kubernetesv1.17版本发布功能稳定性是第一要务。v1.17包含22个增强功能：14个增强功能已逐渐稳定，4个增强功能已进入beta版，4个增强功能已进入alpha版本。MajorTheme云提供商标签达到GA这个自1.2版本就引入的label，在1.17版本终于GA。之前旧的label已经被废弃掉：
K8S中Pod控制器之CronJob(CJ)控制器元气满满的热码式 kubernetes 容器云原生
CronJob控制器是Kubernetes中用于周期性执行任务的一种控制器，它基于Job控制器来创建和管理作业。以下是CronJob的一些关键特点：周期性调度：CronJob允许您定义一个基于时间的调度，类似于Linux的cron工具，来周期性地执行任务。时间点触发：CronJob根据指定的时间表（cron表达式）触发，可以精确到分钟。一次性或重复执行：尽管CronJob主要用于重复性任务，但它也
在 Kubernetes 上快速安装 KubeSphere v4.1.2 喝醉酒的小白 K8s kubernetes 容器云原生
目录标题安装文档配置repo安装使用插件安装文档在Kubernetes上快速安装KubeSphere配置repoexporthttps_proxy=10.10.x.x:7890helmrepoaddstablehttps://charts.helm.sh/stablehelmrepoupdate安装helmupgrade--install-nkubesphere-system--create-na
云原生周刊：K8s 生产环境架构设计及成本分析 KubeSphere 云原生 k8s 容器平台 kubesphere 云计算
开源项目推荐KubeZoneNetKubeZoneNet旨在帮助监控和优化Kubernetes集群中的跨可用区（Cross-Zone）网络流量。这个项目提供了一种简便的方式来跟踪和分析Kubernetes集群中跨不同可用区的通信，帮助用户优化集群的网络架构、提高资源利用效率并减少网络延迟。通过实时监控和数据分析，KubeZoneNet能有效地识别跨可用区的网络瓶颈，并提供改进建议，以支持Kuber
我的软件架构师——Java 职位面试经历。小蜗牛慢慢爬行 java 面试开发语言职场和发展后端 spring boot spring
最近，我参加了一家领先的服务型公司的软件架构师（Java）职位的面试。我在这里分享了一些面试官问我的问题。我只列出了与Java相关的问题，因为本文主要关注Java。面试官问我有关AWS、Docker、Kubernetes、Kafka、ElasticSearch、SQL/NoSQL和设计模式的问题。ClassNotFoundException和NoClassDefFoundError有什么区别？当您
Kubernetes(k8s) 架构设计 boonya #k8s kubernetes 容器云原生
目录节点管理节点自注册手动节点管理节点状态地址状况容量与可分配信息节点控制器节点容量节点拓扑节点体面关闭接下来控制面到节点通信节点到控制面控制面到节点API服务器到kubeletapiserver到节点、Pod和服务SSH隧道Konnectivity服务控制器控制器模式通过API服务器来控制直接控制期望状态与当前状态设计运行控制器的方式接下来云控制器管理器的基础概念设计云控制器管理器的功能节点控制
Kubernetes架构原则和对象设计（二） grahamzhu 云原生学习专栏 kubernetes 架构容器集群搭建 API设计云计算 kubelet
云原生学习路线导航页（持续更新中）kubernetes学习系列快捷链接Kubernetes架构原则和对象设计（一）Kubernetes常见问题解答本文从云计算架构发展入手，详细分析了kubernetes的生态系统、设计理念、分层架构、API设计原则、架构设计原则等，并介绍了使用kubelet+staticPod拉起集群的过程1.云计算的传统分类云计算出现之前，对于任何企业，想要搭建自己的服务，需要
Linux Kubernetes Helm之使用helm部署ingress-nginx 阿然A
kubernetesHelm之使用helm部署ingress-nginx一、部署二、测试三、部署加密访问部署前将之前部署的ingress-nginx删除：[root@server1helm]#kubectldeletenamespacesingress-nginxnamespace"ingress-nginx"deleted[root@server1nginx-ingress]#kubectlge
github go star前50的项目可乐泡枸杞· github golang 开发语言开源软件开源
以下是按星标数排序的前50个Go语言的GitHub仓库。1.avelino/awesome-go星标数:126619简介:AcuratedlistofawesomeGoframeworks,librariesandsoftware语言:Go项目Logo:2.golang/go星标数:121848简介:TheGoprogramminglanguage语言:Go项目Logo:3.kubernetes/
kubernetes 集群搭建(二进制方式) 難釋懷 kubernetes 容器云原生
Kubernetes作为当今最流行的容器编排平台，提供了强大的功能来管理和扩展容器化应用。除了使用kubeadm等工具简化集群的创建过程外，直接通过二进制文件安装Kubernetes组件也是一种常见的方法。这种方式给予用户更多的控制权，并且适用于那些希望深入理解Kubernetes内部工作原理的人。本文将详细介绍如何通过二进制方式搭建一个功能齐全的Kubernetes集群，并分享一些实用技巧和注意
微服务学习-Nacos简介 fox_lht java 分布式架构 spring 微服务 java microservices
微服务学习-Nacos简介用于服务管理中心和配置管理中心。实现动态服务发现、服务配置、服务元数据及流量管理。支持的服务KubernetesServicegRPC&DubboRPCServiceSpringCloudRESTfulService关键特性服务管理支持基于DNS和基于RPC的服务发现服务提供者注册（原生SDK、OpenApi、独立的AgentTODO）服务消费者查找和发现服务（DNSTO
使用kubeadm搭建kubernetes单机master，亲测无异常(1) 2301_76238237 程序员 kubernetes 容器云原生
sudocat/sys/class/dmi/id/product_uuid//每台机器的uuid不能相同ifconfig-a//ip不能相同2.开放端口|协议|方向|端口范围|作用|使用者||—|—|—|—|—||TCP|入站|6443|KubernetesAPI服务器|所有组件||TCP|入站|2379-2380|etcd服务器客户端API|kube-apiserver,etcd||TCP|入站
云原生周刊：K8s 生产环境架构设计及成本分析云计算
开源项目推荐KubeZoneNetKubeZoneNet旨在帮助监控和优化Kubernetes集群中的跨可用区（Cross-Zone）网络流量。这个项目提供了一种简便的方式来跟踪和分析Kubernetes集群中跨不同可用区的通信，帮助用户优化集群的网络架构、提高资源利用效率并减少网络延迟。通过实时监控和数据分析，KubeZoneNet能有效地识别跨可用区的网络瓶颈，并提供改进建议，以支持Kuber
Anthropic运维工程师的IT基础设施总结清单（上） CloudPilotAI IT基础设施运维 kubernetes 工程师
Karpenter开源地址：https://github.com/kubernetes-sigs/karpenter本文由Anthropic工程师JackLindamood撰写，分享了他之前在一家初创公司中负责IT基础设施的经验，包括从中吸取的教训和一些最佳实践。过去四年里，我负责了一家初创公司的基础设施建设工作。这家公司当时正寻求快速扩大规模。从一开始，我们就做出了一些核心决策，这些决策在过去四
npm install CERT_HAS_EXPIRED解决方法奔跑吧邓邓子常见问题解答（FAQ）npm 前端 node.js expired npm install
提示：“奔跑吧邓邓子”的常见问题专栏聚焦于各类技术领域常见问题的解答。涵盖操作系统（如CentOS、Linux等）、开发工具（如AndroidStudio）、服务器软件（如Zabbix、JumpServer、RocketMQ等）以及远程桌面、代码克隆等多种场景。针对如远程桌面无法复制粘贴、Kubernetes报错、自启动报错、各类软件安装报错、内存占用问题、网络连接问题等提供了详细的问题描述与有效
Sealos 将计算节点加入 kubeadm 安装的 Kubernetes 集群 ivwdcwso 运维 kubernetes 容器云原生 k8s sealos
引言Kubernetes是云原生应用的核心平台，而kubeadm是官方推荐的Kubernetes集群部署工具。然而，随着集群规模的扩大，手动管理节点变得越来越复杂。Sealos作为一款以Kubernetes为内核的云操作系统，提供了简单高效的节点管理功能，能够轻松地将计算节点加入到现有的Kubernetes集群中。本文将详细介绍如何在使用kubeadm安装主节点的基础上，使用Sealos将计算节点
K8S中Pod控制器之Horizontal Pod Autoscaler(HPA)控制器元气满满的热码式 kubernetes 容器云原生
HorizontalPodAutoscaler(HPA)控制器HorizontalPodAutoscaler（HPA）是Kubernetes中用于自动根据当前的负载情况，自动调整Pod数量的一种控制器。HPA能够根据CPU使用率、内存使用量或其他选择的度量指标来自动扩展Pod的数量，以确保应用的性能。HPA可以获取每个Pod利用率，然后和HPA中定义的指标进行对比，同时计算出需要伸缩的具体值，最后
正式开源，Doris Operator 支持高效 Kubernetes 容器化部署方案 SelectDB技术团队 kubernetes 容器化部署数据仓库云原生开源
容器化凭借其灵活性、跨平台性、自动化管理和极致弹性，吸引了众多企业的关注。一些企业希望将ApacheDoris容器化部署，以实现高效的资源利用与部署迭代。Kubernetes提供的编排和管理功能，能完成大规模容器部署，但Kubernetes自身的复杂性也导致众多企业面临部署复杂、运维困难、使用难度高等挑战。为满足用户在Kubernetes平台上对Doris的高效部署和运维要求，飞轮科技推出了Dor
通俗易懂 serverless 架构、微服务架构和云原生架构，并简单代码 Ai君臣架构架构云原生 serverless
文章目录1serverless架构、微服务架构和云原生架构区别1.Serverless架构示例：AWSLambda+APIGateway2.微服务架构示例：Flask微服务3.云原生架构示例：Docker和Kubernetes2Kubernetes中管理多个副本和流量两个关键组件1.Deployment2.Service负载均衡流量管理1serverless架构、微服务架构和云原生架构区别别用代码
Scaleph：基于Kubernetes的开放式数据平台尤淞渊
Scaleph：基于Kubernetes的开放式数据平台scalephOpendataplatformbasedonFlinkandKubernetes,supportsweb-uiclick-and-dropdataintegrationwithSeaTunnelbackendedbyFlinkengine,flinkonlinesqldevelopmentbackendedbyFlinkSql
【赵渝强老师】Kubernetes中Pod的探针
在K8s集群中，当Pod处于运行状态时，kubelet通过使用探针（Probe）对容器的健康状态执行检查和诊断。Kubernetes支持的三种类型的探针。视频讲解如下：https://www.bilibili.com/video/BV1V1tFenEXL/?aid=113130512390...下面分别进行介绍。livenessProbe（存活探针）该类型的探针将检查Pod中的容器是否正在运行。如
k8s mysql数据目录挂载_【kubernetes】k8s数据卷,pod挂载本地路径九罭之魚 k8s mysql数据目录挂载
环境：Linux服务器配置挂载目录思路：在部署pod的节点(宿主机)配置同样的挂载路径到一个固定的服务器(目标服务器)，这样不管pod在哪里跑，文件的保存路径都是不变的1.安装sshfsyuminstall-ysshfs2.添加ssh认证把节点的ssh公钥拷贝到目标服务器的~/.ssh/authorizedkeys中3.挂载目录在节点服务器执行：sshfsUSER@目标服务器IP:/path/to
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理

【kubernetes/k8s概念】k8s 坑问题汇总

1. Pod始终处于Pending状态

2. Pod始终处于Waiting状态

3. Pod 处于 CrashLoopBackOff 状态

5. Pod一直崩溃或运行不正常

6. 集群雪崩需给Kubelet预留资源

7. nfs挂载错误wrong fs type, bad option, bad superblock

8. kube-apiserver accept4: too many open files

9. Kubernetes Pod无法删除,Docker: Device is busy问题的解决

10. k8s 证书过期，一年时间，

2. 自动轮换 kubelet 证书

2.1 增加 kubelet 参数

2.2 增加 controller-manager 参数

2.3 创建 rbac 对象

11. k8s无法删除namespace 提示 Terminating

12. Kubernetes: No Route to Host

13. kubeadm kube-controller-manager does not have ceph rbd binary anymore

https://github.com/kubernetes/kubernetes/issues/56990

14. monclient: _check_auth_rotating possible clock skew, rotating keys expired way too early (before 2019-05-06 02:00:09.601676)

15. helm报这个错误 Helm: Error: no available release name found

16. attachdetach-controller Multi-Attach error for volume "pvc-d0fde86c-8661-11e9-b873-0800271c9f15" Volume is already used by pod

18. k8s pv无法删除问题

19. Volumes fail to clean up when kubelet restart due to race between actual and desired state #75345

20. when using ValidatingWebhookConfiguration for deployment subresource(scale) validation. Internal error occurred: converting (extensions.Deployment).Replicas to (v1beta1.Scale).Replicas: Selector not present in src

21. Error from server: Get https://master-node:10250/containerLogs/default/csi-hostpathplugin-0/node-driver-registrar: dial tcp: lookup master-node on 114.114.114.114:53: no such host

22. 无法删除image报rbd: error: image still has watchers解决方法

解决思路：

解决方法：

1. 查看当前image上的watcher

查看方法一：

查看方法二：

2. 删除image上的watcher

2.1 把该watcher加入黑名单：

2.2 查看占用该image的watcher：

2.3 删除该image：

3. 后续操作

3.1 查询黑名单列表：

3.2 从黑名单移出一个客户端：

3.3 清空黑名单：

参考文献

你可能感兴趣的:(kubernetes)

20. when using ValidatingWebhookConfiguration for deployment subresource(scale) validation. `Internal error occurred: converting (extensions.Deployment).Replicas to (v1beta1.Scale).Replicas: Selector not present in src`