千与千寻之前

Prometheus Operator 监控 Kubernetes 集群

目录[-]

系统参数：

Prometheus Operator版本： 0.29
Kubernetes 版本： 1.14.0
项目 Github 地址： https://github.com/coreos/kube-prometheus

这里推荐手动下来源码安装，不推荐 helm 方式，因为国内那道伟大的墙……内置文件中很多镜像无法拉取下来，需要进行改动。

一、介绍

1、Kubernetes Operator 介绍

在 Kubernetes 的支持下，管理和伸缩 Web 应用、移动应用后端以及 API 服务都变得比较简单了。其原因是这些应用一般都是无状态的，所以 Deployment 这样的基础 Kubernetes API 对象就可以在无需附加操作的情况下，对应用进行伸缩和故障恢复了。

而对于数据库、缓存或者监控系统等有状态应用的管理，就是个挑战了。这些系统需要应用领域的知识，来正确的进行伸缩和升级，当数据丢失或不可用的时候，要进行有效的重新配置。我们希望这些应用相关的运维技能可以编码到软件之中，从而借助 Kubernetes 的能力，正确的运行和管理复杂应用。

Operator 这种软件，使用 TPR(第三方资源，现在已经升级为 CRD) 机制对 Kubernetes API 进行扩展，将特定应用的知识融入其中，让用户可以创建、配置和管理应用。和 Kubernetes 的内置资源一样，Operator 操作的不是一个单实例应用，而是集群范围内的多实例。

2、Prometheus Operator 介绍

Kubernetes 的 Prometheus Operator 为 Kubernetes 服务和 Prometheus 实例的部署和管理提供了简单的监控定义。

安装完毕后，Prometheus Operator提供了以下功能：

创建/毁坏： 在 Kubernetes namespace 中更容易启动一个 Prometheus 实例，一个特定的应用程序或团队更容易使用Operator。
简单配置: 配置 Prometheus 的基础东西，比如在 Kubernetes 的本地资源 versions, persistence, retention policies, 和 replicas。
Target Services 通过标签： 基于常见的Kubernetes label查询，自动生成监控target 配置；不需要学习普罗米修斯特定的配置语言。

3、Prometheus Operator 系统架构图

Operator： Operator 资源会根据自定义资源（Custom Resource Definition / CRDs）来部署和管理 Prometheus Server，同时监控这些自定义资源事件的变化来做相应的处理，是整个系统的控制中心。
Prometheus： Prometheus 资源是声明性地描述 Prometheus 部署的期望状态。
Prometheus Server： Operator 根据自定义资源 Prometheus 类型中定义的内容而部署的 Prometheus Server 集群，这些自定义资源可以看作是用来管理 Prometheus Server 集群的 StatefulSets 资源。
ServiceMonitor： ServiceMonitor 也是一个自定义资源，它描述了一组被 Prometheus 监控的 targets 列表。该资源通过 Labels 来选取对应的 Service Endpoint，让 Prometheus Server 通过选取的 Service 来获取 Metrics 信息。
Service： Service 资源主要用来对应 Kubernetes 集群中的 Metrics Server Pod，来提供给 ServiceMonitor 选取让 Prometheus Server 来获取信息。简单的说就是 Prometheus 监控的对象，例如 Node Exporter Service、Mysql Exporter Service 等等。
Alertmanager： Alertmanager 也是一个自定义资源类型，由 Operator 根据资源描述内容来部署 Alertmanager 集群。

二、更改 kubernetes 配置

由于 Kubernetes 集群是由 kubeadm 搭建的，其中 kube-scheduler 默认绑定 IP 是 127.0.0.1 地址。Prometheus Operator 是通过节点 IP 去访问，所以我们将 kube-scheduler 绑定的地址更改成 0.0.0.0。

编辑 /etc/kubernetes/manifests/kube-scheduler.yaml 文件

$ vim /etc/kubernetes/manifests/kube-scheduler.yaml

将 command 的 bind-address 地址更改成 0.0.0.0

......
spec:
  containers:
  - command:
    - kube-scheduler
    - --bind-address=0.0.0.0    #改为0.0.0.0
    - --kubeconfig=/etc/kubernetes/scheduler.conf
    - --leader-elect=true
......

三、拉取 Prometheus Operator

先从 Github 上将源码拉取下来，利用源码项目已经写好的 kubernetes 的 yaml 文件进行一系列集成镜像的安装，如 grafana、prometheus 等等。

从 GitHub 拉取 Prometheus Operator 源码

$ git clone https://github.com/coreos/kube-prometheus.git

四、进行文件分类

由于它的文件都存放在项目源码的 manifests 文件夹下，所以需要进入其中进行启动这些 kubernetes 应用 yaml 文件。又由于这些文件堆放在一起，不利于分类启动，所以这里将它们分类。

进入源码的 manifests 文件夹

$ cd kube-prometheus/manifests/

创建文件夹并且将 yaml 文件分类

# 创建文件夹
$ mkdir -p operator node-exporter alertmanager grafana kube-state-metrics prometheus serviceMonitor adapter

# 移动 yaml 文件，进行分类到各个文件夹下
mv *-serviceMonitor* serviceMonitor/
mv 0prometheus-operator* operator/
mv grafana-* grafana/
mv kube-state-metrics-* kube-state-metrics/
mv alertmanager-* alertmanager/
mv node-exporter-* node-exporter/
mv prometheus-adapter* adapter/
mv prometheus-* prometheus/

基本目录结构如下：

manifests/
├── 00namespace-namespace.yaml
├── adapter
│   ├── prometheus-adapter-apiService.yaml
│   ├── prometheus-adapter-clusterRoleAggregatedMetricsReader.yaml
│   ├── prometheus-adapter-clusterRoleBindingDelegator.yaml
│   ├── prometheus-adapter-clusterRoleBinding.yaml
│   ├── prometheus-adapter-clusterRoleServerResources.yaml
│   ├── prometheus-adapter-clusterRole.yaml
│   ├── prometheus-adapter-configMap.yaml
│   ├── prometheus-adapter-deployment.yaml
│   ├── prometheus-adapter-roleBindingAuthReader.yaml
│   ├── prometheus-adapter-serviceAccount.yaml
│   └── prometheus-adapter-service.yaml
├── alertmanager
│   ├── alertmanager-alertmanager.yaml
│   ├── alertmanager-secret.yaml
│   ├── alertmanager-serviceAccount.yaml
│   └── alertmanager-service.yaml
├── grafana
│   ├── grafana-dashboardDatasources.yaml
│   ├── grafana-dashboardDefinitions.yaml
│   ├── grafana-dashboardSources.yaml
│   ├── grafana-deployment.yaml
│   ├── grafana-serviceAccount.yaml
│   └── grafana-service.yaml
├── kube-state-metrics
│   ├── kube-state-metrics-clusterRoleBinding.yaml
│   ├── kube-state-metrics-clusterRole.yaml
│   ├── kube-state-metrics-deployment.yaml
│   ├── kube-state-metrics-roleBinding.yaml
│   ├── kube-state-metrics-role.yaml
│   ├── kube-state-metrics-serviceAccount.yaml
│   └── kube-state-metrics-service.yaml
├── node-exporter
│   ├── node-exporter-clusterRoleBinding.yaml
│   ├── node-exporter-clusterRole.yaml
│   ├── node-exporter-daemonset.yaml
│   ├── node-exporter-serviceAccount.yaml
│   └── node-exporter-service.yaml
├── operator
│   ├── 0prometheus-operator-0alertmanagerCustomResourceDefinition.yaml
│   ├── 0prometheus-operator-0prometheusCustomResourceDefinition.yaml
│   ├── 0prometheus-operator-0prometheusruleCustomResourceDefinition.yaml
│   ├── 0prometheus-operator-0servicemonitorCustomResourceDefinition.yaml
│   ├── 0prometheus-operator-clusterRoleBinding.yaml
│   ├── 0prometheus-operator-clusterRole.yaml
│   ├── 0prometheus-operator-deployment.yaml
│   ├── 0prometheus-operator-serviceAccount.yaml
│   └── 0prometheus-operator-service.yaml
├── prometheus
│   ├── prometheus-clusterRoleBinding.yaml
│   ├── prometheus-clusterRole.yaml
│   ├── prometheus-prometheus.yaml
│   ├── prometheus-roleBindingConfig.yaml
│   ├── prometheus-roleBindingSpecificNamespaces.yaml
│   ├── prometheus-roleConfig.yaml
│   ├── prometheus-roleSpecificNamespaces.yaml
│   ├── prometheus-rules.yaml
│   ├── prometheus-serviceAccount.yaml
│   └── prometheus-service.yaml
└── serviceMonitor
    ├── 0prometheus-operator-serviceMonitor.yaml
    ├── alertmanager-serviceMonitor.yaml
    ├── grafana-serviceMonitor.yaml
    ├── kube-state-metrics-serviceMonitor.yaml
    ├── node-exporter-serviceMonitor.yaml
    ├── prometheus-serviceMonitorApiserver.yaml
    ├── prometheus-serviceMonitorCoreDNS.yaml
    ├── prometheus-serviceMonitorKubeControllerManager.yaml
    ├── prometheus-serviceMonitorKubelet.yaml
    ├── prometheus-serviceMonitorKubeScheduler.yaml
    └── prometheus-serviceMonitor.yaml

五、修改源码 yaml 文件

由于这些 yaml 文件中设置的应用镜像国内无法拉取下来，所以修改源码中的这些 yaml 的镜像设置，替换镜像地址方便拉取安装。再之后因为需要将 Grafana & Prometheus 通过 NodePort 方式暴露出去，所以也需要修改这两个应用的 service 文件。

1、修改镜像

(1)、修改 operator

修改 0prometheus-operator-deployment.yaml 文件

$ vim operator/0prometheus-operator-deployment.yaml

改成如下：

修改 config-reloader-image 配置
修改 prometheus-config-reloader 配置
修改 image 镜像

......
spec:
  replicas: 1
  selector:
    matchLabels:
      k8s-app: prometheus-operator
  template:
    metadata:
      labels:
        k8s-app: prometheus-operator
    spec:
      containers:
      - args:
        - --kubelet-service=kube-system/kubelet
        - --logtostderr=true
        - --config-reloader-image=jimmidyson/configmap-reload:v0.0.1    #修改 config-reloader-image 配置
        - --prometheus-config-reloader=rancher/coreos-prometheus-config-reloader:v0.29.0   #修改 prometheus-config-reloader 配置
        image: rancher/coreos-prometheus-operator:v0.29.0   #修改 image 镜像
        name: prometheus-operator
......

(2)、修改 adapter

修改 prometheus-adapter-deployment.yaml 文件

$ vim adapter/prometheus-adapter-deployment.yaml

改成如下：

修改 image 镜像

......
    spec:
      containers:
      - args:
        - --cert-dir=/var/run/serving-cert
        - --config=/etc/adapter/config.yaml
        - --logtostderr=true
        - --metrics-relist-interval=1m
        - --prometheus-url=http://prometheus-k8s.monitoring.svc:9090/
        - --secure-port=6443
        image: directxman12/k8s-prometheus-adapter-amd64:v0.4.1   #修改 image 镜像
        name: prometheus-adapter
......

(3)、修改 alertmanager

修改 alertmanager-alertmanager.yaml 文件

$ vim alertmanager/alertmanager-alertmanager.yaml

改成如下：

修改 image 镜像

......
spec:
  baseImage: prom/alertmanager   #修改 image 镜像
  nodeSelector:
    beta.kubernetes.io/os: linux
  replicas: 3
  securityContext:
    fsGroup: 2000
    runAsNonRoot: true
    runAsUser: 1000
  serviceAccountName: alertmanager-main
  version: v0.16.2

(4)、修改 node-exporter

修改 node-exporter-daemonset.yaml 文件

$ vim node-exporter/node-exporter-daemonset.yaml

改成如下：

修改 image 镜像

......
spec:
  containers:
  - args:
    - --web.listen-address=127.0.0.1:9100
    - --path.procfs=/host/proc
    - --path.sysfs=/host/sys
    - --path.rootfs=/host/root
    - --collector.filesystem.ignored-mount-points=^/(dev|proc|($|/)
    - --collector.filesystem.ignored-fs-types=^(autofs|up|configfs|debugfs|devpts|pstore)$
    image: prom/node-exporter:v0.17.0   #修改 image 镜像
    name: node-exporter
  - args:
    - --logtostderr
    - --secure-listen-address=$(IP):9100
    - --tls-cipher-suites=TLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256,TLS_ECDHE_ECDSA_WITH_AES_128_GCM_SHA256
    - --upstream=http://127.0.0.1:9100/
    image: registry.cn-shanghai.aliyuncs.com/mydlq/kube-rbac-proxy:v0.4.1   #修改 image 镜像
......

(5)、修改 kube-state-metrics

修改 kube-state-metrics-deployment.yaml 文件

$ vim kube-state-metrics/kube-state-metrics-deployment.yaml

改成如下：

修改 image 镜像

......
spec:
  containers:
  - args:
    - --logtostderr
    - --secure-listen-address=:8443
    - --tls-cipher-suites=TLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256
    - --upstream=http://127.0.0.1:8081/
    image: registry.cn-shanghai.aliyuncs.com/mydlq/kube-rbac-proxy:v0.4.1   #修改 image 镜像
    name: kube-rbac-proxy-main
  - args:
    - --logtostderr
    - --secure-listen-address=:9443
    - --tls-cipher-suites=TLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256
    - --upstream=http://127.0.0.1:8082/
    image: quay.io/coreos/kube-rbac-proxy:v0.4.1
    name: kube-rbac-proxy-self
  - args:
    - --host=127.0.0.1
    - --port=8081
    - --telemetry-host=127.0.0.1
    - --telemetry-port=8082
    image: rancher/coreos-kube-state-metrics:v1.5.0   #修改 image 镜像
    name: kube-state-metrics
  - command:
    - /pod_nanny
    - --container=kube-state-metrics
    - --cpu=100m
    - --extra-cpu=2m
    - --memory=150Mi
    - --extra-memory=30Mi
    - --threshold=5
    - --deployment=kube-state-metrics
    - name: MY_POD_NAMESPACE
      valueFrom:
        fieldRef:
          apiVersion: v1
          fieldPath: metadata.namespace
    image: siriuszg/addon-resizer:1.8.4   #修改 image 镜像
    name: addon-resizer
......

(6)、修改 node-exporter

修改 node-exporter-daemonset.yaml 文件

$ vim prometheus/prometheus-prometheus.yaml

改成如下：

修改 image 镜像

......
spec:
  alerting:
    alertmanagers:
    - name: alertmanager-main
      namespace: monitoring
      port: web
  baseImage: prom/prometheus   #修改 image 镜像
  nodeSelector:
    beta.kubernetes.io/os: linux
  replicas: 2
  resources:
    requests:
      memory: 400Mi
  ruleSelector:
    matchLabels:
      prometheus: k8s
      role: alert-rules
  securityContext:
    fsGroup: 2000
    runAsNonRoot: true
    runAsUser: 1000
  serviceAccountName: prometheus-k8s
  serviceMonitorNamespaceSelector: {}
  serviceMonitorSelector: {}
  version: v2.7.2

2、修改 Service 端口设置

(1)、修改 Prometheus Service

修改 prometheus-service.yaml 文件

$ vim prometheus/prometheus-service.yaml

修改prometheus Service端口类型为NodePort，设置nodePort端口为32101

apiVersion: v1
kind: Service
metadata:
  labels:
    prometheus: k8s
  name: prometheus-k8s
  namespace: monitoring
spec:
  type: NodePort
  ports:
  - name: web
    port: 9090
    targetPort: web
    nodePort: 32101
  selector:
    app: prometheus
    prometheus: k8s
  sessionAffinity: ClientIP

(2)、修改 Grafana Service

修改 prometheus-service.yaml 文件

$ vim prometheus/prometheus-service.yaml

修改garafana Service端口类型为NodePort，设置nodePort端口为32102

apiVersion: v1
kind: Service
metadata:
  labels:
    app: grafana
  name: grafana
  namespace: monitoring
spec:
  type: NodePort
  ports:
  - name: http
    port: 3000
    targetPort: http
    nodePort: 32102
  selector:
    app: grafana

六、安装Prometheus Operator

所有文件都在 manifests 目录下执行。

1、创建 namespace

$ kubectl apply -f 00namespace-namespace.yaml

2、安装 Operator

$ kubectl apply -f operator/

查看 Pod，等 pod 创建起来在进行下一步

$ kubectl get pods -n monitoring

NAME                                   READY   STATUS    RESTARTS
prometheus-operator-5d6f6f5d68-mb88p   1/1     Running   0

3、安装其它组件

$ kubectl apply -f adapter/
$ kubectl apply -f alertmanager/
$ kubectl apply -f node-exporter/
$ kubectl apply -f kube-state-metrics/
$ kubectl apply -f grafana/
$ kubectl apply -f prometheus/
$ kubectl apply -f serviceMonitor/

查看 Pod 状态

$ kubectl get pods -n monitoring

NAME                                   READY   STATUS    RESTARTS
alertmanager-main-0                    2/2     Running   0          
alertmanager-main-1                    2/2     Running   0         
alertmanager-main-2                    2/2     Running   0         
grafana-b6bd6d987-2kr8w                1/1     Running   0
kube-state-metrics-6f7cd8cf48-ftkjw    4/4     Running   0          
node-exporter-4jt26                    2/2     Running   0  
node-exporter-h88mw                    2/2     Running   0          
node-exporter-mf7rr                    2/2     Running   0 
prometheus-adapter-df8b6c6f-jfd8m      1/1     Running   0          
prometheus-k8s-0                       3/3     Running   0  
prometheus-k8s-1                       3/3     Running   0  
prometheus-operator-5d6f6f5d68-mb88p   1/1     Running   0

七、查看 Prometheus & Grafana

1、查看 Prometheus

打开地址： http://192.168.2.11:32101 查看 Prometheus 采集的目标，看其各个采集服务状态有木有错误。

2、查看 Grafana

打开地址： http://192.168.2.11:32102 查看 Grafana 图表，看其 Kubernetes 集群是否能正常显示。

探索高效嵌入式视觉应用：RK3588/RK3568/RK3566 Linux QT Opencv NPU YoloV5摄像头实时检测系统... 陆依嫣
探索高效嵌入式视觉应用：RK3588/RK3568/RK3566LinuxQTOpencvNPUYoloV5摄像头实时检测系统rk_yolov5.zip项目地址:https://gitcode.com/open-source-toolkit/f6845项目介绍在智能安防、机器人视觉等需要高性能图像处理和实时监控的应用场景中，RockchipRK3588、RK3568和RK3566处理器凭借其强大的
运维人故障定责甩锅话语指南-------收藏辣香牛肉面计算机基础运维
首先声明，本文章只在针对故障中那些不愿承担责任，而把锅甩给运维部门的人，如果讨论故障的都是君子，那么本文并不建议使用，切记。1、故障，故障，还是故障任何一个故障发生时，没有任何一个人是无辜的，开发的责任在于代码的bug，测试的责任在于测试用例不健全，运维的责任在于监控不到位或者故障处理不给力，一般在故障定责中，声音越大的一方，往往责任越大，所以在故障定责时，要学会察言观色，选择主攻点，不要广撒网，
动态调试线程池：使用JMX进行监控与管理星辰@Sea 系统架构 Java 其他 java jvm 开发语言
目录摘要1.引言2.什么是JMX3.线程池简介4.使用JMX动态调试线程池4.1JMX架构4.2JMXAPI4.3实现一个简单的JMXMBean4.4将JMX应用于线程池监控4.4.1创建自定义MBean4.4.2注册MBean到MBeanServer4.4.3使用JConsole或VisualVM连接5.代码实践5.1编写线程池管理类5.2定义MBean接口和实现5.3连接JMX客户端6.结论7
Apache Doris 3.0核心特性和生产实践解读王知无(import_bigdata) apache
上周Doris社区发布了Doris3.0版本，3.0版本被定位成湖仓一体演化路线上的重要里程碑版本。同时Doris官方社区已经更新了3.0版本的文档。3.0新特性很多，我们还是着重讲新特性中哪些是和真正开发息息相关的。哪些是需要你特别需要关注的。存算分离架构从3.0版本开始，Doris开始支持存算分离模式，用户可以在集群部署时选择采用存算一体模式或存算分离模式。存算分离对计算与存储进行解耦，计算节
Docker Desktop 解决从开发到部署的高效容器化工作流问题由数入道容器编排 docker 容器运维
一、基本概念DockerDocker是一个开源的容器化平台，提供了一种轻量级的方式来打包、运行和管理应用程序及其依赖项。通过Docker，你可以：容器化应用程序：将代码、依赖项和配置打包成一个独立的容器镜像。便携性：一次构建，随处运行，无论是开发环境、测试环境还是生产环境。高效资源利用：容器共享操作系统内核，比虚拟机更轻量。Kubernetes(K8s)Kubernetes是一个用于自动化容器部署
Debezium系列之：debezium把sqlserver数据库多张表的数据发送到一个kafka topic 快乐骑行^_^ debezium Debezium sqlserver数据库 kafka topic
Debezium系列之：debezium把sqlserver数据库多张表的数据发送到一个kafkatopic一、需求二、debezium实现sqlservercdc三、相关参数详解四、完整参数一、需求把一个sqlserver数据库多张表的数据全部发送到kafka集群的一个topic二、debezium实现sqlservercdc相关技术实现参考博主以下几篇博客：Debezium系列之：安装部署de
DeepSeek极端榨取硬件性能被曝光极道Jdon javascript reactjs
DeepSeek的出现是否意味着前沿LLM开发不再需要大规模GPU集群？简单来说：不是的。虽然DeepSeek的V3模型通过一些非常厉害的优化技术，让GPU的使用效率变得更高了，但这并不意味着像Google、OpenAI、Meta和xAI这些公司之前花大钱搞的大规模GPU集群就没用了。AI开发者的普遍看法是，大规模GPU集群仍然是训练顶尖AI模型的关键。DeepSeek做了什么？DeepSeek的
k8s ingress 原理 MosesZane K8S kubernetes 容器云原生
Kubernetes（k8s）中的Ingress是一种API对象，用于管理对集群内部服务的HTTP和HTTPS路由。Ingress提供了一种更灵活的方式来暴露服务，相比于NodePort和LoadBalancer类型的Service，Ingress可以提供更复杂的流量路由规则和SSL/TLS终止等功能。以下是Ingress的工作原理和一些关键概念：1.Ingress的基本概念Ingress本身只是
SpringBoot在Kubernetes上部署及其扩展实践 AI天才研究院 Python实战自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介SpringBoot是微服务开发的一个重要工具。它可以快速、轻松地创建一个独立运行的应用，同时还有一个特性就是它可以让开发者更关注业务逻辑而不是配置。SpringCloud生态圈则提供了许多服务发现、熔断器等功能组件，可以帮助我们实现微服务之间的通信、监控、路由等功能。但是，如果想要把SpringBoot部署到Kubernetes集群上，那么就需要做一些额外的工
JVM 性能调优码农小旋风后端
JVM性能调优在高性能硬件上部署程序，目前主要有两种方式：通过64位JDK来使用大内存；使用若干个32位虚拟机建立逻辑集群来利用硬件资源。使用64位JDK管理大内存堆内存变大后，虽然垃圾收集的频率减少了，但每次垃圾回收的时间变长。如果堆内存为14G，那么每次FullGC将长达数十秒。如果FullGC频繁发生，那么对于一个网站来说是无法忍受的。对于用户交互性强、对停顿时间敏感的系统，可以给Java虚
CKA 不假题练习笔记（四）超级阿飞 k8s cluster 笔记
Q13：SidecarContainerContext-AnexistingPodneedstobeintegratedintotheKubernetesbuilt-inloggingarchitecture(e.g.kubectllogs).Addingastreamingsidecarcontainerisagoodandcommonwaytoaccomplishthisrequirement
在K8s中部署动态nfs存储provisioner 超级阿飞 k8s cluster kubernetes 容器云原生 nfs
背景之前，我已经在一台workernode上安装了locallvm的provisioner来模拟需要本地高IOPS的数据库等stafeful应用的实现。为了后续给虚拟机里的K8s集群安装可用的metrics和logs监控系统（metrics和logs的时序数据库需要永久存储），特为K8s集群提供基于nfs的文件服务器一台，并安装nfsprovisioner，以便实现动态分配nfsvolume给po
浅析数据中心机架配电母线的应用及监控产品选型安科瑞王兰电气安全电能管理能耗管理系统系统架构网络安全自动化能源
王兰安科瑞电气股份有限公司上海嘉定201801摘要：本文先分析配电母线槽创新点和优势，然后结合湛江数据中心302机房母线槽建设对配电母线槽和列头柜两种供电方式进行经济效益对比，最后总结推广应用建议，以期为相关工程技术人员提供参考。关键词：13641854052；机架配电母线；列头柜；数据中心1引言随着通信网络的快速发展，各地数据中心的建设变得越来越重要，供电优先与客户需求滞后的矛盾越来越突出。在数
Helm Chart 实战指南 ivwdcwso 运维 Heml k8s kubernetes 云原生包管理容器
Helm是Kubernetes的包管理工具，而HelmChart是Helm的核心概念，用于定义、安装和升级Kubernetes应用。本文将带你从零开始，通过实战演练，掌握HelmChart的创建、配置和部署，帮助你高效管理Kubernetes应用。1.环境准备在开始之前，确保你已经具备以下环境：Kubernetes集群：可以是本地集群（如Minikube）或云服务（如GKE、EKS）。Helm：安
logstash（自动拉取，过滤，推送日志的应用，也是elk架构中的l）长东737 elk 架构
elk是指elasticsearch，logstash，kibana三款软件搭配组成的架构logstash是一个数据采集加工处理以及传输的工具logstash类似于流水线，有三个模块，分辨是input>filter>output，input模块负责收集数据，filter负责处理数据，output负责输出数据logstash需要先保证web集群和ela集群运行正常才能搭建，运行logstash需要先
【Oracle篇】使用impdp导入报错ORA-39001:ORA-39000:ORA-39142:incompatible version number xxx in dump file的问题解决奈斯DB Oracle专栏 oracle 数据库
《博主介绍》：✨又是一天没白过，我是奈斯，从事IT领域✨《擅长领域》：✌️擅长阿里云AnalyticDBforMySQL(分布式数据仓库)、Oracle、MySQL、Linux、prometheus监控；并对SQLserver、NoSQL(MongoDB)有了解✌️大佬们都喜欢静静的看文章，并且也会默默的点赞收藏加关注如标题所示这篇文章是记录并分享一下使用数据泵导入时的报错，这个报错是博主在一年之
探索Gin-Contrib的pprof模块：优化Go应用性能的新工具廉欣盼Industrious
探索Gin-Contrib的pprof模块：优化Go应用性能的新工具pprofginpprofmiddleware项目地址:https://gitcode.com/gh_mirrors/ppr/pprof项目简介是一个针对Gin框架的扩展库，它集成了Go语言自带的net/http/pprof包，为Gin应用提供了性能剖析功能。通过此模块，开发者可以轻松地监控和分析Go应用程序的内存使用、CPU占用
《告别监控焦虑！Kylin系统Zabbix保姆级安装手册》入眼皆含月 kylin zabbix 大数据
一、概况Zabbix是一个广泛使用的企业级开源监控解决方案，能够监控网络、服务器、虚拟机和云服务等IT基础设施。它通过灵活的通知机制，使用户能够为几乎所有事件配置基于电子邮件的警报，从而快速响应服务器问题。二、Zabbix的主要功能（1）全面的监控能力：能够监控几乎所有类型的IT组件，包括操作系统性能、网络设备、数据库、应用程序等。（2）灵活的数据收集方式：支持多种数据收集方法，如SNMP、IPM
对 oracle 19.9 数据库安装 19.13 补丁步骤 whn1977
前提检查df-h磁盘空间要充足crsctlstatres集群状态要正常，最好重启主机再检查一遍（时钟不同步可能起不来，权限、密码可能导致不正常）selectname,database_role,open_modefromgv$database;数据库角色是primary，open_mode=readwrite上传介质到/ora_softRU19.13介质:p33248471_190000_Linu
PostgreSQL的一主一从集群搭建部署 (同步) keep__go PostgreSQL postgresql 数据库
一、实验环境虚拟机名IP身份简称keep-postgres12-node1192.168.122.87主节点node1keep-postgres12-node2192.168.122.89备节点node2二、安装数据库源码包方式（主）1、创建用户[root@keep-postgres12-node1~]#groupaddpostgres[root@keep-postgres12-node1~]#u
日志技术的使用大三小小小白笔记 java 后端
日志技术概述什么是日志？日志就好比生活中的日记，可以随时随地记录你生活中的点点滴滴。程序中的日志，是用来记录应用程序的运行信息、状态信息、错误信息的。为什么要在程序中记录日志呢？便于追踪应用程序中的数据信息、程序的执行过程。便于对应用程序的性能进行优化。便于应用程序出现问题之后，排查问题，解决问题。便于监控系统的运行状态。......之前我们编写程序时，也可以通过System.out.printl
prometheus 服务java服务接入基础镜像配置窗外的寒风 prometheus java python
环境变量设置：如果不经常修改配置，推荐在java镜像中把prometheus配置通过环境变量的方式统一配置，可以使用下面的参数，把端口进行暴漏（配置安全检查端口9998，启用所有安全检查接口，配置普罗米修斯的监测间隔，设置java服务名，把普罗米修斯的接口提升到根目录）ENVSPRING_APPLICATION_JSON='{"management.server.port":"9998","man
Java面试题-rabbitmq-001 码者人生面试题 java技术面试题集 java面试题 java 面试题 rabbitmq
使用RabbitMQ有什么好处？消息基于什么传输？消息怎么路由？如何做到信息的可靠性？确保消息正确地发送至RabbitMQ？确保消息接受方消费了消息？休息不丢失不重复？如何避免消息重复投递或重复消费？为什么使用集群RabbitMQ节点不完全拷贝特性集群节点类型单节点系统必须是磁盘节点?RabbitMQ要求集群中至少有一个磁盘节点?mq的缺点
tomcat系统架构及运用极致人生-010 tomcat 系统架构 java
文章目录下面是Tomcat架构的详细解析：1.**Server（服务器）**2.**Service（服务）**3.**Container（容器）**-分层结构4.**Connectors（连接器）**5.**类加载器（ClassLoader）**6.**Catalina**7.**配置文件与目录结构**8.**监听器（Listeners）**9.**安全性**10.**性能调优与监控**Tomca
企业IT数字化运维运营平台（总体架构、总体蓝图）建设方案公众号：优享智库数字化转型数据治理主数据数据仓库运维架构
这份文件是关于企业IT数字化运维运营平台的建设方案，主要介绍了业务背景、解决方案、成功应用案例等核心内容。以下是文件的核心要点总结：业务背景概述：IT运维趋势：随着万物互联时代的到来，IT设备数量激增，运维成为保障业务高效运转的基础。IT运维重要性：IT监控运维是企业业务正常与高效运转的基础保障，直接影响业务的收益和成本。IT运维现状：当前运维模式多为被动救火式，存在基础设施分散、管理困难、缺少自
企业IT数字化运维运营平台（总体架构、总体蓝图）建设方案PPT 公众号：优享智库数字化转型数据治理主数据数据仓库数据库运维大数据人工智能
原文《企业IT数字化运维运营平台（总体架构、总体蓝图）建设方案》PPT格式，主要从构建IT一体化运营能力、构建统一IT运营管理体系、建立统一的应用系统监控视图、构建智能化、主动式的IT监控与运维能力进行建设一套企业IT统一智能运营管理平台。来源网络公开渠道，旨在交流学习，如有侵权联系速删，更多参考公众号：优享智库一、管理体系·构建面向业务的主动式统一运营理体系统一运营分析管理能力、统一运维监控管理
Apache Airflow 全面解析由数入道人工智能 apache Airflow
1.Airflow的定义与核心定位ApacheAirflow是一个开源的工作流自动化与调度平台，由Airbnb于2014年创建，2016年进入Apache孵化器，2019年成为顶级项目。其核心设计理念是“WorkflowsasCode”，通过编程方式定义、调度和监控复杂的数据流水线（Pipeline），适用于ETL、机器学习模型训练、数据湖管理、报表生成等场景。2.核心概念与架构解析2.1核心组件
用Devecostudio写一个简单的计算器邮专小谦 typescript harmonyos 数据库前端华为
用Devecostudio写一个简单的计算器//计算器import{Button1}from'./Button1'import{Button2}from'./Button2'//定义两个按钮格式//import{Cal}from'./cal'也可以将四则运算的函数定义到别处然后引入，这里为了方便直接放到这里了interfaceOperator{ symbol:string; precedence:
kotlin 深入学习爱水的云开发分享 java servlet android
一、进阶用法解构解构:解构指的是将对象的多个属性分别赋值给多个变量的过程funmain(args:Array){valuser=User(12,"name")val(age,name)=userprintln(age)println(name)}classUser(varage:Int,varname:String){operatorfuncomponent1()=ageoperatorfunco
Python极简计算器程序代码 EYYLTV python 开发语言
n=float(input("Enteranumber输入一个数字:"))m=float(input("Enteranumber输入一个数字:"))z=input("Enteranoperator输入一个运算符(+,-,*,/):")ifz==‘+’:a=n+mprint(a)elifz==‘-’:b=n-mprint(b)elifz==‘*’:c=n*mprint©elifz==‘/’:ifm=
java数字签名三种方式知了ing java jdk
以下3钟数字签名都是基于jdk7的 1，RSA String password="test"; // 1.初始化密钥 KeyPairGenerator keyPairGenerator = KeyPairGenerator.getInstance("RSA"); keyPairGenerator.initialize(51
Hibernate学习笔记 caoyong Hibernate
1>、Hibernate是数据访问层框架，是一个ORM(Object Relation Mapping)框架，作者为:Gavin King 2>、搭建Hibernate的开发环境 a>、添加jar包: aa>、hibernatte开发包中/lib/required/所
设计模式之装饰器模式Decorator（结构型）漂泊一剑客 Decorator
1. 概述若你从事过面向对象开发，实现给一个类或对象增加行为，使用继承机制，这是所有面向对象语言的一个基本特性。如果已经存在的一个类缺少某些方法，或者须要给方法添加更多的功能（魅力），你也许会仅仅继承这个类来产生一个新类—这建立在额外的代码上。
读取磁盘文件txt，并输入String 一炮送你回车库 String
public static void main(String[] args) throws IOException { String fileContent = readFileContent("d:/aaa.txt"); System.out.println(fileContent);
js三级联动下拉框 3213213333332132 三级联动
//三级联动省/直辖市<select id="province"></select> 市/省直辖<select id="city"></select> 县/区 <select id="area"></select>
erlang之parse_transform编译选项的应用 616050468 parse_transform 游戏服务器属性同步 abstract_code
最近使用erlang重构了游戏服务器的所有代码，之前看过C++/lua写的服务器引擎代码，引擎实现了玩家属性自动同步给前端和增量更新玩家数据到数据库的功能，这也是现在很多游戏服务器的优化方向，在引擎层面去解决数据同步和数据持久化，数据发生变化了业务层不需要关心怎么去同步给前端。由于游戏过程中玩家每个业务中玩家数据更改的量其实是很少
JAVA JSON的解析 darkranger java
// { // “Total”：“条数”， // Code: 1, // // “PaymentItems”:[ // { // “PaymentItemID”:”支款单ID”, // “PaymentCode”:”支款单编号”, // “PaymentTime”:”支款日期”, // ”ContractNo”:”合同号”， //
POJ-1273-Drainage Ditches aijuans ACM_POJ
POJ-1273-Drainage Ditches http://poj.org/problem?id=1273 基本的最大流，按LRJ的白书写的 #include<iostream> #include<cstring> #include<queue> using namespace std; #define INF 0x7fffffff int ma
工作流Activiti5表的命名及含义 atongyeye 工作流 Activiti
activiti5 - http://activiti.org/designer/update在线插件安装 activiti5一共23张表 Activiti的表都以ACT_开头。第二部分是表示表的用途的两个字母标识。用途也和服务的API对应。 ACT_RE_*: 'RE'表示repository。这个前缀的表包含了流程定义和流程静态资源（图片，规则，等等）。 A
android的广播机制和广播的简单使用百合不是茶 android 广播机制广播的注册
Android广播机制简介在Android中，有一些操作完成以后，会发送广播，比如说发出一条短信，或打出一个电话，如果某个程序接收了这个广播，就会做相应的处理。这个广播跟我们传统意义中的电台广播有些相似之处。之所以叫做广播，就是因为它只负责“说”而不管你“听不听”，也就是不管你接收方如何处理。另外，广播可以被不只一个应用程序所接收，当然也可能不被任何应
Spring事务传播行为详解 bijian1013 java spring 事务传播行为
在service类前加上@Transactional，声明这个service所有方法需要事务管理。每一个业务方法开始时都会打开一个事务。 Spring默认情况下会对运行期例外(RunTimeException)进行事务回滚。这
eidtplus operate 征客丶 eidtplus
开启列模式: Alt+C 鼠标选择 OR Alt+鼠标左键拖动列模式替换或复制内容(多行): 右键-->格式-->填充所选内容-->选择相应操作 OR Ctrl+Shift+V(复制多行数据,必须行数一致) -------------------------------------------------------
【Kafka一】Kafka入门 bit1129 kafka
这篇文章来自Spark集成Kafka(http://bit1129.iteye.com/blog/2174765)，这里把它单独取出来，作为Kafka的入门吧下载Kafka http://mirror.bit.edu.cn/apache/kafka/0.8.1.1/kafka_2.10-0.8.1.1.tgz 2.10表示Scala的版本，而0.8.1.1表示Kafka
Spring 事务实现机制 BlueSkator spring 代理事务
Spring是以代理的方式实现对事务的管理。我们在Action中所使用的Service对象，其实是代理对象的实例，并不是我们所写的Service对象实例。既然是两个不同的对象，那为什么我们在Action中可以象使用Service对象一样的使用代理对象呢？为了说明问题，假设有个Service类叫AService，它的Spring事务代理类为AProxyService，AService实现了一个接口
bootstrap源码学习与示例：bootstrap-dropdown（转帖） BreakingBad bootstrap dropdown
bootstrap-dropdown组件是个烂东西，我读后的整体感觉。一个下拉开菜单的设计： <ul class="nav pull-right"> <li id="fat-menu" class="dropdown">
读《研磨设计模式》-代码笔记-中介者模式-Mediator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 中介者模式（Mediator）：用一个中介对象来封装一系列的对象交互。 * 中介者使各对象不需要显式地相互引用，从而使其耦合松散，而且可以独立地改变它们之间的交互。 * * 在我看来，Mediator模式是把多个对象（
常用代码记录 chenjunt3 UI Excel J#
1、单据设置某行或某字段不能修改 //i是行号,"cash"是字段名称 getBillCardPanelWrapper().getBillCardPanel().getBillModel().setCellEditable(i, "cash", false); //取得单据表体所有项用以上语句做循环就能设置整行了 getBillC
搜索引擎与工作流引擎 comsci 算法工作搜索引擎网络应用
最近在公司做和搜索有关的工作，(只是简单的应用开源工具集成到自己的产品中)工作流系统的进一步设计暂时放在一边了，偶然看到谷歌的研究员吴军写的数学之美系列中的搜索引擎与图论这篇文章中的介绍，我发现这样一个关系(仅仅是猜想) -----搜索引擎和流程引擎的基础--都是图论，至少像在我在JWFD中引擎算法中用到的是自定义的广度优先
oracle Health Monitor daizj oracle Health Monitor
About Health Monitor Beginning with Release 11g, Oracle Database includes a framework called Health Monitor for running diagnostic checks on the database. About Health Monitor Checks Health M
JSON字符串转换为对象 dieslrae java json
作为前言,首先是要吐槽一下公司的脑残编译部署方式,web和core分开部署本来没什么问题,但是这丫居然不把json的包作为基础包而作为web的包,导致了core端不能使用,而且我们的core是可以当web来用的(不要在意这些细节),所以在core中处理json串就是个问题.没办法,跟编译那帮人也扯不清楚,只有自己写json的解析了.
C语言学习八结构体，综合应用，学生管理系统 dcj3sjt126com C语言
实现功能的代码： # include <stdio.h> # include <malloc.h> struct Student { int age; float score; char name[100]; }; int main(void) { int len; struct Student * pArr; int i,
vagrant学习笔记 dcj3sjt126com vagrant
想了解多主机是如何定义和使用的, 所以又学习了一遍vagrant 1. vagrant virtualbox 下载安装 https://www.vagrantup.com/downloads.html https://www.virtualbox.org/wiki/Downloads 查看安装在命令行输入vagrant 2.
14.性能优化-优化-软件配置优化 frank1234 软件配置性能优化
1.Tomcat线程池修改tomcat的server.xml文件： <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" maxThreads="1200" m
一个不错的shell 脚本教程入门级 HarborChung linux shell
一个不错的shell 脚本教程入门级建立一个脚本　　Linux中有好多中不同的shell，但是通常我们使用bash (bourne again shell) 进行shell编程，因为bash是免费的并且很容易使用。所以在本文中笔者所提供的脚本都是使用bash（但是在大多数情况下，这些脚本同样可以在 bash的大姐，bourne shell中运行）。　　如同其他语言一样
Spring4新特性——核心容器的其他改进 jinnianshilongnian spring 动态代理 spring4 依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
Linux设置tomcat开机启动 liuxingguome tomcat linux 开机自启动
执行命令sudo gedit /etc/init.d/tomcat6 然后把以下英文部分复制过去。（注意第一句#!/bin/sh如果不写，就不是一个shell文件。然后将对应的jdk和tomcat换成你自己的目录就行了。 #!/bin/bash # # /etc/rc.d/init.d/tomcat # init script for tomcat precesses
第13章 Ajax进阶（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Troubleshooting Crystal Reports off BW blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Troubleshooting+Crystal+Reports+off+BW#TroubleshootingCrystalReportsoffBW-TracingBOE Quite useful, especially this part: SAP BW connectivity For t
Java开发熟手该当心的11个错误 tomcat_oracle java jvm 多线程单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
正则表达式大全 yang852220741 html 编程正则表达式
今天向大家分享正则表达式大全，它可以大提高你的工作效率正则表达式也可以被当作是一门语言，当你学习一门新的编程语言的时候，他们是一个小的子语言。初看时觉得它没有任何的意义，但是很多时候，你不得不阅读一些教程，或文章来理解这些简单的描述模式。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$

Prometheus Operator 监控 Kubernetes 集群

一、介绍

1、Kubernetes Operator 介绍

2、Prometheus Operator 介绍

3、Prometheus Operator 系统架构图

二、更改 kubernetes 配置

三、拉取 Prometheus Operator

四、进行文件分类

五、修改源码 yaml 文件

1、修改镜像

(1)、修改 operator

(2)、修改 adapter

(3)、修改 alertmanager

(4)、修改 node-exporter

(5)、修改 kube-state-metrics

(6)、修改 node-exporter

2、修改 Service 端口设置

(1)、修改 Prometheus Service

(2)、修改 Grafana Service

六、安装Prometheus Operator

1、创建 namespace

2、安装 Operator

3、安装其它组件

七、查看 Prometheus & Grafana

1、查看 Prometheus

2、查看 Grafana

你可能感兴趣的:(Prometheus Operator 监控 Kubernetes 集群)