weixin_39929635

k8s redis集群_一文详解 | K8S 上多租户、高性能的分布式告警系统实践

技术内容提供者

青云QingCloud 软件工程师马丹

Kubernetes 已经成为事实上的编排平台的领导者，下一代分布式架构的王者，其在自动化部署、扩展性、以及管理容器化的应用中已经体现出独特的优势，在企业中应用落地已经成为一种共识。

首先，KubeSphere® 作为 K8S 的发行版，其告警有什么需求？

第二，在需求下，告警怎么实现？它跟 K8S 基于 Prometheus 的告警有怎样的区别？

第三，在我们的实现下，我们的架构是怎样的、性能如何以及如何实现 KubeSphere® 多租户需求的实现。

最后进行总结。

KubeSphere® 告警需求

KubeSphere® 作为 Kubernetes 的发行版，我们知道它支持多租户，可以通过图形界面配置和观察告警状态我们知道它有图形界面的。告警同样有界面配置告警、管理告警、查看告警状态的需求。我们第一版做的告警主要是基于监控指标的告警，就像刚刚看到监控系统得到监控值，我们对它进行判断，大于某个阈值或者小于某个阈值，判断周期连续超过多少次就会产生告警。

k8s redis集群_一文详解 | K8S 上多租户、高性能的分布式告警系统实践_第2张图片

在监控过程中，它跟其他的不太一样。我们监控对象可能是动态变化的，比如 Node 的个数可能会在运行过程中增减，假如监控一个 Pod 或者一个 Container 的话，其对象也会在运行过程中动态变化。我们告警指定要有灵活的方式，不但可以通过指定某几个要监控对象的具体名称，也可以通过像 Label Selector 批量或者按属性指定的方式指定它。

同样的，每个对象有不同的监控指标，这是依据其资源类型来的。不同的监控指标、扫描周期，比如几分钟看它的值，判断规则大于、等于、小于等，达到规则的连续次数等，这些都可以自定义。

在告警产生后，如果不加管控，假如一分钟扫描一次，最原始的告警做法是扫描超了就发生告警，通知的用户的邮箱、短信会泛滥。我们对通知发送者，假如一个用户的告警只希望在上班时间段发送，下班时间段他可以等到上班时一并发送。发送方式，不同等级的告警是怎么重复的？比如几分钟重复一次，连续发多少次就不发了，这些都可以自定义。

我们这套告警系统本质上是往通用告警系统的方向做，它的 API 并不是跟 KubeSphere® 的多租户相融的。作为 KubeSphere® 要满足多租户的管理要求，我们需要对它进行封装，如何封装它原来的 API。就像我们刚刚封装 Prometheus 的监控系统一样，把它封装成一套符合多租户管理要求的 API。这是我们告警系统的需求。

Prometheus 本身也是带有告警的，我们在这当中为什么没有用它，我可以稍微介绍一下。

Prometheus Alert Manager

k8s redis集群_一文详解 | K8S 上多租户、高性能的分布式告警系统实践_第3张图片

Prometheus 的执行规则、告警规则并不是由 Alertmanager 执行的，而是由 Prometheus 执行的。它也是将告警规则一条条写成 Yaml 的文件，更新为 ConfigMap，在 Prometheus 里执行。它一样会指定监控指标、阈值和扫描周期等参数。

当告警发生后，Alertmanager 起到的作用是 Prometheus Server 有告警发生，它会把告警消息推送给 Alertmanager，Alertmanager 更多地类似对通知进行管理的角色，它会将正式告警的通知发送到很多地方。

k8s redis集群_一文详解 | K8S 上多租户、高性能的分布式告警系统实践_第4张图片

这是典型的 Prometheus 原版的 Alertmanager 配置方式。左边几乎看不清楚的是其配置文件，我们会在 Yaml 里写上每一条告警的规则，右边是管理界面，他也可以看到告警的规则和状态。

无论是左边的编辑方式还是右边的界面，它首先不是多租户的，原版有一些局限。它的局限主要是 ConfigMap 加载，一是 ConfigMap 容量有限，作为多租户系统有很大的集群，会有成千上万条告警。它的容量有限，带来告警使用受到限制。比较难支持 Label Selector 这种方式，指定监控对象。当它实时变化时要动态地更改其规则。在多租户环境下会有很多用户同时在线，他们会频繁登录改操作。ConfigMap 通过映射到文件，再重新通过获取文件的变化来加载的，它响应肯定不如我们直接用一套自己的机制执行来得及时。

k8s redis集群_一文详解 | K8S 上多租户、高性能的分布式告警系统实践_第5张图片

我们这套告警系统当时开发的目的不光是给 KubeSphere®，KubeSphere® 是第一个告警系统使用的场合，我们还会给后续的产品使用我们的告警。在通用告警系统上，像 Prometheus 这一套难以实现它。所以我们架构实现了一套告警系统，就是中间最大的 Alert Service 这一部分。

KubeSphere® 告警系统架构

k8s redis集群_一文详解 | K8S 上多租户、高性能的分布式告警系统实践_第6张图片

从刚才的需求可以看出我们的告警主要包括几部分：

首先，我们的 Alertmanager 实现的是跟用户进行交互，它提供了一套 CRUD 的接口，接受用户过来的增、删、改、查等具体告警需求。最关键的部分是 Manager、Executor、Watch，这三个角色，Manager 负责跟用户交互，Executor 负责具体告警用户发过来新的告警，其使用和执行在这当中。Watch 是对告警集群的状态进行健康检查。

我们这个地方的告警并不是单体应用，它要考虑到横向扩展和分布式可扩展性，它对可靠性有要求。如果 Executor 放在 K8S 里执行，一个 Executor 就是一个 Pod，它的个数是可以动态跟踪的。像告警需求比较大的集群，我们 Executor 可以细化到时刻或者更多，比较少的可能一两个就够了。动态跟踪过程中如何有效地对 Executor 执行告警状态有一个监控，当 Executor 失效后进行灾难恢复、告警状态、任务迁移，就是由 Watch 实现的。

这套系统要实现这些就需要外部组件的配合，首先有 etcd，我们使用 etcd 来进行健康状态的注册、服务与发现。所有的 Executor 在运行时会定期向 etcd 发送自己的健康状态，当 Executor 被停止或者以别的方式并丢掉，或者它运行的物理宕机了，etcd 里不会被长久保持，会被 Watch 某个掉线，它会实时将 Executor 的任务分配到其他的 Executor 上。

在告警创建过程中，所有的告警状态都是维护在 MySQL 数据库中，这个数据库要求可以动态扩展的。

我们这边的告警状态是以 MySQL 数据库中存储的为准，当一个用户创建一条新的告警时，Alertmanager 接到这条告警需求会先在数据库里创建一条告警，将用户的规则信息、额外的信息写到数据库里，并且将这条告警置于 Waiting 状态，这时候并没有被实际执行到，这时候 Alertmanager 会在 Redis 里 Push 一个任务，Redis 通过消费队列的分配，这时候所有的 Executor 在消费队列，它会被动态分配到所有 Watch 消息队列、Redis 消息队列的 Executor 上。Executor 引用告警并执行后，会向 MySQL 将告警的状态转成 Running。

我们在运行过程中会记载它的状态，达到阈值多少次？是否发送告警？当它一直发送的时候，告警要合并多少条等临时信息，都是由 Executor 提交到 MySQL 里。

同样的，Watch 一方面通过 etcd 的 Watch 来监控 Executor 状态。另一方面，它要对 MySQL 里的告警状态做定期定时检查。好比有一些情况，每一个告警我们开了一个 Go 协程，它可能有很多个协程，可能整个进程并没有死，但是某几个协程因为什么原因导致并没有及时更新告警状态，更新时间不足的告警同样会被我们 Watch 检查，让它得到及时的执行。

无论是 Executor 挂掉了或者某些告警挂掉了，Watch 都会将这条告警在 MySQL 里置为 Waiting 的状态，并且重新将告警 ID Push 到 Redis 队列中，由其他健康的 Executor 继续迁移任务并且执行。

Executor 也要对自我运行的状态进行健康检查。假如 Executor 中间出现了失联等现场，它的任务已经被取消了，它并不知道，但它有办法检查到。虽然 Check 是定期检查，但这是批量的，不会对数据库造成太大的压力。去检查哪些是它认为在执行，实际上在别的数据库里也执行的。它应该把不该自己执行的给 Kill 掉，实现告警完整的运行。

我们为了通用性，Alertmanager 暴露的是一套通用的 gRPC 接口，这是一个内部接口。我们为了让它能够跟外面的界面实现多租户，我们有 KubeSphere® 或者其他系统将内部接口转换成其他系统的接口。比如在我们 KubeSphere® 中，后面我们会有具体的 API 的图，讲到它的接口转换前后的样子。

Adapter 起的作用是在 KubeSphere® 当中，我们的告警是基于 Prometheus 封装的，刚刚 Ben 讲的监控系统。它每次告警的读取都是通过监控系统来的，Adapter 就是为了适应不同的监控系统，这样的话我们 Executor 的代码就不用变，它跟 Adapter 之间是同一个接口，再由 Adapter 将它的接口翻译成其他不同的读取监控指标的接口。同样的，Notification Service，当告警发生后我要发送一条具体的告警，我从这个发出。这就是我们告警系统的架构。

KubeSphere® 告警系统特点

k8s redis集群_一文详解 | K8S 上多租户、高性能的分布式告警系统实践_第7张图片

这样一套告警系统的架构主要实现的指标，首先它要有通用的、指标读取、通知发送、API 等组件都是通过内部标准 API 交互，要可转换，要针对不同的业务系统定制插件就可以完成适配。

要有高可用和动态伸缩，它的业务分配策略是刚才我们看到的，我们通过 MySQL 数据库中进行一致性，再通过 Redis 队列进行任务的分配。集群健康检查是通过 Watch 来进行的，有一个问题，目前在 K8S 中执行，我们由 K8S 保证集群中的 Watch 可以用。在其他的地方，我们也要保证在这个集群有多个 Executor，并且被一个 Watch 管理，管理者本身要有一个健康的管理。

微服务架构，我们一个服务过来，API 完成后立刻将任务置于某个状态，再由下面具体的执行者执行，这是一套微服务架构。基础 API 是针对告警的某一条规则或者告警资源来的，我们会封装出适合界面使用的，一次调用就可以完成大部分功能的 API，实现 API 的可扩展性。

KubeSphere® 告警系统指标

k8s redis集群_一文详解 | K8S 上多租户、高性能的分布式告警系统实践_第8张图片

我们实现这套告警系统后对它进行了实际的测试，我们测试环境是两台 8 核 16G K8S 集群，Executor Pod 设置为两个，我们用专门的测试程序写的测试。在 5 分钟内创建 1 万条告警，每条告警有一条规则，要从后面的数据库观察，在 5 分钟内进入 Ending 或者 Running状态。10 分钟内不要有 Ending，所有都要被 Executor 引用掉、执行掉，进入运行状态。在运行后或者创建过程中，通过我的测试程序在 5 分钟内删除 1 万条告警，看能否都准确删除掉，不要在数据库里有所反应，也不在 Executor 的报告中有所反应。

检查，1 万条告警运行时大概占用了多少硬件资源，再检查 1 万条告警里面每个都有一条规则，一分钟执行一次，它真的是一分钟就发送一次读取监控指标的请求吗？这都是要检查的。

然后是对高可用的检查，现在我们有两个 Executor，我手动通过程序把它 Scale Down 到一个，另一个 Pod 很快就会被一次性踢掉。Watch 是不是真的把属于 Pod 的任务执行到 Running 状态，Ending 的状态是否真的通过 Redis 到了另一个 Pod 迁移，Scale Up10 个 Pod。目前的 Scale Up 是这样的，它已经在运行的，不会再运行了。如果创建新的话，现在有 10 个 Pod、10 个 Executor 在获取 Redis，创建的时候同样有机会可以分到。

目前所谓的分配方法是自然分配，没有进行特别的判断。大家随着手速快，抢的队列及时，基本上反映了硬件状态比较空闲。

后面是我们对实际运行时的指标进行的检查，我们主要检查了两个 Pod CPU 和内存的占用总和。差不多在 2.5 Core 和 1.5G 的样子，这样的话折合起来一条告警规则占用的内存大概 150K 左右，这是一条规则。规则的增加，它会有所增加，但基本是可控的，基本满足我们第一步的设计指标。

这是检查它是否真的 1 万条一分钟的告警，每一分钟都精确地执行，我们特意打了一条 Log 信息，这条信息在实际使用执行过程中应该删除，它会极大的消耗系统的资源。左边上升的过程是创建的过程，中间会一段时间不太稳定，它可能这一分钟少几个，下一分钟补上几个。最终稳定后，它可以在日志中看到一分钟就是 1 万条 Monitor 被发送。

告警系统 API

刚才我们看到告警 API 分为基础 API 和扩展的多租户 API，这个 API 是 gRPC 接口的，为了方便它的观察。可见它是不带权限管理、不带资源的。

k8s redis集群_一文详解 | K8S 上多租户、高性能的分布式告警系统实践_第9张图片

如何实现它的多租户？这条 API 肯定不够的，这是一个通用的东西，放在其他的系统没有租户，没有权限也一样能用。

k8s redis集群_一文详解 | K8S 上多租户、高性能的分布式告警系统实践_第10张图片

我们的 KubeSphere® 多租户权限管理是一个三级的 RBAC，基于角色的多租户管理。我们的用户都有一个 Rules，不同的 Rules 对不同的 Resource，有不同的网络权限。只要 API 的路径，比如是 Cluster 级别还是 WorkSpace 级别，它相当于是 K8S 的 NameSpace。它的 API 有一个这样的级别限制在里面，在访问 API 时，只要我们是符合路径要求的 API。我们的 API 先进行 KubeSphere® 的 API Gateway，再转发到我们的 API 上。

API Gateway 是暴露了外部的服务，而我们是内部服务。这样实现了从一个通用的 API 包装成一个专用的，支持多租户权限管理的 API。这是经过包装后的 API，可见左边开始带上了一些路径，所有的界面或者其他的在调用过程中都先经过 KubeSphere® API Gateway 的权限检查，假如 Log in 的用户并不具备权限的话，它直接会被拒绝掉，这样就实现我们的定制 API，并且有权限的管理。

k8s redis集群_一文详解 | K8S 上多租户、高性能的分布式告警系统实践_第11张图片

同时，定制 API 有时候界面上他不希望创建告警时要很零碎的操作，先在这个表面操作几下，后在那个表面操作几下。我们在这里可以把流程一次性封装完，它只要调一条非常方便的 API，传输一个大的数据结构，这边直接创建好这条告警。

告警系统是我们目前实现的第一版，它还有很多可以改进的地方。就功能来说，Prometheus 本身带着告警功能也应该为我们所接受和使用的。我们也在考虑有很多第三方的告警消息也可以直接产生告警，它一起到我这边发送的地方做发送方式的汇总。我们目前看到的是基于监控指标、监控值的告警，以后我们会做基于日志的告警。某种日志，比如错误日志、访问日志过大时，我们也会对它进行规则的检查，并且产生一些告警消息。

架构方面，可以看到这套告警由高可用和这样一套架构，目前只是执行告警，实际上这里面执行的东西是不是告警，关系不是很大。我们希望进一步介绍通用的用户调度框架剥离出来，告警只作为其一个具体任务执行。这个告警规则目前的判断都是我们写在代码里，后来进行判断的。如果可以引入规则引擎的话，它的功能会更强，类似语言那样的。

我们下一步的改进是将告警中的执行和具体的业务分开，它的调度框架具体执行什么，是不是在 K8S 上，关系都不大，都可以实现通用调度的能力，可以用在很多系统上。告警规则本身如果结合给它，它就是一个告警。假如有别的规则，可以形成计费系统这样的东西。告警规则，后面我们会基于规则引擎进行改造。

我们的告警是开源项目，在 KubeSphere® 这个大项目下，欢迎大家的关注。

-FIN-

长安十二时辰用望楼、暗语、大案牍术展现了唐代的数字世界，那么现代的数字世界是什么样呢？7 月 25 日，请来和我们一起，洞见未来数字世界

k8s redis集群_一文详解 | K8S 上多租户、高性能的分布式告警系统实践_第12张图片

Kafka原理总结 DEMOAHUI mq中间件 kafka
Kafka是一个开源的分布式流式处理平台，在这个平台上可以发布、订阅以及处理数据流，具有强大的吞吐能力，让Kafka成为了一个高性能的发布与订阅消息系统一：概念理解Broker部署Kafka进程的服务被称之为Broker，Broker会接收Producer的消息，持久化到本地，然后Comsumer通Pull的形式进行消息拉取，通常使用集群的形式进行部署Producer生产者，即发送消息的一方，往B
Redis与MySql的区别 GugarF95 redis mysql 数据库
Redis和MySQL是两种不同类型的数据库系统，它们在数据存储方式、性能特点、适用场景等方面存在诸多区别，以下是详细介绍：数据存储类型MySQL：是一种关系型数据库管理系统（RDBMS），以表格的形式组织数据，表由行和列组成，每行代表一个记录，每列代表一个属性。通过定义表结构，包括字段类型、长度、是否为主键等约束条件，来存储结构化数据，如用户信息表、订单表等。支持复杂的数据关系，如一对一、一对多
ESP8266恢复出厂设置指南纪想娇
ESP8266恢复出厂设置指南ESP8266恢复出厂设置项目地址:https://gitcode.com/Resource-Bundle-Collection/b8579简介本文档旨在指导用户如何将ESP8266Wi-Fi模块恢复到其出厂默认状态。ESP8266是一款广受欢迎的嵌入式Wi-Fi解决方案，常用于物联网项目。当遇到配置混乱、固件问题或想要清除自定义设置时，恢复出厂设置变得尤为重要。恢复
Qt 智能指针详细介绍 zhaoyongCNSX Qt Qt 智能指针
1.Qt智能指针概述Qt提供了一套基于父子对象的内存管理机制,所以我们很少需要去手动delete.但程序中不一定所有类都是QObject的子类,这种情况下仍然需要使用一些智能指针.注意:在Qt中使用智能指针时,一定要避免发生多次析构.2.Qt中的智能指针分类根据不同的使用场景,可分为以下几种:共享数据.隐式或显式的共享数据(不共享指针),也被称为侵入式指针.QSharedDataPointer指向
Async协程保姆级教学 Louis yeap python 大数据 python 开发语言协程 async
目录编辑前言二、Async协程使用步骤1.导入标准库2.协程三、协程的应用场景1.网络IO2.数据库IO3.文件IO4.异步任务调度5.Web服务6.设备和串口IO7.队列和管道总结前言介绍：Python协程的概念源于生成器（Generator）。但它通过asyncio和事件循环，进一步扩展了生成器的功能，从而支持异步非阻塞操作。允许程序在执行过程中暂停（挂起），然后在需要时恢复运行。与传统的线程
Python中Pickle库 SteveKenny Python python 开发语言后端
文章目录简介函数dumpsloadsdumpload简介Python中有个序列化过程叫作pickle，它能够实现任意对象与文本之间的相互转化，也可以实现任意对象与二进制之间的相互转化。也就是说，pickle可以实现Python对象的存储及恢复。pickle模块的应用很简单，只有四个方法dumps()：将Python中的对象序列化成二进制对象，并返回loads()：读取给定的二进制对象数据，并将其转
使用ScriptRunner对象做sql文件导入时遇到的问题 DamonREN 数据处理数据库同步 Mysql 开发遇到的问题 ScriptRunner
业务场景:服务端是挂在公网上用来提供数据同步功能,考虑到有可能客户端由于某种情况是不允许连接外网的,所以服务端提供一个接口用来下载全量sql脚本(当然这些数据是某官网公布出来的数据,不考虑数据安全问题),然后客户端通过拷贝或内网传输在客户端进行手动上传,客户端代码进行执行sql脚本,将全量数据同步到客户端对应的数据库以完成数据同步。问题复现:ScriptRunner对象是org.apache.ib
分享：selenium ide中，对于一些已经自动化填写过数值的输入框，在最后点击保存时，输入框内容被清空。小崔很笨 selenium 自动化前端
1.项目中有一个表单，表单有一些控件，用seleniumide对表单进行自动化填写时，最后一步点击提交，提交失败，一看是输入框被清空了。2.解决办法，只需要在输入数据的代码下新增一条dispatchEvent“手动触发事件”。3.代码如下：executescriptdocument.querySelector("#app>div>div>section>section>main>div>div.t
python 分布式集群_Python搭建Spark分布式集群环境小国阁下 python 分布式集群
前言ApacheSpark是一个新兴的大数据处理通用引擎，提供了分布式的内存抽象。Spark最大的特点就是快，可比HadoopMapReduce的处理速度快100倍。本文没有使用一台电脑上构建多个虚拟机的方法来模拟集群，而是使用三台电脑来搭建一个小型分布式集群环境安装。本教程采用Spark2.0以上版本(比如Spark2.0.2、Spark2.1.0等)搭建集群，同样适用于搭建Spark1.6.2
spark集群完全分布式搭建。。，。，。分布式 spark 大数据
1.spark的运行架构（主从模式）主节点：master-----资源管理调度和任务的分配---------类似yarn从节点：worker-----执行具体的计算任务整体运行架构：编写spark运行程序用户将应用程序提交给spark集群驱动其会创建对应的编程入口（sparkcontext/sparksession）主节点复制资源管理调度和任务分配从节点执行计算任务（多个计算任务：每个计算任务会分
MongoDB中常用的几种高可用技术方案及优缺点 yuanpan mongodb 数据库
MongoDB的高可用性方案主要依赖于其内置的副本集(ReplicaSet)和Sharding机制。下面是一些常见的高可用性技术方案：1.副本集(ReplicaSet)副本集是MongoDB提供的主要高可用性解决方案，确保数据在多个节点之间的冗余存储和自动故障恢复。副本集包含以下关键组件：主节点(Primary)：只有一个主节点，负责处理所有的写操作。从节点(Secondary)：从节点同步主节点
怎么升级python版本_linux机器升级python版本至2.7.13 weixin_39878646 怎么升级python版本
背景：刚申请的机器python版本是2.6的，需要手动升级到2.7.13版本；步骤：1下载python2.7.13版本的源码包wgethttp://python.org/ftp/python/2.7.13/Python-2.7.13.tgz--no-check-certificate2解压源码包tar-xvfPython-2.7.13.tgz3编译安装cdPython-2.7.13./config
MongoDB常见的运维工具总结介绍 yuanpan mongodb 运维数据库
MongoDB提供了一些强大的运维工具，帮助管理员进行数据库监控、备份、恢复、性能优化等操作。以下是一些常见的MongoDB运维工具及其功能介绍：1.MongoDBAtlas功能：MongoDBAtlas是MongoDB官方的云托管数据库服务，它提供了全托管的MongoDB实例和自动化运维功能，包括自动备份、自动扩展、高可用性、监控和安全性等。它使得运维团队可以专注于应用开发，而无需担心数据库的管
软件开发中的密码学（国密算法）自己的九又四分之三站台 #软件架构师的“不归之路“密码学算法
1.软件行业中的加解密在软件行业中，加解密技术广泛应用于数据保护、通信安全、身份验证等多个领域。加密（Encryption）是将明文数据转换为密文的过程，而解密（Decryption）则是将密文恢复为明文的过程。以下是加解密在软件行业中一些常见的应用和技术：1.1.对称加密与非对称加密对称加密：加密和解密使用相同的密钥。常见算法包括AES（高级加密标准）、DES（数据加密标准）、3DES（Trip
【Python进阶】5招轻松掌握Python计算机视觉，你还用传统方法吗？墨瑾轩 Python入门~精通 python 计算机视觉开发语言
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣5招轻松掌握Python计算机视觉，你还用传统方法吗？开场白嘿，小伙伴们！今天我们要聊一个非常酷炫的话题——如何使用Python进行计算机视觉。想象一下，当你手头上有一组图像数据，需要对其进行识别、检测或分割，你会怎么做？手动编程？Nonono，那太累了！今天
Window Mamba 环境安装【CUDA】红豆布丁 python mamba ssm cuda
WindowMamba环境安装1.安装PyTorch环境2.直接安装Mamba及其依赖3.手动编译Mamba及其依赖1.安装PyTorch环境condacreate-nmambapython=3.10condaactivatemambacondainstallcudatoolkit==11.8pipinstalltorch==2.1.1torchvision==0.16.1torchaudio==
01_什么是Redis？袁庭新 Redis 7企业级开发实战教程 redis 数据库缓存
1.什么是NoSQL？1.1NoSQL介绍NoSQL，全称为NotOnlySQL（不仅仅是SQL），指的是非关系型的数据库。它最早出现于1998年，由CarloStrozzi提出，旨在找到存储和检索数据的新高效途径，而不是在所有情况下都依赖关系型数据库。2009年，NoSQL的概念在亚特兰大举行的"no:sql(east)"讨论会上得到了进一步推广和发展，这次讨论会标志着NoSQL数据库发展史上的
Apache STORM工作原理详解 Neil Parker apache storm java
ApacheStorm是一个分布式实时计算系统，允许用户在集群上运行流式数据处理应用程序。它的核心原理是将流式数据分割成多个小块，每个小块都会被分配给不同的计算节点进行处理，并且处理结果会被发送到下一个节点，直到达到最终结果。以下是ApacheStorm的工作原理：Nimbus是整个集群的控管核心，负责topology的提交、运行状态监控、任务重新分配等工作。zk就是一个管理者，监控者。总体描述：
推荐开源神器：Autosub——自动字幕生成器任轶眉Tracy
推荐开源神器：Autosub——自动字幕生成器项目地址:https://gitcode.com/gh_mirrors/au/autosub在多媒体内容日益丰富的今天，字幕已经成为观看视频的重要辅助工具。然而，手动创建字幕是一项耗时且繁琐的工作。幸运的是，有一个名为Autosub的开源项目，它能自动识别并生成视频的字幕，大大简化了这一过程。项目介绍Autosub是一个高效实用的工具，专门用于自动语音
一图看懂 HBase 架构（全面详细） BigData_Hubert 大数据 hbase hadoop hbase 组件架构大数据
HBase一图看懂HBase架构HBase最常用的shell操作HBase工作机制及读写流程HBase架构HBase前言HBase简介什么是HBaseHBase特点NoSQL与RDBMS对比HBase生态圈技术HBase架构Client客户端ZooKeeper集群协调一致性服务HMaster节点HRegionServer节点HDFSHBase组件整体物理结构RegionWALStoreFile（H
AI 集群：Exo 项目详解 ivwdcwso 运维人工智能 AI Exo
引言随着人工智能技术的迅猛发展，越来越多的人希望在家中运行自己的AI集群。传统的AI集群通常需要昂贵的硬件和复杂的配置，但Exo项目正是为了解决这个问题而诞生的。Exo项目旨在让你利用日常电子设备，轻松搭建一个高效的AI集群。本文将详细介绍Exo项目的特点、安装步骤和实战示例。©ivwdcwso(ID:u012172506)Exo项目特点1.广泛的模型支持Exo支持多种流行的AI模型，包括但不限于
鸿蒙多环境配置(二) 龙儿筝鸿蒙 harmonyos
你是否每次手动更改发布证书打app包上加应用市场呢？你是否每次打完包都手动在名称后添加版本号和时间呢？不同环境的依赖包经常打包时忘记改呢？其实这些鸿蒙都支持动态配置。认识hvigor编译构建hvigor将工程解析为一个树形结构，项目为树的根节点，项目中的每个模块为树的叶子节点，树最多为两层，模块中不能包含其他模块，在hvigor的定义中统称项目或模块为一个node(节点)。在构建最开始的初始化阶段
Mooncake：面向大语言模型服务的以 KVCache 为中心的架构步子哥 AGI通用人工智能语言模型架构人工智能
摘要Mooncake是Kimi的服务平台，Kimi是由MoonshotAI提供的领先的LLM服务。它采用以KVCache为中心的分解架构，将预填充和解码集群分离。它还利用GPU集群未充分利用的CPU、DRAM和SSD资源来实现KVCache的分解缓存。Mooncake的核心是其以KVCache为中心的调度器，它在满足延迟相关的服务水平目标(SLO)的同时，平衡了最大化整体有效吞吐量。与假设所有请求
scrapy六 SSSCAESAR
目录设置代理ip设置随机的请求头(u-a)scrapy集成seleniumRedisNoSQL和SQL数据库的比较Redis特性设置代理ip代理的作用：突破自身的IP访问限制隐藏自身真实的ip如何获取ip：付费代理代理ip的匿名度：透明服务器知道这次使用了代理也知道真实的ip匿名服务器知道使用了代理不知道真实的ip高匿不知道使用了代理也不知道真实的ipclassIPProxyDownloaderM
Couchbase UI: Dashboard PersistDZ 数据存储 couchbase
以下是CouchbaseUIDashboard页面详细介绍，包括页面布局和功能说明，帮助你更好地理解和使用。1.首页（Overview）功能：提供集群的整体健康状态和性能摘要集群状态节点健康状况：绿色（正常）、黄色（警告）、红色（问题）。节点数量和服务分布（如数据、索引、查询、分析等服务）。资源利用率内存使用：显示RAM和已分配内存的使用情况。存储使用：展示磁盘空间消耗。网络流量：监控入站和出站流
Lua+Nginx+Redis实现灰度测试和防刷限流 xiaoy990 架构 lua nginx redis
前言了解到lua脚本和nginx的搭配之后，一直想知道这东西能用来做点什么。于是动手实践了一下...下面开始正文前期准备获取openresty：openresty官网(其实就是一个通过lua扩展的nginx服务器)http://openresty.org/cn/getting-started.html获取redis：redis中文网站http://www.redis.cn/功能概述1灰度测试用户访
[HBase]二 HBase原生Shell命令大全墨尔本、晴 HBase 1024程序员节
HBase原生Shell命令汇总1.General组51.1.查看集群状态：status51.2.查看表的操作方法：table_help51.3.查看HBase的版本信息：version51.4.查看当前用户：whoami52.Namespace组52.1.创建命名空间：create_namespace52.2.显示命名空间列表：list_namespace52.3.修改/删除命名空间属性：alt
redis的数据结构——跳表（Skiplist）半桶水专家 Redis redis 数据结构 skiplist
跳表（Skiplist）是一种用于有序数据存储的高效数据结构，它在Redis中用于实现有序集合（SortedSet，zset）的底层存储。当有序集合中的数据较多时，Redis会选择使用跳表来存储元素，以便在保持数据有序的同时提供高效的插入、删除、查找操作。跳表的基本结构跳表是一种多层链表结构，它通过在基本有序链表的基础上添加多层索引，来加速查找的速度。跳表的每一层都是一个链表，底层（Level0）
redis的数据结构——压缩表（Ziplist）半桶水专家 Redis redis 数据结构数据库
压缩表（Ziplist）是Redis中一种紧凑的数据结构，主要用于节省内存。它通常被用于存储少量的字符串或小整数，尤其在列表类型（List）和哈希类型（Hash）中。当数据量较小或数据本身占用内存较少时，Redis会选择用压缩表来存储数据，以减少内存开销。压缩表的基本结构压缩表是一个连续的内存块，它由多个元素（entry）构成，每个元素可以存储一个字符串或者一个整数。压缩表没有固定的容量，可以根据
sudoers文件修改格式错误恢复一张假钞服务器 linux ubuntu
个人博客地址：sudoers文件修改格式错误恢复|一张假钞的真实世界异常信息如下：$sudo-i>>>/etc/sudoers.d/dev:语法错误nearline1<<<sudo:/etc/sudoers.d/dev中第1行附近有解析错误sudo:没有找到有效的sudoers资源，退出sudo:无法初始化策略插件使用以下命令编辑sudoers文件：pkexecvisudo
微信开发者验证接口开发 362217990 微信开发者 token 验证
微信开发者接口验证。 Token，自己随便定义，与微信填写一致就可以了。根据微信接入指南描述 http://mp.weixin.qq.com/wiki/17/2d4265491f12608cd170a95559800f2d.html 第一步：填写服务器配置第二步：验证服务器地址的有效性第三步：依据接口文档实现业务逻辑这里主要讲第二步验证服务器有效性。建一个
一个小编程题-类似约瑟夫环问题 BrokenDreams 编程
今天群友出了一题：一个数列,把第一个元素删除,然后把第二个元素放到数列的最后,依次操作下去,直到把数列中所有的数都删除,要求依次打印出这个过程中删除的数。 &
linux复习笔记之bash shell (5) 关于减号-的作用 eksliang linux关于减号“-”的含义 linux关于减号“-”的用途 linux关于“-”的含义 linux关于减号的含义
转载请出自出处： http://eksliang.iteye.com/blog/2105677 管道命令在bash的连续处理程序中是相当重要的，尤其在使用到前一个命令的studout（标准输出）作为这次的stdin（标准输入）时，就显得太重要了，某些命令需要用到文件名，例如上篇文档的的切割命令（split）、还有
Unix(3) 18289753290 unix ksh
1)若该变量需要在其他子进程执行，则可用"$变量名称"或${变量}累加内容什么是子进程？在我目前这个shell情况下，去打开一个新的shell，新的那个shell就是子进程。一般状态下，父进程的自定义变量是无法在子进程内使用的，但通过export将变量变成环境变量后就能够在子进程里面应用了。 2)条件判断： &&代表and ||代表or&nbs
关于ListView中性能优化中图片加载问题酷的飞上天空 ListView
ListView的性能优化网上很多信息，但是涉及到异步加载图片问题就会出现问题。具体参看上篇文章http://314858770.iteye.com/admin/blogs/1217594 如果每次都重新inflate一个新的View出来肯定会造成性能损失严重，可能会出现listview滚动是很卡的情况，还会出现内存溢出。现在想出一个方法就是每次都添加一个标识，然后设置图
德国总理默多克：给国人的一堂“震撼教育”课永夜-极光教育
http://bbs.voc.com.cn/topic-2443617-1-1.html德国总理默多克：给国人的一堂“震撼教育”课　安吉拉—默克尔，一位经历过社会主义的东德人，她利用自己的博客，发表一番来华前的谈话，该说的话，都在上面说了，全世界想看想传播——去看看默克尔总理的博客吧！　　德国总理默克尔以她的低调、朴素、谦和、平易近人等品格给国人留下了深刻印象。她以实际行动为中国人上了一堂
关于Java继承的一个小问题。。。随便小屋 java
今天看Java 编程思想的时候遇见一个问题，运行的结果和自己想想的完全不一样。先把代码贴出来！ //CanFight接口 interface Canfight { void fight(); } //ActionCharacter类 class ActionCharacter { public void fight() { System.out.pr
23种基本的设计模式 aijuans 设计模式
Abstract Factory：提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。　　Adapter：将一个类的接口转换成客户希望的另外一个接口。A d a p t e r模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。　　Bridge：将抽象部分与它的实现部分分离，使它们都可以独立地变化。　　Builder：将一个复杂对象的构建与它的表示分离，使得同
《周鸿祎自述：我的互联网方法论》读书笔记 aoyouzi 读书笔记
从用户的角度来看,能解决问题的产品才是好产品,能方便/快速地解决问题的产品,就是一流产品. 商业模式不是赚钱模式一款产品免费获得海量用户后,它的边际成本趋于0,然后再通过广告或者增值服务的方式赚钱,实际上就是创造了新的价值链. 商业模式的基础是用户,木有用户,任何商业模式都是浮云.商业模式的核心是产品,本质是通过产品为用户创造价值. 商业模式还包括寻找需求
JavaScript动态改变样式访问技术百合不是茶 JavaScript style属性 ClassName属性
一:style属性格式: HTML元素.style.样式属性="值"; 创建菜单:在html标签中创建或者在head标签中用数组创建 <html> <head> <title>style改变样式</title> </head> &l
jQuery的deferred对象详解 bijian1013 jquery deferred对象
jQuery的开发速度很快，几乎每半年一个大版本，每两个月一个小版本。每个版本都会引入一些新功能，从jQuery 1.5.0版本开始引入的一个新功能----deferred对象。 &nb
淘宝开放平台TOP Bill_chen C++c 物流 C#
淘宝网开放平台首页：http://open.taobao.com/ 淘宝开放平台是淘宝TOP团队的产品，TOP即TaoBao Open Platform，是淘宝合作伙伴开发、发布、交易其服务的平台。支撑TOP的三条主线为： 1.开放数据和业务流程 * 以API数据形式开放商品、交易、物流等业务； &
【大型网站架构一】大型网站架构概述 bit1129 网站架构
大型互联网特点面对海量用户、海量数据大型互联网架构的关键指标高并发高性能高可用高可扩展性线性伸缩性安全性大型互联网技术要点前端优化 CDN缓存反向代理 KV缓存消息系统分布式存储 NoSQL数据库搜索监控安全想到的问题： 1.对于订单系统这种事务型系统，如
eclipse插件hibernate tools安装白糖_ Hibernate
eclipse helios(3.6)版 1.启动eclipse 2.选择 Help > Install New Software...> 3.添加如下地址： http://download.jboss.org/jbosstools/updates/stable/helios/ 4.选择性安装：hibernate tools在All Jboss tool
Jquery easyui Form表单提交注意事项 bozch jquery easyui
jquery easyui对表单的提交进行了封装，提交的方式采用的是ajax的方式，在开发的时候应该注意的事项如下： 1、在定义form标签的时候，要将method属性设置成post或者get，特别是进行大字段的文本信息提交的时候，要将method设置成post方式提交，否则页面会抛出跨域访问等异常。所以这个要
Trie tree(字典树)的Java实现及其应用-统计以某字符串为前缀的单词的数量 bylijinnan java实现
import java.util.LinkedList; public class CaseInsensitiveTrie { /** 字典树的Java实现。实现了插入、查询以及深度优先遍历。 Trie tree's java implementation.(Insert,Search,DFS) Problem Description Igna
html css 鼠标形状样式汇总 chenbowen00 html css
css鼠标手型cursor中hand与pointer Example：CSS鼠标手型效果 <a href="#" style="cursor:hand">CSS鼠标手型效果</a><br/> Example：CSS鼠标手型效果 <a href="#" style=&qu
[IT与投资]IT投资的几个原则 comsci it
无论是想在电商,软件,硬件还是互联网领域投资,都需要大量资金,虽然各个国家政府在媒体上都给予大家承诺,既要让市场的流动性宽松,又要保持经济的高速增长....但是,事实上,整个市场和社会对于真正的资金投入是非常渴望的,也就是说,表面上看起来,市场很活跃,但是投入的资金并不是很充足的......
oracle with语句详解 daizj oracle with with as
oracle with语句详解转在oracle中，select 查询语句，可以使用with,就是一个子查询，oracle 会把子查询的结果放到临时表中，可以反复使用例子:注意，这是sql语句，不是pl/sql语句，可以直接放到jdbc执行的 ----------------------------------------------------------------
hbase的简单操作 deng520159 数据库 hbase
近期公司用hbase来存储日志,然后再来分析 ,把hbase开发经常要用的命令找了出来. 用ssh登陆安装hbase那台linux后用hbase shell进行hbase命令控制台! 表的管理 1）查看有哪些表 hbase(main)> list 2）创建表 # 语法：create <table>, {NAME => <family&g
C语言scanf继续学习、算术运算符学习和逻辑运算符 dcj3sjt126com c
/* 2013年3月11日20:37:32 地点：北京潘家园功能：完成用户格式化输入多个值目的：学习scanf函数的使用 */ # include <stdio.h> int main(void) { int i, j, k; printf("please input three number:\n"); //提示用
2015越来越好 dcj3sjt126com 歌曲
越来越好房子大了电话小了感觉越来越好假期多了收入高了工作越来越好商品精了价格活了心情越来越好天更蓝了水更清了环境越来越好活得有奔头人会步步高想做到你要努力去做到幸福的笑容天天挂眉梢越来越好婆媳和了家庭暖了生活越来越好孩子高了懂事多了学习越来越好朋友多了心相通了大家越来越好道路宽了心气顺了日子越来越好活的有精神人就不显
java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Tim feiteyizu mysql
数据表中有记录的time字段（属性为timestamp）其值为：“0000-00-00 00:00:00” 程序使用select 语句从中取数据时出现以下异常： java.sql.SQLException:Value '0000-00-00' can not be represented as java.sql.Date java.sql.SQLException: Valu
Ehcache（07）——Ehcache对并发的支持 234390216 并发 ehcache 锁 ReadLock WriteLock
Ehcache对并发的支持在高并发的情况下，使用Ehcache缓存时，由于并发的读与写，我们读的数据有可能是错误的，我们写的数据也有可能意外的被覆盖。所幸的是Ehcache为我们提供了针对于缓存元素Key的Read（读）、Write（写）锁。当一个线程获取了某一Key的Read锁之后，其它线程获取针对于同
mysql中blob,text字段的合成索引 jackyrong mysql
在mysql中，原来有一个叫合成索引的，可以提高blob,text字段的效率性能，但只能用在精确查询，核心是增加一个列，然后可以用md5进行散列，用散列值查找则速度快比如： create table abc(id varchar(10),context blog,hash_value varchar(40)); insert into abc(1,rep
逻辑运算与移位运算 latty 位运算逻辑运算
源码：正数的补码与原码相同例+7 源码：00000111 补码：00000111 （用8位二进制表示一个数）负数的补码：符号位为1，其余位为该数绝对值的原码按位取反；然后整个数加1。 -7 源码： 10000111 ，其绝对值为00000111 取反加一：11111001 为-7补码已知一个数的补码，求原码的操作分两种情况：
利用XSD 验证XML文件 newerdragon java xml xsd
XSD文件（XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。具体使用方法和定义请参看： http://www.w3school.com.cn/schema/index.asp java自jdk1.5以上新增了SchemaFactory类可以实现对XSD验证的支持，使用起来也很方便。以下代码可用在J
搭建 CentOS 6 服务器(12) - Samba rensanning centos
（1）安装 # yum -y install samba Installed: samba.i686 0:3.6.9-169.el6_5 # pdbedit -a rensn new password:123456 retype new password:123456 …… （2）Home文件夹 # mkdir /etc
Learn Nodejs 01 toknowme nodejs
（1）下载nodejs https://nodejs.org/download/ 选择相应的版本进行下载（2）安装nodejs 安装的方式比较多，请baidu下我这边下载的是“node-v0.12.7-linux-x64.tar.gz”这个版本（1）上传服务器（2）解压 tar -zxvf node-v0.12.
jquery控制自动刷新的代码举例 xp9802 jquery
1、html内容部分复制代码代码示例: <div id='log_reload'> <select name="id_s" size="1"> <option value='2'>-2s-</option> <option value='3'>-3s-</option

k8s redis集群_一文详解 | K8S 上多租户、高性能的分布式告警系统实践

你可能感兴趣的:(k8s,redis集群,k8s,手动恢复redis,集群)