csdn业界要闻

云原生分布式监控系统？看鹅厂 T11 架构师如何整活儿

来源 | 机智的程序员小熊

责编 | 寇雪芹

头图 | 下载于视觉中国

笑谈监控系统

随着时间的积累，出现故障的风险越来越高，事故的发生总是出人预料，如果采用人力运维的方式，对于故障定位、故障处理都是很大的挑战。故障的时间越长，面临的损失越大，所以在发展到一定程度的团队都需要一套完善的监控系统。

监控大屏

一套完善的监控系统最重要的就是本身永远不可以故障，即使平台故障也要确保监控可能告警出来，所以监控系统本身的高可用，是我们一直在追求的，先来看看一个完备的监控系统应该考虑哪些功能。

监控系统设计面临什么问题

监控系统会对很多角色进行监控，我把他分为这几个大类：服务器、容器、服务或应用、网络、存储、中间件，根据业界的方案，不同的分类使用不同的采集器进行采集。

在功能上要考虑哪些问题？

支持标记不同监控指标来源，方便理清楚业务来源
支持聚合运算，转换指标的含义、组合用来进行计算、汇总、分析
告警、报表、图形化大屏展示
保存历史数据便于溯源

在易用性上应该考虑：

支持配置增减监控项，自定义监控
支持配置表达式进行计算
最好有自动发现，在新增服务器或新增pod等资源时自动纳入监控
支持配置告警策略定义告警范围与阈值，支持自定义告警

方案选型

从以上方面考虑，应该选用哪些开源方案呢？业界常见的有Elasticsearch、Nagios、zabbix、prometheus，其他方案比较小众不做讨论。

方案选型

Elasticsearch 是一个实时的分布式搜索和分析引擎，支持分片、搜索速度快，一般和Logstash、Kibana结合起来一起用，也就是ELK，更擅长文档日志的搜索分析
Nagios: 优点是出错的服务器、应用和设备会自动重启，自动日志滚动；配置灵活，可以自定义 shell 脚本，通过分布式监控模式；并支持以冗余方式进行主机监控，报警设置多样，以及命令重新加载配置文件无需打扰 Nagios 的运行。缺点是事件控制台功能很弱，插件易用性差；对性能、流量等指标的处理不给力；看不到历史数据，只能看到报警事件，很难追查故障原因；配置复杂，初学者投入的时间、精力和成本比较大。
zabbix入门容易、上手简单、功能强大，容易配置和管理，但是深层次需求需要非常熟悉 zabbix 并进行大量的二次定制开发，二次开发太多是不可接受的
prometheus几乎支撑了上面所有的需求，可视化展示可以接入grafana，可以用promSQL语言来做聚合查询，不需要定制；可以使用打tag的方式，对每个指标分类；强大的社区针对各种应用、网络、服务器等设备、角色都提供了采集方案以及无侵入式的高可用方案，这个就是今天讨论的重点

根据上面的种种原因，综合来看prometheus比较合适。

prometheus与他的缺陷

prometheus架构图

从上面的架构图可以看出，prometheus是在客户端部署采集器（exporter）的形式来采集数据，服务端主动向prometheus通信来拉取数据
客户端也可以通过推送数据到PushGateway再交给prometheus拉取
prometheus有自动发现的能力，简单配置以后就可以主动拉取平台接口获取监控范围：azure、consul、openstack等，并针对检测角色配置tag，如果和业务强相关，可以定制修改代码，拉取自己平台的接口来识别监控角色和动态打tag
prometheus也有告警的能力，接入官方提供的AlertManager组件可以检测产生告警，再使用webhook接入自己的告警邮件/短信通知平台
- 这里的问题在于无法通过页面配置告警策略、也无法存储告警记录，可以在AlertManager后面加一些组件来告警收敛、静默、分组、存储
- 告警策略的动态配置，可以写程序根据策略生成告警配置、放到prometheus指定目录下，并调用prometheus热更新接口

唯一要解决的就是负载量大时出现的性能问题以及高可用问题。

单机prometheus的部署存在的问题

prometheus的架构决定是他更适合单机的部署方案，单机部署在压力过大时可以通过服务器升配的方式缓解压力，但是依然会存在共性的问题。

单点prometheus的问题

采集速率会因为cpu/网络通信限制导致卡顿，采集速度变慢，指标在周期内未主动拉取的时候会丢失本次的指标，这里可以把采集周期拉长，后果是粒度变粗，不建议拉太长；另一种方式就是减少无用指标的采集
查询时也是因为同样的原因速度会受到限制，数据存储时间范围过多时，对磁盘会有很大的压力
单点故障时就完全没有办法了，直接服务不可用

单点高负载考虑什么方案？

参考前一次的文章，高负载的时候自动水平扩展，并做负载均衡，首先想到的水平扩展方式就是Prometheus提供的分组能力。

分片采集

相应于把prometheus分片，通过配置的方式各采集部分节点，这种方式有两个问题：数据分散运维困难、要来回切换数据源，看不到全局视图。解决这个问题，考虑增加一个存储位置汇总数据（remote write）。

分片后汇总

这里考虑使用TSDB汇总，需要支持扩容的、支持集群保证高可用的TSDB。但是需要在TSDB上层再加一个查询组件来做查询，会丧失原生的查询语句能力，可以考虑把TSDB替换成prometheus节点，用联邦的形式存储。

联邦

这种情况可以满足基本的使用要求，通过prometheus自监控来通知运维人员手动扩容修改分组，有没有更自动一点的方式呢？

弹性伸缩（自动水平伸缩）

弹性伸缩的前提有三个

要能监控当前节点负载状态，预判扩容时机
需要维护服务启停方式、自动创建服务并放到相应节点上
同时要能修改prometheus各节点数据采集范围

上k8s做容器编排是最直接的方案，可以解决创建和销毁服务的问题，也是可以通过cpu使用率或自定义指标完成横向扩容的，但解决不了的问题是修改prometheus节点配置，动态分配采集范围，考虑使用以下方案：

调度器

prometheus注意要配置节点反亲和性（k8s配置podAntiAffinity）
写一个调度器通过k8s api检测prometheus节点状态
通过k8s检测节点故障以及负载情况，使用hash分摊压力，扩展prometheus的sd自动发现功能，带上自己的hostname来获取调度器提供的数据范围

用这种方式就不需要修改配置文件了，因为是prometheus接口端定时更新监控范围

根据具体运行情况伸缩prometheus，不需要再配置configmap

到这里你可能有一个疑问，假如我监控服务器用上面的方式，那么多接收端，再加一个redis集群的监控，应该放到哪个节点上呢？答案是可以专门创建独立于此自动伸缩方案的prometheus来进行少量数据监控，或者直接放到所有节点上，在上层再考虑去重的问题，这个我们一会讨论。

到目前为止分片以后分散了压力，但还没有解决的问题是数据分散无法汇总查询、单点故障数据丢失的问题。

汇总查询可能你会想到刚刚说的联邦部署，但压力又汇总到一点上了，不能根本的解决问题；解决单点故障应该使用冗余的形式部署，给每个监控范围分配2个及以上监控节点，但会导致客户端拉取次数翻倍，也不建议。

如何保证单点故障数据不丢失

为了避免无法汇总查询、单点故障数据丢失的问题，这里打算接入一个高可用方案thanos，把prometheus设置为无状态应用，并开启远程写把数据推送到thanos。

推送到thanos

这样的话prometheus本身不存储数据，即使挂掉部分节点，只要保证node够多也会再自动伸缩出新的节点，期间读取到的采集范围会先负载变大，然后又得到缓解，整个过程在2个周期内解决。

PS: ，Prometheus在将采集到的指标写入远程存储之前，会先缓存在内存队列中，然后打包发送给远端存储，以减少连接数量，要提高写入速率需要修改配置项queue_config。

简单介绍下thanos，thanos是无侵入式的高可用方案，负责对prometheus产生的数据进行汇总、计算、去重、压缩、存储、查询、告警，他实现了prometheus提供的查询接口，对外部而言查询prometheus还是查询thanos的效果完全一样，是无感知的。

一起来实现分布式高可用监控系统

如何让我们来实现一个这样的组件，你会怎么做呢？

汇总存储，上层完成其他功能

把分片数据写入到存储，其他组件和存储通信，thanos的主流方案也是这么做的。

thanos架构图

如上图所示所有的组件都会与对象存储通信，完成数据存储或者读取的功能。

使用对象存储做存储引擎
和prometheus节点一同部署sidecar，每个节点对应一个，定期放数据推送到对象存储
Ruler负责判定告警以及根据规则做指标聚合运算
Compact负责降准压缩，一份数据变三份，一般是分为1分钟、5分钟、1小时写回存储，查询时间粒度越大呈现指标粒度越粗，防止前端数据刷爆
Query与其他组件通过grpc的方式进行通信读取数据，它不和对象存储直接通信，而是在中间加了一层gateway网关
上图的方案sidecar不是我这次的架构，其他是一样的，sidecar的原理是把采集到的数据使用缓存到本地(默认2小时数据为热数据)，冷数据才推送，近期数据存储本地，查询时再做汇总会有一定的压力，同时单点故障问题还是没有解决

如果是小规模集群无网络压力可以使用sidercar。

不要在接收端存储

和prometheus部署在一起的sidercar违背了容器中的简单性原则，也提高存储压力，把他们剥离开试试？

汇总再转存

我的想法是收集数据推送，然后进行存储，由其他组件完成与存储的通信。

receive方案

如上图，Receive组件实现了remote write接口，Prometheus可以将数据实时推送到Receive上；Receive本身实际上相当于一个没有收集功能的Prometheus,那此时Prometheus就不再需要存储数据，之前的方案就可以实施了。

对象存储中的数据具有不可修改特性，也就是说一旦写入就变成只读了
Prometheus本地存储的原理是接受到的数据写到本地文件存储里面组成WAL文件列表，Receive也是这么做的，然后超过一定时限后生成block，这些block会上传到对象存储
Query组件来近期数据（默认2小时内）查询recevie，过期后使用对象存储
receive使用k8s的dnssrv功能做服务发现，便于下游拉取数据而不要使用k8s的service:ip自带的负载均衡
receive自带了hash算法，可以把上游远程写过来的流量均匀分布在各个节点上，这里可以采用k8s的service自动轮训，recevie会把请求route到相应节点上

为防止prometheus挂掉一个导致的数据丢失问题，给prometheus加一个副本，然后在query时去重，主要由query的--query.replica-label 参数和Prometheus 配置的 prometheus_replica参数来实现，如下图：

概览

同样的其他组件，如ruler也可以配置冗余部署rule_replica就不展开讲了。还好recevie自带了分布式一致性算法，不然就要自己实现一个了，到此我们解决了。

数据接收端能应对海量数据的压力均衡
解决了prometheus部署在不同集群上时查询延迟高的问题
解决了跨节点数据复合运算（ruler）
解决了数据压缩降准

hashring真的是分布式一致性算法吗

我们知道分布式一致性算法可以解决下面的问题：

在压力增加时做到自动扩容，压力减小时自动缩容
扩缩容时必须要保障数据不丢失，单点故障时数据也不可以丢失
扩缩容时数据映射落点要一致，不然会出现数据断连

但是实际使用过程中，不难发现，还是会发生数据丢失，这引起了我的兴趣。

这一块的官网介绍很少，hashring 的endpoints参考下面的代码，你会发现0 1 2 的方式就是k8s的statefulset为pod 分配的name，所以recevie要以sts的方式部署，并提前把副本数与配置关系对应起来，3节点已经可以支撑很大数量的数据处理了。

thanos-receive-hashrings.json: |
    [
      {
        "hashring": "soft-tenants",
        "endpoints":
        [
          "thanos-receive-0.thanos-receive.thanos.svc.cluster.local:10901",
          "thanos-receive-1.thanos-receive.thanos.svc.cluster.local:10901",
          "thanos-receive-2.thanos-receive.thanos.svc.cluster.local:10901"
        ]
      }
    ]

在源码里发现，实际上这里并没有使用分布式一致性算法！！ 在hashring.go函数里可以看到，这是一个简单的hash mod，所以hashring是有误导性的。

func (s simpleHashring) GetN(tenant string, ts *prompb.TimeSeries, n uint64) (string, error) {
 if n >= uint64(len(s)) {
  return "", &insufficientNodesError{have: uint64(len(s)), want: n + 1}
 }
 return s[(hash(tenant, ts)+n)%uint64(len(s))], nil
}

提炼出来是这样的hash算法：

hash(string(tenant_id) + sort(timeseries.labelset).join())

tenant_id是指数据源带上租户，可以给不同租户分配自己的hash
具体的hash算法使用xxHash 参考文末资料5

解决的办法也有了，可以通过配置多副本冗余的方式，把receive的数据冗余到其他位置，设置receive.replication-factor配置，然后拉取数据的时候因为使用的是服务发现，和所有服务通信的方式，可以在一定程序上保证数据不丢失。

PS: 冗余也会有点问题，算法是先选hash mod后的节点，比如是第n个，然后如果factor是2，就再选n+1和n+2，然后发请求给n，这个时候如果n挂了其实会失败，相对而言n+1或者n+2节点挂了的话不会对这部分的数据有影响。

当receive出现故障是怎么处理的

当发生扩缩容的时候，由于hashring发生变化，所有的节点需要将write-ahead-log的数据flush到TSDB块并上传到OSS中（如果配置了的话），因为这些节点之后将有一个新的分配。之前已存在节点上的时间序列不需要作调整，只是后面过来的请求按新的分发来寻找该去的receiver节点。

这个过程不需要重启receive，代码里有watch，可以检测hashring的变化。注意，这种情况发生的flush可能会产生较小的TSDB块，但compactor模块可以将它们优化合并，因此不会有什么问题。

当有receiver节点发生故障时，prometheus的远程写会在后端目标无响应或503时进行重试，因此，receiver一定时间的服务挂掉是可以容忍的。如果这种挂机时间是不可接受的话，可以将副本数配置为 3 或以上，这样即使有一个receiver节点挂掉，还有其他receiver节点来接收写请求。

业务指标计算问题

如果有非常复杂的业务指标，需要从其他地方采集推送，最好的方式是写成采集器exporter，在ruler进行复合运算，当然也有可能出现表达式写不出来的尴尬问题。

考虑写成k8s的job定时任务，把数据推送到PushGateway，再交给prometheus去拉取。

PS1: 注意按exporter的开发标准，不允许出现重复指标哦。

PS2：如果要删除过期的垃圾数据可以调用PushGateway的http://%s/metrics/job/%s/instance/%s/host/接口进行删除。

告警策略动态更新/告警记录储存的问题

要动态生成告警策略，可以写一个服务接收请求，调用k8s生成configmap，并通知ruler进行热更新。

更新策略配置文件configmap（同步更新到pod里会有一定的延迟，使用subPath是无法热更新的,注意configMapAndSecretChangeDetectionStrategy: Watch参数必须为默认参数Watch）
把configmap挂载相应的ruler上面

全景视图

最后

当然对于一个成熟的监控系统来说，除了发现故障及时告警以外，还应该有更多的功能，这不是本次讨论的范围，如果有时间未来会写写。

运营故障报表和资源日报周报月报等用于趋势分析
低负载报表用于分析服务器利用率，防止资源浪费
有了故障趋势和更多的重要指标覆盖，可以结合AI进行故障预测，在故障发生前提前预测

针对全k8s的集群监控来说，还有更简单的方式来监控，那就是Prometheus Operator，可以非常简单的创建k8s的资源，比如收集器Prometheus、采集器的抽象ServiceMonitor、AlertManager等，要监控什么数据就变成直接操作k8s集群的资源对象了。

监控可能为其他应用的水平伸缩服务服务，使用Prometheus Adpater来自定义监控某些指标，来达到自动扩缩容的目的，监控还可以为运维平台服务，提供故障自动修复。一句话，只要监控运维平台做得足够好，运维人员都得失业。

参考资料：

1、7 款你不得不了解的开源云监控工具-https://www.infoq.cn/article/s2h1qhcy1xktvfmfuvzs

2、Thanos在TKEStack中的实践 - Even - A super concise theme for Hugo https://kevinfeng.github.io/post/thanos-in-tkestack/

3、Prometheus Remote Write配置 - 时序数据库 TSDB - 阿里云 - https://help.aliyun.com/document_detail/114516.html

4、Thanos - Highly available Prometheus setup with long term storage capabilities - https://thanos.io/tip/components/receive.md/

5、xxHash - Extremely fast non-cryptographic hash algorithm - http://cyan4973.github.io/xxHash/

2020-2021中国开发者调查报告重磅来袭，直接扫码或微信搜索「CSDN」公众号，后台回复关键词「开发者」，快速获取完整的报告内容！

更多精彩推荐

☞Kubernetes 和 Docker，到底什么关系？☞PassMark 更新排行，苹果 M1 杀疯了☞干货！Redis集群工作原理解析

点分享点收藏点点赞点在看

你可能感兴趣的:(分布式,运维,java,数据库,大数据)

JSON 与 AJAX Auscy json ajax 前端
一、JSON（JavaScriptObjectNotation）1.数据类型与语法细节支持的数据类型：基本类型：字符串（需用双引号）、数字、布尔值（true/false）、null。复杂类型：数组（[]）、对象（{}）。严格语法规范：键名必须用双引号包裹（如"name":"张三"）。数组元素用逗号分隔，最后一个元素后不能有多余逗号。数字不能以0开头（如012会被解析为12），不支持八进制/十六进制
JavaScript 树形菜单总结 Auscy microsoft
树形菜单是前端开发中常见的交互组件，用于展示具有层级关系的数据（如文件目录、分类列表、组织架构等）。以下从核心概念、实现方式、常见功能及优化方向等方面进行总结。一、核心概念层级结构：数据以父子嵌套形式存在，如{id:1,children:[{id:2}]}。节点：树形结构的基本单元，包含自身信息及子节点（若有）。展开/折叠：子节点的显示与隐藏切换，是树形菜单的核心交互。递归渲染：因数据层级不固定，
精通Canvas：15款时钟特效代码实现指南烟幕缭绕
本文还有配套的精品资源，点击获取简介：HTML5的Canvas是一个用于绘制矢量图形的API，通过JavaScript实现动态效果。本项目集合了15种不同的时钟特效代码，帮助开发者通过学习绘制圆形、线条、时间更新、旋转、颜色样式设置及动画效果等概念，深化对Canvas的理解和应用。项目中的CSS文件负责时钟的样式设定，而JS文件则包含实现各种特效的逻辑，通过不同的函数或类处理时间更新和动画绘制，提
深入剖析OpenJDK 18 GA源码：Java平台最新发展想法臃肿
本文还有配套的精品资源，点击获取简介：OpenJDK18GA作为Java开发的关键里程碑，提供了诸多新特性和改进。本文章深入探讨了OpenJDK18GA源码，揭示其内部机制，帮助开发者更好地理解和利用这个版本。文章还涵盖了PatternMatching、SealedClasses、Records、JEP395、JEP406和JEP407等特性，以及HotSpot虚拟机、编译器、垃圾收集器、内存模型
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
Java大厂面试实录：谢飞机的电商场景技术问答（Spring Cloud、MyBatis、Redis、Kafka、AI等）
Java大厂面试实录：谢飞机的电商场景技术问答（SpringCloud、MyBatis、Redis、Kafka、AI等）本文模拟知名互联网大厂Java后端岗位面试流程，以电商业务为主线，由严肃面试官与“水货”程序员谢飞机展开有趣的对话，涵盖SpringCloud、MyBatis、Redis、Kafka、SpringSecurity、AI等热门技术栈，并附详细解析，助力求职者备战大厂面试。故事设定谢
【超硬核】JVM源码解读：Java方法main在虚拟机上解释执行 HeapDump性能社区 java 开发语言后端 jvm
本文由HeapDump性能社区首席讲师鸠摩（马智）授权整理发布第1篇-关于Java虚拟机HotSpot，开篇说的简单点开讲Java运行时，这一篇讲一些简单的内容。我们写的主类中的main()方法是如何被Java虚拟机调用到的？在Java类中的一些方法会被由C/C++编写的HotSpot虚拟机的C/C++函数调用，不过由于Java方法与C/C++函数的调用约定不同，所以并不能直接调用，需要JavaC
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
【前端】jQuery数组合并去重方法总结
在jQuery中合并多个数组并去重，推荐使用原生JavaScript的Set对象（高效简单）或$.unique()（仅适用于DOM元素，不适用于普通数组）。以下是完整解决方案：方法1：使用ES6Set（推荐）//定义多个数组constarr1=[1,2,3];constarr2=[2,3,4];constarr3=[3,4,5];//合并数组并用Set去重constmergedArray=[...
CentOS7环境卸载MySQL5.7 Hadoop_Liang mysql 数据库 mysql
备份重要数据切记，卸载之前先备份mysql重要的数据。备份一个数据库例如：备份名为mydatabase的数据库到backup.sql的文件中mysqldump-uroot-ppassword123mydatabase>backup.sql备份所有数据库mysqldump-uroot-ppassword123--all-databases>all_databases_backup.sql注意：-p后
php SPOF 贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.什么是单点故障（SPOF）？单点故障指的是系统中某个组件一旦失效，整个系统或服务就会不可用。常见的单点有：数据库、缓存、Web服务器、负载均衡、网络设备等。2.常见单点故障场景只有一台数据库服务器，宕机后所有业务不可用只有一台Redis缓存，挂掉后缓存全部失效只有一台Web服务器，挂掉后网站无法访问只有一个负载均衡节点，挂掉后流量无法分发只有一条网络链路，断开后所有服务失联3.消除单点故障的主
php 高并发下日志量巨大，如何高效采集、存储、分析贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.问题背景高并发系统每秒产生大量日志（如访问日志、错误日志、业务日志等）。单机写入、存储、分析能力有限，容易成为瓶颈。需要支持实时采集、分布式存储、快速检索与分析。2.主流架构方案一、分布式日志采集架构[应用服务器(PHP等)]|v[日志采集Agent（如Filebeat、Fluentd、Logstash）]|v[消息队列/缓冲（如Kafka、Redis、RabbitMQ）]|v[日志存储（如E
centos7安装 mysql5.7(安装包) heiPony linux mysql mariadb centos mysql
一.卸载centos7自带数据库查看系统自带的Mariadbrpm-qa|grepmariadbmariadb-libs-5.5.44-2.el7.centos.x86_64卸载rpm-e--nodepsmariadb-libs-5.5.44-2.el7.centos.x86_64删除etc目录下的my.cnfrm/etc/my.cnf二.检查mysql是否存在(有就卸载,删除相关文件)rpm-q
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
Java特性之设计模式【责任链模式】 Naijia_OvO Java特性 java 设计模式责任链模式
一、责任链模式概述顾名思义，责任链模式（ChainofResponsibilityPattern）为请求创建了一个接收者对象的链。这种模式给予请求的类型，对请求的发送者和接收者进行解耦。这种类型的设计模式属于行为型模式在这种模式中，通常每个接收者都包含对另一个接收者的引用。如果一个对象不能处理该请求，那么它会把相同的请求传给下一个接收者，依此类推主要解决：职责链上的处理者负责处理请求，客户只需要将
日历插件-FullCalendar的详细使用老马聊技术 JavaScript 前端 javascript
一、介绍FullCalendar是一个功能强大、高度可定制的JavaScript日历组件，用于在网页中显示和管理日历事件。它支持多种视图（月、周、日等），可以轻松集成各种框架，并提供丰富的事件处理功能。二、实操案例具体代码如下：FullCalendar日期选择body{font-family:Arial,sans-serif;margin:20px;}#calendar{max-width:900
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
react-native android 环境搭建
环境：macjava版本：Java11最重要：一定要一定要一定要react涉及到很多的依赖下载，gradle和react相关的，第一次安装环境时有外网环境会快速很多。安装nodejs安装react-nativenpminstallreact-native-clinpminstallreact-native创建一个新项目react-nativeinitfirstReact替换gradle下载源rep
Java 调用 HTTP 接口的 7 种方式：全网最全指南
Java调用HTTP接口的7种方式：全网最全指南在开发过程中，调用HTTP接口是最常见的需求之一。本文将详细介绍Java中7种主流的调用HTTP接口的方式，包括每种工具的优缺点和完整代码实现。1.使用RestTemplateRestTemplate是Spring提供的同步HTTP客户端，适用于传统项目。尽管从Spring5开始被标记为过时，它仍然是许多开发者的首选。示例代码importorg.sp
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
[特殊字符] 实时数据洪流突围战：Flink+Paimon实现毫秒级分析的架构革命（附压测报告）——日均百亿级数据处理成本降低60%的工业级方案 Lucas55555555 flink 大数据
引言：流批一体的时代拐点据阿里云2025白皮书显示，实时数据处理需求年增速达240%，但传统Lambda架构资源消耗占比超运维成本的70%。某电商平台借助Flink+Paimon重构实时数仓后，端到端延迟从分钟级压缩至800ms，计算资源节省5.6万核/月。技术红利窗口期：2025年ApachePaimon1.0正式发布，支持秒级快照与湖仓一体，成为替代Iceberg的新范式一、痛点深挖：实时数仓
RocketMQ 之死信队列 firepation RocketMQ rocketmq
在分布式消息系统中，消息的可靠传递和处理至关重要。然而，由于各种原因（如消息处理失败、消费超时等），一些消息可能无法被正常消费。这些无法被消费的消息如果不加以处理，会影响系统的稳定性和数据一致性。为了解决这一问题，RocketMQ提供了死信队列（DeadLetterQueue，DLQ）机制。本文将深入探讨RocketMQ的死信队列，包括其实现原理、应用场景以及使用示例。什么是死信队列？死信队列是一
javascript高级程序设计第3版——第12章 DOM2与DOM3 weixin_30687587 javascript 数据结构与算法 ViewUI
12章——DOM2与DOM3为了增强D0M1，DOM级规范定义了一些模块。DOM2核心：为不同的DOM类型引入了一些与XML命名空间有关的方法，还定义了以编程方式创建Document实例的方法；DOM2级样式：针对操作元素的样式而开发；其特性总结：1.每个元素都有一个关联的style对象，可用来确定和修改行内样式；2.要确定某个元素的计算样式，可使用getComgetComputedStyle（）
Java设计模式实战：高频场景解析与避坑指南 mckim_ 笔记学习 java 设计模式
引言设计模式是软件开发的基石，但许多开发者面对23种模式时容易陷入“学完就忘”或“滥用模式”的困境。本文从工业级项目视角出发，精选10种高频设计模式，结合真实代码案例与主流框架应用，帮你建立模式思维，拒绝纸上谈兵。一、创建型模式：告别new的暴力美学1.工厂方法模式（FactoryMethod）核心痛点：对象创建逻辑散落各处，难以统一管理。场景案例：电商平台需要支持多种支付方式（支付宝、微信、银联
JavaScript 基础09：Web APIs——日期对象、DOM节点梦想当全栈 JavaScript javascript 前端开发语言
JavaScript基础09：WebAPIs——日期对象、DOM节点进一步学习DOM相关知识，实现可交互的网页特效能够插入、删除和替换元素节点。能够依据元素节点关系查找节点。一、日期对象掌握Date日期对象的使用，动态获取当前计算机的时间。ECMAScript中内置了获取系统时间的对象Date，使用Date时与之前学习的内置对象console和Math不同，它需要借助new关键字才能使用。1.实例
《Java前端开发全栈指南：从Servlet到现代框架实战》
前言在当今Web开发领域，Java依然是后端开发的主力语言，而随着前后端分离架构的普及，Java开发者也需要掌握前端技术栈。本文将全面介绍JavaWeb前端开发的核心技术，包括传统Servlet/JSP体系、现代前端框架集成方案，以及全栈开发的最佳实践。通过本文，您将了解如何构建现代化的JavaWeb应用前端界面。一、JavaWeb前端技术演进1.1传统技术栈Servlet：JavaWeb基础，处
自动化运维工程师面试题解析【真题】
ZabbixAgent默认监听的端口是A.10050。以下是关键分析：选项排除：C.80是HTTP默认端口，与ZabbixAgent无关。D.5432是PostgreSQL数据库的默认端口，不涉及ZabbixAgent。B.10051是ZabbixServer的默认监听端口，用于接收Agent发送的数据，而非Agent自身的监听端口。ZabbixAgent的配置：根据官方文档，ZabbixAgen
rust的指针作为函数返回值是直接传递，还是先销毁后创建？ wudixiaotie 返回值
这是我自己想到的问题，结果去知呼提问，还没等别人回答，我自己就想到方法实验了。。 fn main() { let mut a = 34; println!("a's addr:{:p}", &a); let p = &mut a; println!("p's addr:{:p}", &a
java编程思想 -- 数据的初始化百合不是茶 java 数据的初始化
1.使用构造器确保数据初始化 /* *在ReckInitDemo类中创建Reck的对象 */ public class ReckInitDemo { public static void main(String[] args) { //创建Reck对象 new Reck(); } }
[航天与宇宙]为什么发射和回收航天器有档期 comsci
地球的大气层中有一个时空屏蔽层,这个层次会不定时的出现,如果该时空屏蔽层出现,那么将导致外层空间进入的任何物体被摧毁,而从地面发射到太空的飞船也将被摧毁... 所以,航天发射和飞船回收都需要等待这个时空屏蔽层消失之后,再进行 &
linux下批量替换文件内容商人shang linux 替换
1、网络上现成的资料　　格式: sed -i "s/查找字段/替换字段/g" `grep 查找字段 -rl 路径` 　　linux sed 批量替换多个文件中的字符串　　sed -i "s/oldstring/newstring/g" `grep oldstring -rl yourdir` 　　例如：替换/home下所有文件中的www.admi
网页在线天气预报 oloz 天气预报
网页在线调用天气预报 <%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transit
SpringMVC和Struts2比较杨白白 springMVC
1. 入口 spring mvc的入口是servlet，而struts2是filter（这里要指出，filter和servlet是不同的。以前认为filter是servlet的一种特殊），这样就导致了二者的机制不同，这里就牵涉到servlet和filter的区别了。参见：http://blog.csdn.net/zs15932616453/article/details/8832343 2
refuse copy, lazy girl! 小桔子 copy
妹妹坐船头啊啊啊啊！都打算一点点琢磨呢。文字编辑也写了基本功能了。。今天查资料，结果查到了人家写得完完整整的。我清楚的认识到： 1.那是我自己觉得写不出的高度 2.如果直接拿来用，很快就能解决问题 3.然后就是抄咩~~ 4.肿么可以这样子，都不想写了今儿个，留着作参考吧！拒绝大抄特抄，慢慢一点点写！
apache与php整合 aichenglong php apache web
一 apache web服务器 1 apeche web服务器的安装 1)下载Apache web服务器 2)配置域名(如果需要使用要在DNS上注册) 3)测试安装访问http://localhost/验证是否安装成功 2 apache管理 1)service.msc进行图形化管理 2)命令管理，配
Maven常用内置变量 AILIKES maven
Built-in properties ${basedir} represents the directory containing pom.xml ${version} equivalent to ${project.version} (deprecated: ${pom.version}) Pom/Project properties Al
java的类和对象百合不是茶 JAVA面向对象类对象
java中的类： java是面向对象的语言，解决问题的核心就是将问题看成是一个类，使用类来解决 java使用 class 类名来创建类，在Java中类名要求和构造方法，Java的文件名是一样的创建一个A类： class A{ } java中的类：将某两个事物有联系的属性包装在一个类中，再通
JS控制页面输入框为只读 bijian1013 JavaScript
在WEB应用开发当中，增、删除、改、查功能必不可少，为了减少以后维护的工作量，我们一般都只做一份页面，通过传入的参数控制其是新增、修改或者查看。而修改时需将待修改的信息从后台取到并显示出来，实际上就是查看的过程，唯一的区别是修改时，页面上所有的信息能修改，而查看页面上的信息不能修改。因此完全可以将其合并，但通过前端JS将查看页面的所有信息控制为只读，在信息量非常大时，就比较麻烦。
AngularJS与服务器交互 bijian1013 JavaScript AngularJS $http
对于AJAX应用（使用XMLHttpRequests）来说，向服务器发起请求的传统方式是：获取一个XMLHttpRequest对象的引用、发起请求、读取响应、检查状态码，最后处理服务端的响应。整个过程示例如下： var xmlhttp = new XMLHttpRequest(); xmlhttp.onreadystatechange
[Maven学习笔记八]Maven常用插件应用 bit1129 maven
常用插件及其用法位于：http://maven.apache.org/plugins/ 1. Jetty server plugin 2. Dependency copy plugin 3. Surefire Test plugin 4. Uber jar plugin 1. Jetty Pl
【Hive六】Hive用户自定义函数(UDF) bit1129 自定义函数
1. 什么是Hive UDF Hive是基于Hadoop中的MapReduce，提供HQL查询的数据仓库。Hive是一个很开放的系统，很多内容都支持用户定制，包括：文件格式：Text File，Sequence File 内存中的数据格式： Java Integer/String, Hadoop IntWritable/Text 用户提供的 map/reduce 脚本：不管什么
杀掉nginx进程后丢失nginx.pid，如何重新启动nginx ronin47 nginx 重启 pid丢失
nginx进程被意外关闭，使用nginx -s reload重启时报如下错误：nginx: [error] open() “/var/run/nginx.pid” failed (2: No such file or directory)这是因为nginx进程被杀死后pid丢失了，下一次再开启nginx -s reload时无法启动解决办法：nginx -s reload 只是用来告诉运行中的ng
UI设计中我们为什么需要设计动效 brotherlamp UI ui教程 ui视频 ui资料 ui自学
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用你的产品。
Spring中JdbcDaoSupport的DataSource注入问题 bylijinnan java spring
参考以下两篇文章： http://www.mkyong.com/spring/spring-jdbctemplate-jdbcdaosupport-examples/ http://stackoverflow.com/questions/4762229/spring-ldap-invoking-setter-methods-in-beans-configuration Sprin
数据库连接池的工作原理 chicony 数据库连接池
随着信息技术的高速发展与广泛应用，数据库技术在信息技术领域中的位置越来越重要，尤其是网络应用和电子商务的迅速发展，都需要数据库技术支持动态Web站点的运行，而传统的开发模式是：首先在主程序（如Servlet、Beans）中建立数据库连接；然后进行SQL操作，对数据库中的对象进行查询、修改和删除等操作；最后断开数据库连接。使用这种开发模式，对
java 关键字 CrazyMizzz java
关键字是事先定义的，有特别意义的标识符，有时又叫保留字。对于保留字，用户只能按照系统规定的方式使用，不能自行定义。 Java中的关键字按功能主要可以分为以下几类：（1）访问修饰符 public,private,protected p
Hive中的排序语法 daizj 排序 hive order by DISTRIBUTE BY sort by
Hive中的排序语法 2014.06.22 ORDER BY hive中的ORDER BY语句和关系数据库中的sql语法相似。他会对查询结果做全局排序，这意味着所有的数据会传送到一个Reduce任务上，这样会导致在大数量的情况下，花费大量时间。与数据库中 ORDER BY 的区别在于在hive.mapred.mode = strict模式下，必须指定 limit 否则执行会报错。
单态设计模式 dcj3sjt126com 设计模式
单例模式（Singleton）用于为一个类生成一个唯一的对象。最常用的地方是数据库连接。使用单例模式生成一个对象后，该对象可以被其它众多对象所使用。 <?phpclass Example{ // 保存类实例在此属性中 private static&
svn locked dcj3sjt126com Lock
post-commit hook failed (exit code 1) with output: svn: E155004: Working copy 'D:\xx\xxx' locked svn: E200031: sqlite: attempt to write a readonly database svn: E200031: sqlite: attempt to write a
ARM寄存器学习 e200702084 数据结构 C++c C#F#
无论是学习哪一种处理器，首先需要明确的就是这种处理器的寄存器以及工作模式。 ARM有37个寄存器，其中31个通用寄存器，6个状态寄存器。 1、不分组寄存器（R0-R7）不分组也就是说说，在所有的处理器模式下指的都时同一物理寄存器。在异常中断造成处理器模式切换时，由于不同的处理器模式使用一个名字相同的物理寄存器，就是
常用编码资料 gengzg 编码
List<UserInfo> list=GetUserS.GetUserList(11); String json=JSON.toJSONString(list); HashMap<Object,Object> hs=new HashMap<Object, Object>(); for(int i=0;i<10;i++) {
进程 vs. 线程 hongtoushizi 线程 linux 进程
我们介绍了多进程和多线程，这是实现多任务最常用的两种方式。现在，我们来讨论一下这两种方式的优缺点。首先，要实现多任务，通常我们会设计Master-Worker模式，Master负责分配任务，Worker负责执行任务，因此，多任务环境下，通常是一个Master，多个Worker。如果用多进程实现Master-Worker，主进程就是Master，其他进程就是Worker。如果用多线程实现
Linux定时Job：crontab -e 与 /etc/crontab 的区别 Josh_Persistence linux crontab
一、linux中的crotab中的指定的时间只有5个部分：* * * * * 分别表示：分钟，小时，日，月，星期，具体说来：第一段代表分钟 0—59 第二段代表小时 0—23 第三段代表日期 1—31 第四段代表月份 1—12 第五段代表星期几，0代表星期日 0—6 如： */1 * * * * 每分钟执行一次。 *
KMP算法详解 hm4123660 数据结构 C++算法字符串 KMP
字符串模式匹配我们相信大家都有遇过，然而我们也习惯用简单匹配法（即Brute-Force算法)，其基本思路就是一个个逐一对比下去，这也是我们大家熟知的方法，然而这种算法的效率并不高，但利于理解。假设主串s="ababcabcacbab",模式串为t="
枚举类型的单例模式 zhb8015 单例模式
E.编写一个包含单个元素的枚举类型[极推荐]。代码如下： public enum MaYun {himself; //定义一个枚举的元素，就代表MaYun的一个实例private String anotherField;MaYun() {//MaYun诞生要做的事情//这个方法也可以去掉。将构造时候需要做的事情放在instance赋值的时候：/** himself = MaYun() {*
Kafka+Storm+HDFS ssydxa219 storm
cd /myhome/usr/stormbin/storm nimbus &bin/storm supervisor &bin/storm ui &Kafka+Storm+HDFS整合实践kafka_2.9.2-0.8.1.1.tgzapache-storm-0.9.2-incubating.tar.gzKafka安装配置我们使用3台机器搭建Kafk
Java获取本地服务器的IP 中华好儿孙 java Web 获取服务器ip地址
System.out.println("getRequestURL:"+request.getRequestURL()); System.out.println("getLocalAddr:"+request.getLocalAddr()); System.out.println("getLocalPort:&quo