cpongo9

网易云基于Prometheus的微服务监控实践

当监控遇上微服务

在过去数年里，微服务的落地一直都是业界重点关注的问题，其始终面临着部署、监控、配置和治理等方面的挑战。轻舟微服务平台是网易云为企业提供的一套微服务解决方案，其中微服务监控是其关注的重点问题之一。与传统监控相比，微服务监控面临着更多难点，包括：

监控对象动态可变，无法进行预先配置；
监控范围非常繁杂，各类监控难以互相融合；
微服务实例间的调用关系非常复杂，故障排查会很困难；
微服务架构仍在快速发展，难以抽象出稳定的通用监控模型。

在工程角度也面临着不少考验，如：

在微服务架构里，软件系统通常会被拆分为数十甚至数百个微服务，这种拆分会使得监控数据爆炸增长，监控系统必须具备处理和展示这些数据的能力；
监控系统必须要保证可靠性，具体而言：保证不会因为单点故障而全局失效，监控数据有备份机制，系统各服务的实例均可通过备份数据得到恢复；
监控系统必须支持云上部署及快速水平扩容，这既是云原生的基本要求，也符合企业系统微服务化演进的实际情况。

微服务监控的技术选型

微服务监控的诸多挑战使得我们不得不慎重地进行技术选型。选择开源还是再造轮子，这个问题在项目初期一直困扰着我们，经过一段时间的调研和论证，开源项目Prometheus成了最终的答案。

Prometheus是CNCF旗下的项目，该项目是一个用于系统和应用服务监控的软件，它能够以给定的时间间隔从给定目标中收集监控指标，并能够通过特定查询表达式获取查询结果。

选择Prometheus的主要原因是：

灵活的数据模型：在Prometheus里，监控数据是由值、时间戳和标签表组成的，其中监控数据的源信息是完全记录在标签表里的；同时Prometheus支持在监控数据采集阶段对监控数据的标签表进行修改，这使其具备强大的扩展能力；
强大的查询能力：Prometheus提供有数据查询语言PromQL。从表现上来看，PromQL提供了大量的数据计算函数，大部分情况下用户都可以直接通过PromQL从Prometheus里查询到需要的聚合数据；
健全的生态: Prometheus能够直接对常见操作系统、中间件、数据库、硬件及编程语言进行监控；同时社区提供有Java/Golang/Ruby语言客户端SDK，用户能够快速实现自定义监控项及监控逻辑；
良好的性能：在性能方面来看，Prometheus提供了PromBench基准测试，从最新测试结果来看，在硬件资源满足的情况下，Prometheus单实例在每秒采集10w条监控数据的情况下，在数据处理和查询方面依然有着不错的性能表现；
更契合的架构：采用推模型的监控系统，客户端需要负责在服务端上进行注册及监控数据推送；而在Prometheus采用的拉模型架构里，具体的数据拉取行为是完全由服务端来决定的。服务端是可以基于某种服务发现机制来自动发现监控对象，多个服务端之间能够通过集群机制来实现数据分片。推模型想要实现相同的功能，通常需要客户端进行配合，这在微服务架构里是比较困难的；
成熟的社区：Prometheus是CNCF组织第二个毕业的开源项目，拥有活跃的社区；成立至今，社区已经发布了一百多个P版本，项目在GitHub上获得的star数超过了2万。

Prometheus虽然在上述六方面拥有优势，但其仍然难以满足微服务监控的所有需求，具体而言：

仅适用于维度监控，不能用于日志监控、分布式追踪等范围；
告警规则和告警联系人仅支持通过静态文件配置；
原生支持的数据聚合函数有限且不支持扩展；

这些不足都说明了一个事实，Prometheus社区版并非微服务监控的最终答案。

我们的答案-轻舟微服务监控系统的设计

从大的方面来看，我们将微服务监控划分为维度监控、日志监控、分布式追踪等三部分。其中维度监控在整个微服务监控里最为重要，所占比例也最大，此类监控的层级有如下划分：

基础设施监控:主要对各个微服务实例所在的基础设施进行监控，具体包括这些设施的运行状态、资源使用情况及系统日志进行监控，一般而言微服务应用实例会运行在容器里，因此这个维度的监控对象也通常包含有容器编排系统、持续构建系统、镜像仓库等，这些对象的具体监控指标的范围包括对象的健康状态、运行状态、资源使用情况等；
微服务通用监控：主要针对微服务通用指标进行监控，包括服务实例处理请求的情况及实例调用其它服务的情况，具体而言包括请求总数、请求处理时延（中位数，包括有90、95和99值）、请求结果（成功、失败、熔断、限流、超时和拒绝）统计、调用其它服务的结果（成功、失败、熔断、限流、超时和拒绝）统计及时延（中位数，包括有90、95和99值）；
应用监控：主要对具体的微服务实例进行性能监控，通过数据自动化收集、数据可视化展示，使用户能够及时、全面地掌控各个实例的性能情况，定位性能瓶颈。这一维度重点在于提供丰富的应用性能展示及性能问题定位功能，包括应用响应时间、吞吐量和状态的展示，慢响应和错误明细的查询。
通用中间件：我们没有预置这个维度的监控到系统里，不过得益于Prometheus完善的生态，系统保留有对常用数据库、消息队列及缓存进行监控的能力，具体包括MySQL、Redis、Memcached、Consul、RabbitMQ及Kafka等。

在工程实现方面，我们进行了如下设计：

用Prometheus原生的联邦集群部署模式，使得全部监控数据分片处理；分片处理机制使得只需要增加实例个数就能够应对海量监控数据问题；
多Prometheus实例作用于同一监控对象，使得单一实例失效也不会影响到此对象的监控，满足高可用的要求；
监控系统所有组件及配置均实现容器化并由Kubernetes编排；理论上，在任意Kubernetes集群里都能够一键部署；系统需要变更时，仅需修改相关编排文件，即可完成改变。

对上文提到的几个Prometheus不足之处，我们进行了如下设计：

引入ELK实现日志监控，Logstash负责采集日志，日志数据被保存到Elasticsearch里，用户则可以通过Kibana查询到具体应用的日志；
基于OpenTracing实现分布式追踪，最终完成了应用拓扑关系展示，调用链查询等功能；
对Netflix Turbine进行了二次开发，将微服务框架的秒级监控纳入到系统能力集里。

多场景多维度-轻舟监控系统的实现细节

从架构上来讲，轻舟微服务监控系统在设计时考虑到有多种用户场景，并为此设计了多种模式，包括精简模式、读写优化模式及多环境模式。

图1描述了精简模式的架构，精简模式的主要特点在于部署简单，容易维护。从整体上来看，我们使用了Prometheus经典的联邦集群部署方案，处于叶子节点的Prometheus分片采集处理监控数据；处于根节点的Prometheus则直接从各个叶子节点上拉取处理后的监控数据并负责处理外部的查询请求；告警服务则定期从位于根节点的Prometheus里查询监控数据，在发现数据达到阈值时发送告警通知至对应联系人。这个模式基本上解决了微服务监控的数据分片处理、多维度及系统可靠性问题，同时ELK系统及轻舟APM服务在日志监控和分布式追踪方面进行功能补充，在规模不大的时候是能够满足用户需求的。

在精简模式下，所有的维度监控数据都保存在本地磁盘里面，当本地磁盘发生问题时，数据会有丢失的风险；同时精简模式的可靠性主要靠多个Prometheus实例执行相同的监控任务来保证，多个实例之间实际上是没有数据同步的，这使得数据有不一致的风险。为了解决上述问题，我们在读写优化模式里加入了网易自研的分布式时序数据库NTSDB，利用Prometheus的Remote Write/Read机制将监控数据存取操作实际交由NTSDB来处理。由于NTSDB自带数据同步机制，所以采用这种模式的数据安全性要高于第一种。

对于规模较大的用户而言，还会存在多个物理隔离的机房。这些机房之间通常仅能够通过网络专线通信。针对这种情况，我们设计了多环境模式，在这个模式里，每个环境的监控数据都保存在对应环境的NTSDB集群里，仅当需要进行数据查询时才会跨环境通信。这个模式在前两个模式之外，解决了微服务监控的多数据中心及多AZ问题。

维度监控是轻舟微服务监控系统的主要部分，其实现细节如下所述：

基础设施监控：就轻舟微服务平台的具体情况来看，主要指的是容器监控。轻舟微服务的容器编排系统是Kubernetes，Prometheus则原生支持Kubernetes服务发现机制，这使得我们解决了监控对象发现问题；同时Kubernetes各组件原生支持Prometheus，开源社区也提供了Node exporter、kube-state-metrics exporter及Ceph Exporter，这些组件已经能够满足全部功能需求，所以在基础设施监控上，系统完全采用了开源方案。

微服务框架监控：图4显示了这一维度监控的实现。在这一维度里，我们自研了两个组件，nsf-agent和nsf-turbine。nsf-agent主要负责从服务实例里收集并上报原始监控数据；nsf-turbine则主要负责接收nsf-agnet推送的监控数据，同时对原始监控数据进行聚合及通过暴露这些监控数据给Prometheus；Prometheus定期拉取nsf-turbine暴露的监控数据并为这些数据提供持久化及数据查询能力。另外,nsf-turbine也提供了相对简单的监控数据查询接口，用户能够通过这个接口查询到当日的实时统计数据及秒级监控数据。
应用监控：从总的结构上来讲，应用监控分为客户端、Collector及WEB服务端部分；其中客户端收集并上报应用的监控数据，这部分支持使用网易云自研的APM客户端或者开源的Zipkin及Jaeger客户端，自研的APM客户端能够以无代码侵入的方式进行数据采集，采集到的数据是满足OpenTracing规范的，各个客户端采集的监控数据将被上报到Collector里进行处理，处理后的数据将被保存到MySQL、ElasticSearch或Redis里；WEB服务端部分则负责提供标准接口给Prometheus拉取数据。

当然，在基于Prometheus实现轻舟微服务监控系统的过程里，我们也踩了一些坑，如：

Prometheus的各种计算函数都会对结果进行一定预估处理，其返回值通常都不是精确值。例如当聚合规则为获取过去一小时的监控值之和，但实际只收集到十五分钟监控数据时，这时候聚合出来的数据就是预估的值。如果需求非常精确的结果，需要通过客户端来聚合计算。
Prometheus不支持定时整点进行聚合计算，只能计算过去一段时间的值;无法获取到诸如当天零点到次日零点这种规则的聚合数据。如有类似于这种的需求，需要通过客户端直接聚合。
Prometheus预定义的计算规则、查询表达式是非常多的，而且会根据具体需求进行变动，如果不采用版本管理工具来维护，是非常容易出错的。

新的起点-我们的进展以及未来

目前轻舟微服务监控系统已经具备了下面的特性：

高可用：在精简模式里，同一份监控数据至少由两个Prometheus实例来采集；在读写优化和多环境模式里，监控数据保存在分布式时序数据库NTSDB里；任意一个Prometheus失效都不会影响到系统的整体功能。
全局立体化：系统已经集成了基础设施、微服务及应用等三个维度的监控告警；在日志监控和分布式追踪等方面也提供了相应的日志及调用链查询审计功能；这些已经基本上涵盖了微服务监控的全部功能需求。
可动态调整：在前文提到的各种部署模式里，我们对监控数据的采集和处理进行了分片。目前系统支持通过调整数据分片配置及Prometheus实例数，来满足各种规模的微服务系统的监控需求。

另外，在不远的将来，我们还会在下面几个方面持续改进轻舟微服务监控系统：

系统自监控、智能监控及分布式追踪能力强化；
结合Thanos、Druid等组件，扩充部署模式及增强聚合能力；
增强监控及告警响应速度。

通过这些优化，轻舟微服务监控系统能够更好地为企业的微服务系统保驾护航。

作者简介

王添，网易云高级服务端开发工程师，毕业于华中科技大学。毕业后一直就职于网易杭州研究院云计算技术部，主要负责网易云轻舟微服务、容器服务等研发工作，目前对微服务监控、智能告警及分布式健康检查等方向非常感兴趣。

陈咨余，网易云资深平台开发工程师，毕业于浙江大学。目前就职于网易杭州研究院云计算技术部，主要负责网易云轻舟应用性能监控以及管理、日志服务等研发工作。

相关推荐

12 月 7 日北京 ArchSummit 全球架构师峰会上，来自网易严选的技术专家邱似峰，将分享“数据驱动下的严选仓储供应链智能优化”内容，重点介绍“工程+大数据+人工智能算法”的应用。详情点击 https://bj2018.archsummit.com/schedule

【力扣每日一题】存在重复元素 II 解题思路迪小莫学AI leetcode 算法数据结构
219.存在重复元素II解题思路问题描述给定一个整数数组nums和一个整数k，要求判断数组中是否存在两个不同的索引i和j，使得：nums[i]==nums[j]且满足abs(i-j)bool:last={}fori,xinenumerate(nums):ifxinlastandabs(last[x]-i)<=k:returnTruelast[x]=ireturnFalse代码解释：last={}：
AWS简介嫣然细雨红尘路云计算云计算
AWSAWS，全称为AmazonWebServices，是亚马逊公司旗下的云计算服务平台，自2006年起向全球用户提供广泛而深入的云计算服务。AWS是全球最全面、应用最广泛的云平台之一，它从全球的数据中心提供超过200项功能齐全的服务，旨在帮助各种规模的企业、政府机构和非营利组织快速部署和管理应用程序。主要服务领域包括：弹性计算：AmazonElasticComputeCloud(EC2)提供可随
云计算中网络虚拟化的核心组件——NFV、NFVO、VIM与VNF 嫣然细雨红尘路网络服务云计算云服务云计算网络
NFVNFV（NetworkFunctionsVirtualization，网络功能虚拟化），是一种将传统电信网络中的网络节点设备功能从专用硬件中解耦并转换为软件实体的技术。通过运用虚拟化技术，NFV允许网络功能如路由器、防火墙、负载均衡器、交换机、网关等在标准的商用硬件（如x86服务器、存储和交换设备）上以软件的形式运行，而不是依赖于专用的、固定功能的硬件设备。NFV的核心价值在于：降低成本：通
Python怎么使用全局变量？怎么使用全局变量字典？许墨の小蝴蝶 python
在Python中，全局变量是指在函数外部定义的变量，它们可以在整个程序中被访问。要在一个函数内部使用或修改全局变量，你需要遵循一些规则。###定义全局变量首先，在函数外部定义一个全局变量：```pythonglobal_var=10```###在函数内部读取全局变量如果只是想在函数内部读取全局变量的值，直接使用变量名即可：```pythondefread_global():print(global
Linux 如何使用fdisk进行磁盘相关的操作孤客网络科技工作室 linux 运维服务器
简介fdisk命令是Linux中用于管理磁盘分区的强大文本实用程序。它可以创建、删除、调整大小和修改硬盘上的分区。基本语法fdisk[options]：要管理的磁盘，例如/dev/sda、/dev/nvme0n1或/dev/vda示例用法列出所有分区将显示所有可用的磁盘及其分区，包括它们的大小和文件系统fdisk-l示例输出Disk/dev/sda:500GBSectorsize(logical/
深入 UE5 第三人称游戏：目录结构全解析与代码示例阿贾克斯的黎明游戏开发 ue5 游戏
目录项目根目录：项目的基石Content目录：游戏内容的核心仓库LevelPrototyping目录StarterContent目录ThirdPerson目录Intermediate目录Saved目录其他特殊目录目录结构优化与最佳实践总结在虚幻引擎5（UE5）的开发领域中，第三人称游戏以其独特的视角和丰富的交互体验深受玩家喜爱。对于开发者而言，理解并合理运用UE5第三人称游戏的目录结构，是构建高质
致广大IT科技工作者的新春祝词自由鬼行业发展 IT应用探讨科技程序人生
亲爱的IT科技工作者朋友们：值此新春佳节来临之际，我谨向您们以及默默支持您们的家人致以最诚挚的新年祝福！过去一年中，您们凭借不懈努力与创新精神，用技术驱动各类组织不断迈向新高度。您们不仅推动了企业的业务增长，也为政府、教育机构、非营利组织等带来了深远的变革与提升。每一行代码、每一个方案，背后都是您们对技术使命的坚守；每一次迭代优化、每一个深夜调试，背后是您们对社会进步的贡献。在这个充满挑战和变革的
Python 实现定时任务的八种方案爱摸鱼的菜鸟码农 python 开发语言后端
在日常工作中，我们常常会用到需要周期性执行的任务，一种方式是采用Linux系统自带的crond结合命令行实现。另外一种方式是直接使用Python。接下里整理的是常见的Python定时任务的实现方式。目录利用whileTrue:+sleep()实现定时任务使用Timeloop库运行定时任务利用threading.Timer实现定时任务利用内置模块sched实现定时任务利用调度模块schedule实现
error: Metrics API not available 喝醉酒的小白 K8s 云原生
目录解决方案11.**确认MetricsServer是否安装**2.**安装MetricsServer**方法1：通过`kubectlapply`安装方法2：通过Helm安装3.**检查MetricsServer的运行状态**镜像问题证书问题解决方法1.**允许InsecureSkipVerify**2.**验证更新**3.**查看日志**长期解决方法1.**更新Kubelet的证书**2.**使
eVTOL的航空电子设备漫谈老猿讲编程航空航天
电动垂直起降（eVTOL），也统称为城市空中交通（UAM），是民用航空平台发展的新方向之一。随着它们在市场上成为现实，它们将对所使用的航空电子设备有其自身的要求..eVTOL概念eVTOL领域的发展才刚刚超过10年。eVTOL与其他飞机的主要区别在于电动/混合动力推进、垂直起降以及为城市空中交通/空中出租车服务设计的运行架构。要了解eVTOL所需的航空电子设备，必须将eVTOL平台作为一类空中运输
.NET MAUI 教程：入门与配置束慧可Melville
.NETMAUI教程：入门与配置项目地址:https://gitcode.com/gh_mirrors/ma/maui1.项目的目录结构及介绍在.NETMulti-platformAppUI（简称.NETMAUI）项目中，目录结构通常如下：YourProject/├──Android/│└──...//Android平台相关的代码和资源├──iOS/│└──...//iOS平台相关的代码和资源├─
强化学习很多ac架构的算法比如ppo，为什么使用状态价值网络而不使用动作价值网络实现critic呢?｜状态价值网络的优势与挑战｜Actor-Critic｜状态价值｜强化学习 concisedistinct 人工智能算法人工智能架构
目录1.强化学习的基础1.1策略与价值函数2.Actor-Critic架构概述2.1Critic的作用3.为什么选择状态价值网络？3.1训练稳定性3.2计算效率3.3高维动作空间的适应性4.使用状态价值网络的挑战4.1收敛速度4.2欠拟合风险5.解决方案与未来方向5.1改进的状态价值网络5.2结合动作价值和状态价值6.结论随着强化学习技术的不断发展，其在诸如游戏、机器人控制和金融预测等领域的应用越
APS_Schedule 我养的小猫 Python python
前言大家应该都知道在编程语言中，定时任务是常用的一种调度形式，在Python中也涌现了非常多的调度模块，本文将简要介绍APScheduler的基本使用方法。一、APScheduler介绍APScheduler是基于Quartz的一个python定时任务框架，实现了Quartz的所有功能，使用起来十分方便。提供了基于日期、固定时间间隔以及crontab类型的任务，并且可以持久化任务。APSchedu
日志2025.1.28 science怪兽 unity 游戏程序算法
日志2025.1.281.实现了霰弹枪射击//霰弹枪射击privatevoidShotgunShoot(){for(inti=0;i();_transposer=_cam.GetCinemachineComponent();}//改变相机的距离publicvoidChangeCameraDistance(floatdistance){_transposer.m_CameraDistance=dis
美国金融历史 .NET跨平台投资理财金融
美国金融历史可以追溯到其建国之初，随着时间的推移，金融体系逐步演变并对世界经济产生了重要影响。以下是美国金融历史的一个详细概述：1.早期金融体系(18世纪末-19世纪初)在美国独立战争后的初期，国家的财政状况并不稳定。新成立的美国政府面临大量的债务问题，尤其是来自革命战争期间的借款。为了管理这些债务，并促使经济发展，美国需要建立一个强大的金融体系。中央银行的诞生第一银行：1791年，乔治·华盛顿总
创建MAUI .NET 应用程序的详细教程 Tnp____ .net .NET
MAUI（多平台应用程序用户界面）是一个用于创建跨平台应用程序的开发框架。它是基于.NET平台的最新技术，可以让开发人员使用一个共享的代码库构建并运行在多个操作系统上的应用程序，如Android、iOS、Windows等。本文将详细介绍如何创建一个基于MAUI.NET的应用程序，并提供相应的源代码。步骤1：安装开发环境和工具首先，确保你的系统中已经安装了以下工具：.NET6SDK：前往Micros
SSM框架探秘：Spring 整合 Mybatis 框架苏-言 mybatis spring java
搭建和测试MyBatis的环境：编写AccountMapper.xml映射配置文件：select*fromaccount;在web项目中编写SqlMapConfig.xml的配置文件，编写核心配置文件在AccountMapper接口中编写方法：publicinterfaceAccountMapper{publicListfindAll();}编写测试方法(此时数据库还没有数据)：@Testpubl
度量年报中MD&A部分的信息含量的Python代码 Xiaorui~ 文本分析会计学 python pandas 开发语言
研究需求：度量年报中管理层讨论与分析部分的信息含量的代码，环境为python3，可更改年报的选取时间。代码实现：首先，需要安装tika和pandas库，tika用于解析PDF文件，pandas用于数据处理。可以使用以下命令进行安装：!pipinstalltika!pipinstallpandas然后，需要下载年报的PDF文件，并将其放置在指定路径下。接下来，可以使用以下代码对管理层讨论与分析部分进
MyBatis最佳实践:注解开发苏-言 mybatis java spring
注解：@Insert：添加@Update：修改@Delete：删除@Select：查询@Result：实现结果集封装@Results：可以和@Reslult一起使用，封装多个结果集@One：实现一对一和多对一的结果集封装@Many：实现一对多结果集封装MyBatis注解不能实现动态SQL使用：SqlMapConfig.xml配置文件编写注解：增删改查：@Select("select*fromuse
MyBatis最佳实践：提升数据库交互效率的秘密武器苏-言 mybatis 数据库
第一章：框架的概述：MyBatis框架的概述：MyBatis是一个优秀的基于Java的持久框架，内部对JDBC做了封装，使开发者只需要关注SQL语句，而不关注JDBC的代码，使开发变得更加的简单MyBatis通过XML或者注解的方式将要执行的各种Statement对象配置起来，通过Java对象和statement中SQL后，最终将结果已Java对象返回MyBatis采用了ORM的思想ORM思想：在
万字长文 | 面向k8s编程，如何写一个Operator 新钛云服 kubernetes python java 大数据 docker
新钛云服已为您服务1489天概述随着我们对Kubernetes的逐步了解，可能就会发现Kubernetes中内置的对象定义，比如Deployment、StatefulSet、ConfigMap，可能已经不能满足我们的需求。我们希望在Kubernetes定义一些自己的对象，一是可以通过kube-apiserver提供统一的访问入口，二是可以像其他内置对象一样，通过kubectl命令管理这些自定义的对
【Golang 面试题】每日 3 题（四十四） Pandaconda #Golang 面试专栏 golang 开发语言后端面试笔记
✍个人博客：Pandaconda-CSDN博客专栏地址：http://t.csdnimg.cn/UWz06专栏简介：在这个专栏中，我将会分享Golang面试中常见的面试题给大家~❤️如果有收获的话，欢迎点赞收藏，您的支持就是我创作的最大动力130.goroutine阻塞、唤醒和退出状态阻塞channel的读写操作、等待锁、等待网络数据、系统调用等都有可能发生阻塞，会调用底层函数runtime.go
技术速递｜.NET 9 Preview 6 现已推出！微软Reactor .net c#
作者：.NETTeam排版：AlanWang现在是了解最新.NET9预览版的好时机！我们刚刚发布了第六个预览版，在之前预览版的基础上添加了一些很棒的功能，并对.NETRuntime、SDK、库、C#和框架（包括ASP.NETCore、Blazor和.NETMAUI）进行了重大改进。请查看下面链接的完整发行说明并立即开始使用。下载.NET9Preview6此版本包含以下改进：库对System.Num
python 定时任务框架 assless python 自动化相关 python 定时任务 APSchedule 自动化测试
python定时任务框架如果想实现自定义定时任务框架，可以看看下面转载的文章写的很详细传送门=>APScheduler定时框架
6.《DevOps》系列K8S部署CICD流水线之K8S通过Yaml部署动态Jenkins-slave,以及Jenkins平台基于Gitlab实现SSO授权认证洋葱_学习过程 devops kubernetes jenkins
架构服务器IP服务名称硬件配置192.168.1.100k8s-master8核、16G、120G192.168.1.101k8s-node18核、16G、120G192.168.1.102k8s-node28核、16G、120G192.168.1.103nfs2核、4G、500G操作系统：Rocky9.3jenkins版本：2.477原理JenkinsMaster接到构建任务后会动态在集群中的一
（基础）Python实现定时任务的八种方案详解程序员-不秃头的阿焕 python 开发语言后端
在日常工作中，我们常常会用到需要周期性执行的任务，我们可以用Python直接实现这一功能。今天我们来学习一下这些基本的操作，有需要了解更多关于python相关知识的，免费领取资源的，请点击这个链接。目录利用whileTrue:+sleep()实现定时任务使用Timeloop库运行定时任务利用threading.Timer实现定时任务利用内置模块sched实现定时任务利用调度模块schedule实现
强化学习中，为什么用AC架构资源存储库算法强化学习算法
目录强化学习中，为什么用AC架构为什么用AC架构？AC架构的工作原理AC架构的优缺点优点：缺点：相关算法：基于AC架构的算法总结强化学习中，为什么用AC架构在强化学习（ReinforcementLearning,RL）中，AC架构（即Actor-Critic架构）是一种非常常用的架构，用于训练智能体（Agent）在环境中执行任务。AC架构结合了策略梯度方法和价值迭代方法，通过分离策略和价值函数的估
发布 VectorTraits v3.1（支持 .NET 9.0，支持原生AOT） zyl910 VectorTraits .net c#SIMD
文章目录发布VectorTraitsv3.1（支持.NET9.0，支持原生AOT）支持.NET9.0中断性变更支持原生AOT原生AOT的范例使用IlcInstructionSet参数TraitsOutput类增加IsDynamicCodeCompiled/IsDynamicCodeSupported信息的输出为了支持原生AOT,将ReflectionUtil等类的所有Type集合,修改为Wrapp
MyMvvmMaster：Android应用开发的MVVM架构解决方案不胖的羊
本文还有配套的精品资源，点击获取简介：MyMvvmMaster.zip是一个集成MVVM架构、RxJava2、Retrofit和ARouter的Android应用框架压缩包，旨在简化开发流程，增强代码的可读性和可维护性。本框架通过DataBinding库实现数据和UI的双向绑定，利用RxJava2优化异步编程，Retrofit简化网络请求处理，ARouter管理模块间路由，从而提供一个高效、模块化
mysql的测试方案蚂蚁质量 mysql 数据库
1.测试目标与范围1.1性能测试目标MySQL性能测试旨在评估数据库在不同负载条件下的响应速度、吞吐量和资源利用率，确保其能够满足业务需求。响应时间：衡量查询和事务处理的延迟，目标是将平均响应时间控制在100毫秒以内，95%的查询响应时间不超过200毫秒。吞吐量：通过QPS（每秒查询次数）和TPS（每秒事务数）评估数据库的处理能力，目标是在高并发场景下达到QPS10000+、TPS5000+。资源
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C