云布道师

阿里云技术专家张城：SLS可观测与AIOps的整体架构

2022 年 1 月 14 日，第六期阿里云用户组 AUG 活动在北京举行。现场，阿里云技术专家张城详细阐述了什么是可观测，并讲解了 SLS 可观测与 AIOps 的整体架构。本文根据演讲内容整理而成。

云原生可观测融合分析

电器工程的可观测性

首先，什么叫做可观测，可观测性这个概念最早出现于 20 世纪 70 年代的电气工程，核心的定义是：

A system is said to be observable if, for any possible evolution of state and control vectors, the current state can be estimated using only the information from outputs.

相比传统的告警、监控，可观测性能够以更加“白盒”的方式看透整个复杂的系统，帮助我们更好地观察系统的运行状况，快速定位和解决问题。就像发动机而言，告警只是告诉你发动机是否有问题，而一些包含转速、温度、压力的仪表盘能够帮我们大致确定是哪个部分可能有问题，而真正定位细节问题还需要观察每个部件的传感器数据才行。

电器化时代可观测发展背景
电气化时代起源于19 世纪70年代的第二次工业革命（Second Industrial Revolution），主要的标志是电力、内燃机的广泛应用。而可观测性这一概念为何在近 100 年后才会被提出？难道在此之前就不需要依赖各类传感器的输出定位和排查故障？显然不是，排查故障的方式一直都在，只是整个系统和情况更加复杂，所以才需要更加体系化、系统化的方式来支持这一过程，因此演化出来可观测性这个概念。所以核心点在于：

系统更加的复杂：以前的汽车只需要一个发动机、传送带、车辆、刹车就可以跑起来，现在汽车上至少有上百个部件和系统，故障的定位难度变得更大。
开发涉及更多的人：随着全球化时代的到来，公司的分工也越来越细，意味着系统的开发和维护需要更多的部门和人来共同完成，协调的代价越来越大。
运行环境多种多样：不同运行环境下，每个系统的工作情况是变化的，我们需要在任何阶段都能有效记录好系统的状态，便于我们分析问题、优化产品。

IT系统的可观测性

IT 系统经过几十年的飞速发展，整个开发模式、系统架构、部署模式、基础设施等也都经过了好几轮的优化，优化带来了更快的开发、部署效率，但随之而来整个系统也变得更加复杂、开发需要依赖更多的人和部门、部署模式和运行环境也更加动态和不确定，因此 IT 行业已经到了需要更加系统化、体系化进行观测的这一阶段。

IT 系统的可观测性实施起来其实和电气工程比较类似，核心还是观察我们各个系统、应用的输出，通过数据来判断整体的工作状态。通常我们会把这些输出进行分类，总结为 Traces、Metrics、Logs。关于这三种数据的特点、应用场景以及关系等，会在后面进行详细展开。

自动驾驶

电气工程的可观测由于有深厚的发展历史，可以在实践中给到我们非常多的支持，自动驾驶也是如此。自动驾驶从刚开始的定速巡航、自适应巡航开始，已经发展了几十年，目前对于自动驾驶也有一些可以在实际道路中应用的场景。电器领域的一个集大成者，就是自动驾驶。现在真正可能让自动驾驶落地的，也就是特斯拉最早开创的一套新的架构。

我们可以回过头来去看，特斯拉为什么和传统自动驾驶厂商不同，我觉得主要有以下几点：

丰富的数据源：汽车外围遍布多个激光/图像雷达，能够实现高帧率、360°实时观测周围的物体及其状态；内部则能够实时知道当前的车速、车轮角度、胎压等信息，做到知彼知己。
数据集中化：相对辅助驾驶能力，自动驾驶的一个核心突破是能够将车内外的所有数据集中到一起去处理，真正发挥出数据的价值，而不是每个模块的数据作为孤岛进行独立运作。
强大算力：集中化的数据也意味着数据量的急剧膨胀，无论哪家自动驾驶背后都有强大的芯片支撑，只有足够的算力才能保证在最短的时间内可以进行足够的计算。
软件迭代：算力+算法构成了智能化的最终目标，然而算法不可能完美无瑕，会根据逐渐积累的自动驾驶数据不断进行算法的升级，从而使软件系统能够不断升级以获得更佳的自动驾驶效果。

自动驾驶与 AIOps 分级

我们团队从 2009 年做飞天 5K 项目起，就一直在负责监控、日志、分布式链路追踪等可观察性相关的工作，中间经历过小型机到分布式系统再到微服务、云化的一些架构变更，相关的可观察性方案也经历了很多演变。我们觉得整体上可观察性相关的发展和自动驾驶等级的设定非常吻合。

自动驾驶一共分为 6 级，其中 0-2 级主要还是靠人来进行决定，到了等级 3 之后就可以进行无意识驾驶，也就是手眼可以暂时性不用关注驾驶，到了等级 5 的话人就可以完全脱离驾驶这个枯燥的工作，在车上可以自由活动。

在 IT 系统的可观察性上，也可以类似划分为 6 级：

等级0：手工分析，依靠基础的 Dashboard、告警、日志查询、分布式链路追踪等方式进行手动告警、分析，也是目前绝大部分公司使用的场景。
等级1：智能告警，能够自动去扫描所有的可观察性数据，利用机器学习的方式去识别一些异常并进行自动告警，免去人工设置/调整各种基线告警的工作。
等级2：异常关联+统一视图，对于自动识别的异常，能够进行上下文的关联，形成一个统一的业务视图，便于快速地定位问题。
等级3：根因分析+问题自愈，自动根据异常以及系统的 CMDB 信息直接定位问题的根因，根因定位准确后可以去做问题的自愈。这一阶段相当于是一次质的飞跃，在某些场景下可以在人不用参与的情况下实现问题的自愈。
等级4：故障预测，故障发生总会有损失，所以最好的情况是避免故障的发生，因此故障预测技术可以更好地保证系统的可靠性，利用之前积累的一些故障先兆信息做到“未卜先知”。
等级5：变更影响预测，我们知道绝大部分的故障都是由变更引起的，因此如果能够模拟出每个变更对系统带来的影响以及可能产生的问题，我们就能够提前评估出是否能够允许此次变更。

可观测性与智能运维落地

可观测性方案落地上，现阶段可能无法做出一个适用于各个行业属性的可观测引擎，更多是专注于 DevOps 和通用的公司商业方面。这里面的两个核心工作是：

数据覆盖面足够全：能够包括各类不同场景、不同类型的数据，除了狭义的日志、监控、Trace 外，还需要包括我们的 CMDB、变更数据、客户信息、订单/交易信息、网络流、API 调用等；
数据关联与统一分析：数据价值的发掘不是简单通过一种数据来实现，更多时候我们需要利用多种数据关联来达到目的，例如结合用户的信息表以及访问日志，我们可以分析不同年龄段、性别的用户的行为特点，针对性地进行推荐；通过登录日志、CMDB 等，结合规则引擎，来实现安全类的攻击检测。

从整个流程来看，我们可以将可观测性的工作划分为 4 个组成部分：

传感器：获取数据的前提是要有足够的传感器来产生数据，这些传感器在 IT 领域的形态有：SDK、埋点、外部探针等。
数据：传感器产生数据后，我们需要有足够的能力去获取、收集各种类型的数据，并把这些数据归类分析。
算力：可观测场景的核心是需要覆盖足够多的数据，数据一定是海量的，因此系统需要有足够的算力来计算和分析这些数据。
算法：可观测场景的终极应用是数据的价值发掘，因此需要使用到各类算法，包括一些基础的数值类算法、各种 AIOps
相关的算法以及这些算法的组合。

SLS 可观测与 AIOps 整体架构

基于上述我们的一些思考，回归到可观测这个问题的本质，我们目标的可观测性方案需要能够满足以下几点：

数据全面覆盖：包括各类的可观测数据以及支持从各个端、系统中采集数据；
统一的系统：拒绝割裂，能够在一个系统中支持 Traces、Metrics、Logs 的统一存储与分析；
数据可关联：每种数据内部可以互相关联，也支持跨数据类型的关联，能够用一套分析语言把各类数据进行融合分析；
足够的算力：分布式、可扩展，面对 PB 级的数据，也能有足够的算力去分析；
灵活智能的算法：除了基础的算法外，还应包括 AIOps 相关的异常检测、预测类的算法，并且支持对这些算法进行编排。

可观测数据引擎的整体架构如下图所示，从下到上的四层也基本符合方案落地的指导思想：传感器+数据+算力+算法。

传感器：数据源以 OpenTelemetry 为核心，并且支持各类数据形态、设备/端、数据格式的采集，覆盖面足够的“广”；
数据+算力：采集上来的数据，首先会进入到我们的管道系统（类似于Kafka），根据不同的数据类型构建不同的索引，目前每天我们的平台会有几十 PB 的新数据写入并存储。除了常见的查询和分析能力外，我们还内置了 ETL 的功能，负责对数据进行清洗和格式化，同时支持对接外部的流计算和离线计算系统；
算法：除了基础的数值算法外，目前我们支持了十多种的异常检测/预测算法，并且还支持流式异常检测；同时也支持使用 Scheduled SQL 进行数据的编排，帮助我们产生更多新的数据；
价值发掘：价值发掘过程主要通过可视化、告警、交互式分析等人机交互来实现，同时也提供了 OpenAPI 来对接外部系统或者供用户来实现一些自定义的功能。

可观测融合分析引擎

下面讲一下我们说的那个引擎，为什么 SLS 要做一个可观测的引擎呢？

如果把存储引擎比喻成新鲜的食材，那分析引擎就是处理这些食材的刀具，针对不同类型的食材，用不同种类的刀来处理才能得到最好的效果，例如蔬菜用切片刀、排骨用斩骨刀、水果用削皮刀等。同样，针对不同类型的可观测数据和场景，也有对应适合的分析方式：

Metrics：通常用于告警和图形化展示，一般直接获取或者辅以简单的计算，例如 PromQL、TSQL 等。
Traces/Logs：最简单直接的方式是关键词的查询，包括 TraceID 查询也只是关键词查询的特例。
数据分析(一般针对 Traces、Logs)：通常 Traces、Logs
还会用于数据分析和挖掘，所以要使用图灵完备的语言，一般程序员接受最广的是 SQL。

上述的分析方式都有对应的适用场景，我们很难用一种语法/语言去实现所有的功能并且具有非常好的便捷性（虽然通过扩展 SQL 可以实现类似 PromQL、关键词查询的能力，但是写一个简单的 PromQL 算子可能要用一大串 SQL 才能实现），因此我们的分析引擎选择去兼容关键词查询、PromQL 的语法。同时为了便于将各类可观测数据进行关联起来，我们在 SQL 的基础上，实现了可以连接关键词查询、PromQL、外部的 DB、ML 模型的能力，让 SQL 成为顶层分析语言，实现可观测数据的融合分析能力。

融合分析能力示例

下面举几个我们查询/分析的应用示例，前面 3 个相对比较简单，可以用纯粹的关键词查询、PromQL，也可以结合 SQL 一起使用。最后1个展示了实际场景中进行融合分析的例子：

背景：线上发现有支付失败的错误，需要分析这些出现支付失败错误的机器 CPU 指标有没有问题

实现

首先查询机器的 CPU 指标
关联机器的 Region 信息（需要排查是否某个 Region 出现问题）
和日志中出现支付失败的机器进行 Join，只关心这些机器
最后应用时序异常检测算法来快速分析这些机器的 CPU 指标
最后的结果使用线图进行可视化，结果展示更加直观

上述的例子同时查询了 LogStore、MetricStore，而且关联 CMDB 以及 ML 模型，一个语句实现了非常复杂的分析效果，在实际的场景中还是经常出现的，尤其是分析一些比较复杂的应用和异常。

数据编排-价值挖掘

可观测性相比传统监控，更多还是在于数据价值的发掘能力更强，能够仅通过输出来推断系统的运行状态，和数据挖掘这个工作比较像，收集各类繁杂的数据、格式化、预处理、分析、检验，最后根据得到的结论去“讲故事”。

因此，在可观测性引擎的建设上，我们非常关注数据编排的能力，能够让数据流转起来，从茫茫的原始日志中不断地提取出价值更高的数据，最终告诉我们系统是否在工作以及为什么不工作。为了让数据能够“流转”起来，我们开发了几个功能：

数据加工：也就是大数据 ETL（extract, transform, and load）中T的功能，能够帮我们把非结构化、半结构化的数据处理成结构化的数据，更加容易分析。
Scheduled SQL：顾名思义，就是定期运行的 SQL，核心思想是把庞大的数据精简化，更加利于查询，例如通过 AccessLog 每分钟定期计算网站的访问请求、按 APP、Region 粒度聚合 CPU、内存指标、定期计算 Trace 拓扑等。
AIOps 巡检：针对时序数据特别开发的基于时序异常算法的巡检能力，用机器和算力帮我们去检查到底是哪个指标的哪个维度出现问题。

基于编排的故障自动定位

可观测性的前期阶段，很多工作都需要人工来完成，我们最希望的还是能有一套自动化的系统，在出现问题的时候能够基于这些观测的数据自动进行异常诊断，得到一个可靠的根因并能够根据根因进行自动的 Fix。现阶段，自动异常恢复很难做到，但根因的定位通过一定的算法和编排手段还是可以实施的。

上图是一个典型的 IT 系统架构的观测抽象，每个 APP 都会有自己的黄金指标、业务的访问日志/错误日志、基础监控指标、调用中间件的指标、关联的中间件自身指标/日志，同时通过 Trace 还可以得到上下游 APP/服务的依赖关系。通过这些数据再结合一些算法和编排手段就可以进行一定程度的自动化根因分析了。这里核心依赖的几点如下：

关联关系：通过 Trace 可以计算出 APP/服务之间的依赖关系；通过 CMDB 信息可以得到 APP 和 PaaS、IaaS 之间的依赖关系。通过关联关系就可以“顺藤摸瓜”，找到出现问题的原因。
时序异常检测算法：自动检测某一条、某组曲线是否有异常，包括 ARMA、KSigma、Time2Graph 等，详细的算法可以参考：异常检测算法、流式异常检测。
日志聚类分析：将相似度高的日志聚合，提取共同的日志模式（Pattern），快速掌握日志全貌，同时利用 Pattern 的对比功能，对比正常/异常时间段的 Pattern，快速找到日志中的异常。

时序、日志的异常分析能够帮我们确定某个组件是否存在问题，而关联关系能够让我们“顺藤摸瓜”，通过这三个核心功能的组合就可以编排出一个异常的根因分析系统。基于上文中的图做一个简单的示例：首先从告警开始分析入口的黄金指标，随后分析服务本身的数据、依赖的中间件指标、应用 Pod/虚拟机指标，通过 Trace Dependency 可以递归分析下游依赖是否出现问题，其中还可以关联一些变更信息，以便快速定位是否由于变更引起的异常。最终发现的异常事件集中到时间轴上进行推导，也可以由运维/开发来最终确定根因。

智能运维体系构建

目前，SLS 智能运维体系主要包括两个部分，一个是基础的算法能力，帮助我们找到一些异常事件，还有就是根因分析能力，能够基于 CMDB、Config 以及一些异常事件，找出问题的根因。

基础能力

基础的算法能力就不过多介绍，在 SLS 的官网文档以及平时的技术分享中都有一些介绍，感兴趣的可以移步详细查看：算法概述、异常检测算法、流式异常检测、日志聚类分析、模式分析。

根因分析

之所以把根因分析单独提出来，主要是因为根因分析和普通算法相比，需要依赖更多的数据，相应的复杂度会高很多，尤其是想要开发一个通用的根因算法。目前，根因分析我们一直在跟进中，争取早日发布一款能够适用于多数场景中的根因算法。

总结

可观测性这一概念并不是直接发明的“黑科技”，而是我们从监控、问题排查、预防等工作中逐渐“演化”出来的词。同样我们一开始只是做日志引擎（阿里云上的产品-日志服务），随后才逐渐优化、升级为可观测性的引擎。对于“可观测性”我们要抛开概念/名词本身来发现它的本质，而这个本质往往是和商业（Business）相关，例如：

让系统更加稳定，用户体验更好
观察 IT 支出，消除不合理的使用，节省更多的成本
观察交易行为，找到刷单/作弊，及时止损
利用 AIOps 等自动化手段发现问题，节省更多的人力，运维提效

而我们对于可观测性引擎的研发，主要关注的也是如何服务更多的部门/公司进行可观测性方案的快速、有效实施，包括引擎中的传感器、数据、计算、算法等工作一直在不断进行演进和迭代，例如更加便捷的 eBPF 采集、更高压缩率的数据压缩算法、性能更高的并行计算、召回率更低的根因分析算法等。我们会持续为大家输出可观测性引擎相关的工作内容，敬请期待。（正文完）

阿里云技术专家张城：SLS可观测与AIOps的整体架构

一文掌握oracle19c之离线情况下命令行安装和建库（上）运维家
声明：本文乃“运维家”原创，转载请注明出处，更多内容请关注公众号“运维家”。主旨oracle作为主流数据库之一，身为IT人员，怎么能不会搭建呢？我不允许哈，下来看看如何一步一步的搭建起来吧。建议收藏，不然一会儿就找不见了，哈哈哈。环境linux环境oracle软件根目录下磁盘空间最少4G软件下载官网下载太慢，而且需要注册，这里直接从公众号“运维家”后台回复“oracle”即可获取软件包，即取即用。
运维技术干货 — 不仅是 Linux 运维最佳实践 python算法小白 Linux
附Java/C/C++/机器学习/算法与数据结构/前端/安卓/Python/程序员必读书籍书单大全：书单导航页（点击右侧极客侠栈即可打开个人博客）：极客侠栈①【Java】学习之路吐血整理技术书从入门到进阶最全50+本（珍藏版)②【算法数据结构+acm】从入门到进阶吐血整理书单50+本（珍藏版)③【数据库】从入门到进阶必读18本技术书籍网盘吐血整理网盘(珍藏版)④【Web前端】从HTML到JS到AJ
Spring Boot整合阿里云OSS企业级实践：高可用文件存储解决方案努力的小郑 Spring spring boot 阿里云后端
在云原生时代，文件存储已成为现代应用的刚需。阿里云对象存储OSS作为国内市场份额第一的云存储服务，为开发者提供了安全可靠、高扩展的存储解决方案。本文将深入探讨SpringBoot整合OSS的最佳实践。为什么选择阿里云OSS？阿里云OSS在以下场景中展现显著优势：海量数据存储：单Bucket支持EB级存储，轻松应对业务增长高并发访问：支持百万级QPS，满足电商大促等高并发场景成本优化：存储费用低至0
2023阿里云服务器优惠折扣及券后价格表分享阿里云最新优惠和活动汇总
2023年阿里云对新老用户购买云服务器都有一定的折扣，特别是新用户的首次购买订单有较大的折扣，阿里云会不定期的推出新的优惠活动，以供用户优惠购买到自己想买的云服务器，以下是2023阿里云服务器优惠折扣及券后价格表。一、新用户可购买的国内地域云服务器优惠折扣及券后价格表购买地址：阿里云新人福利活动云服务器实例配置带宽系统盘容量折扣活动价格可使用满减优惠券金额券后价格参考共享型s61核1G1M-5M4
项目快速上手指南：8 大核心切入点 weixin_43391139 技术工程化架构设计模式学习方法
一、文档体系速览需求层产品需求文档（PRD）：明确业务目标、用户故事和功能边界非功能需求：性能指标、安全要求、合规标准设计层架构图：系统分层、技术栈选型、核心组件交互ER图与数据字典：表结构关系、字段约束、业务术语定义API文档：接口规范、请求示例、错误码说明操作层用户手册：功能导航、操作流程、常见问题管理后台指南：权限配置、运维操作、数据报表二、代码库解构路径全局视野目录范式：MVC/DDD分层
操作系统精髓与设计原理第六版习题全解莱财一哥
本文还有配套的精品资源，点击获取简介：操作系统作为计算机科学的基础，其核心功能包括管理硬件资源和提供用户服务。《操作系统精髓与设计原理》第六版详细阐述了操作系统的各种核心概念、设计策略和实现技术，并提供了课后习题答案，以帮助读者深入理解并掌握这些知识点。本资料覆盖了进程管理、内存管理、文件系统、设备管理、死锁、安全与保护、分布式系统、实时系统、虚拟化技术和云计算与容器等关键领域。1.操作系统基础知
掌握未来云原生：Kamaji Kubernetes 控制平面管理器白羿锟
掌握未来云原生：KamajiKubernetes控制平面管理器项目简介在Kubernetes的世界里，我们迎来了Kamaji——一款创新的Kubernetes控制平面管理器。这个项目基于托管控制平面的理念，将Kubernetes控制面组件运行在Pod中，而不是独立的物理或虚拟机上。通过这种方式，Kamaji使大规模集群管理和扩展变得更为高效且降低了运维负担。Kamaji就像一支全天候工作的Site
运维老司机私藏的Docker命令清单，建议收藏！飞乐鸟干货 docker
Docker常用命令无论是开发、测试还是运维，Docker已成为现代技术栈的标配。面对众多命令，整理了最实用的Docker命令清单，覆盖90%日常使用场景，助你快速成为容器化高手！镜像管理镜像构建//-t指定镜像名称和标签、构建上下文环境（包含Dockerfile的目录）dockerbuild-tmyapp:1.0. //指定Dockerfile路径dockerbuild-f./dockerfil
阿里云产品介绍
阿里云产品相关计算：云服务器ECS、云虚拟机、GPU云服务器网络：负载均衡SLB、弹性公网IP、专有网络VPC、CDN（CDN通过将内容缓存到全球分布的多个边缘节点（EdgeNodes）上，使用户可以从离自己最近的节点获取内容，从而减少网络延迟，提升访问速度）存储：块存储EBS（ElasticBlockStorage）、对象存储OSS（ObjectStorageService）、文件存储NAS数据
探索阿里云DMS：解锁高效数据管理新姿势云资源服务商 oracle 数据库阿里云云计算
一、阿里云DMS是什么阿里云DMS，全称为DataManagementService，即数据管理服务，是一种集数据管理、结构管理、安全管理于一体的全面数据库服务平台。它能够有效地支持各类数据库产品，包括但不限于MySQL、SQLServer、PostgreSQL、PPAS、DRDS、OceanBase、MongoDB、Redis等，对用户的数据库进行全方位的维护和管理，提供了一站式的数据库解决方案
阿里云 RabbitMQ 可观测性最佳实践观测云阿里云 rabbitmq 云计算
阿里云RabbitMQ阿里云RabbitMQ是一款高性能、高可靠的消息中间件，支持多种消息协议和丰富的功能特性。它提供消息队列功能，能够实现应用间的消息解耦和异步通信，提升系统扩展性和稳定性。其支持多种消息持久化策略，确保消息不丢失；具备灵活的路由和负载均衡能力，可高效分发消息；还提供丰富的管理功能，如队列监控、消息追踪和权限管理等，帮助用户轻松管理和优化消息队列，广泛应用于分布式系统、微服务架构
2025阿里云黑洞自救指南：从分钟级恢复到长效免疫的实战方案
一次未防护的DDoS攻击，可致业务停摆72小时，损失超千万！2025年，随着AI驱动的DDoS攻击工具泛滥及僵尸网络商业化，阿里云服务器被拉入黑洞的案例激增300%。当攻击流量超过实例阈值（5Gbps-300Gbps）时，阿里云会强制屏蔽IP公网访问——这不是惩罚，而是保全云平台整体的“断臂求生”。本文将提供一套经过头部企业验证的应急方案，涵盖从5分钟快速恢复到构建免疫体系的全流程。一、2025黑
2025年华为认证之HCIE-云计算方向的报考流程
一、先搞明白：HCIE-云计算认证到底是啥？HCIE-云计算（华为认证ICT专家-云计算）是华为体系里云计算领域的顶级认证，说白了，就是证明你有能力搞定大型企业的云平台设计、部署和运维。现在政企、金融这些行业上云需求猛增，招人的时候，这证书经常是“加分项”甚至“硬门槛”。但这证不好拿，得闯两关：笔试和实验考试。从报名到拿证，流程说复杂也复杂，说简单也简单，关键是每个环节都得踩对节奏，不然容易走弯路
Kubernetes 集群简介部署搭建及常用命令 GHY@CloudGuardian Kubernetes kubernetes 容器云原生运维 linux
Kubernetes集群简介Kubernetes（简称K8s）是一个开源的容器编排平台，用于自动化容器化应用的部署、扩展和管理。它为容器提供了一个完整的管理框架，帮助开发者和运维团队在大规模环境中高效地部署和管理应用。Kubernetes集群是由多个组件组成的，主要包括控制平面和工作节点。集群的核心目的是确保容器化应用的高可用性、可扩展性、负载均衡、自动化部署等功能。Kubernetes集群的基本
【云原生】Helm来管理Kubernetes集群的详细使用方法与综合应用实战景天科技苑云原生K8S 零基础到进阶实战云原生 kubernetes 容器 Helm k8s k8s集群
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，前后端开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flask等框架，云原生k8s，linux，she
DDD核心知识解析我是廖志伟 Java场景面试宝典 DDD Domain-Driven Design Software Architecture
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
ShardingSphere详解我是廖志伟 Java场景面试宝典 ShardingSphere Distributed Database Middleware
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
微服务架构核心技术我是廖志伟 Java场景面试宝典 Service Governance Microservices Distributed Systems
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
Spring MVC 技术解析我是廖志伟 Java场景面试宝典 Spring MVC Java Web MVC Design Pattern
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
领域驱动设计核心解析
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
Spring技术全解析我是廖志伟 Java场景面试宝典 Spring Framework IoC Container AOP
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
并发编程核心技术我是廖志伟 Java场景面试宝典 Concurrency Java Multithreading
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
ShardingSphere技术解析
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
并发编程与MyBatis核心解析我是廖志伟 Java场景面试宝典 Concurrent Programming Java MyBatis
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
互联网大厂java求职者面试我是廖志伟 Java场景面试宝典 java 八股文面试求职 Java
我是廖志伟，一名Java开发工程师，清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、SpringBoot、SpringMVC、SpringCloud、Mybatis、Dubbo、Z
k8s学习 — （运维）第九章 Helm 包管理器 2401_83740189 2024年程序员学习运维 linux 面试
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获取！一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！config包含了可以合并到打包的chart中的
详解Linux(Ubuntu/RedHat/CentOS)及国产服务器统一加域管理方案
本期内容将通过一个实际案例讲清楚数据中心服务器身份认证场景的痛点及宁盾身份域管在其中的作用和价值。很多行业，像金融、运营商，还有那些关系国计民生的服务单位，均会受到监管制度统一要求，对数据中心的服务器执行定期修改口令、统一身份认证和MFA多因素认证。另外，等保、密评同样要求对服务器运维进行安全管控。但一般数据中心服务器规模较大，存在各种管理乱象，如：1.各种Linux，如Ubuntu、Redhat
K8S的Helm包管理器程序员Rocky 运维 DevOps k8s kubernetes docker 容器 helm helm安装包
一、背景官网:https://helm.sh/我们针对K8S环境中，部署对应的应用，无外乎就是编写一堆yaml资源清单文件.资源清单、依赖性少的时候，可以直接手动维护。但是，随着资源清单越来越复杂，越来越多，不同的环境切换不同的资源清单配置，如果还是手动维护，那将会是一场运维灾难。没有Helm之前的问题:1、手动管理YAML文件：需要手动编写和维护大量YAML文件，容易出错2、缺乏标准化：各团队有
ShardingSphere 架构解析我是廖志伟 Java场景面试宝典 Database Distributed Systems ShardingSphere
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
Java零基础-三维数组详解！喵手零基础学Java java 开发语言
哈喽，各位小伙伴们，你们好呀，我是喵手。运营社区：C站/掘金/腾讯云/阿里云/华为云/51CTO；欢迎大家常来逛逛今天我要给大家分享一些自己日常学习到的一些知识点，并以文字的形式跟大家一起交流，互相学习，一个人虽可以走的更快，但一群人可以走的更远。我是一名后端开发爱好者，工作日常接触到最多的就是Java语言啦，所以我都尽量抽业余时间把自己所学到所会的，通过文章的形式进行输出，希望以这种方式
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite

阿里云技术专家张城：SLS可观测与AIOps的整体架构

云原生可观测融合分析

智能运维体系构建

总结

你可能感兴趣的:(阿里云,运维,云计算)