岁月的眸

Ambari架构源码解析【转载】

Ambari架构源码解析

1. Ambari介绍

Apache Ambari是一种基于Web的工具，支持Apache Hadoop集群的供应、管理和监控。Ambari已支持大多数Hadoop组件，包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeeper、Sqoop和Hcatalog等。

1.1 基本概念

1. Resource：Ambari把可以被管理的资源的抽象为一个Resource实例，资源可以包括服务、组件、主机节点等，一个resource实例中包含了一系列该资源的属性；
2. Property：服务组件的指标名称；
**3. ResourceProvider和PropertyProvider：**分别对应Resource和Property的提供方，获取指标需要先获取Resource，然后获取Property对应的metric；
**4. Query：**Query是Resource的内部对象，代表了对该资源的操作；
**5. Request：**一个Request代表了对Resource的操作请求，包含http信息及要操作的Resource的实例，Request按照http的请求方式分为四种：GET、PUT、DELETE、POST；
**6. Predicate：**一个Predicate代表了一系列表达式，如and、or等；

1.2 基本组件

Ambari 可以分为 5个大的组件,分别是是 Ambari-server 、 Ambari-web 、 Ambari-agent 、 Ambari-metrics-collector 和 Ambari-metrics-monitor 。

在集群的每一台机器上都会部署 Ambari-agent 程序。 Agent 主要负责接收来着 Server 端的命令，这些命令可以是安装、启动、停止 Hadoop 集群上的某一服务。同时, agent 端需要向 Ambari-server 端上报命令执行的结果,是执行成功还是失败。
Ambari-Server 提供 REST 接口给Agent 和 Web 访问，用户甚至可以不用界面,而是通过 curl 命令来操控集群。
Ambari-metric-collector和 Ambari-metrics-monitor 是收集群中组件 metrics 的模块。

1.3 相关技术

Ambari充分利用了一些已有的优秀开源软件，巧妙地把它们结合起来，使其在分布式环境中做到了集群式服务管理能力、监控能力、展示能力，这些优秀的开源软件有：
（1）agent端，采用了puppet管理节点。
（2）在web端，采用ember.js作为前端MVC框架和NodeJS相关工具，用handlebars.js作为页面渲染引擎，在CSS/HTML方面还用了Bootstrap框架。
（3）在Server端，采用了Jetty、Spring、JAX-RS等。
（4）同时利用了Ganglia、Nagios的分布式监控能力。

Ambari架构采用的是Server/Client的模式，主要由两部分组成：ambari-agent和ambari-server。ambari依赖其它已经成熟的工具，例如其ambari-server 就依赖python，而ambari-agent还同时依赖ruby, puppet，facter等工具，还有它也依赖一些监控工具nagios和ganglia用于监控集群状况。
其中：

puppet是分布式集群配置管理工具，也是典型的Server/Client模式，能够集中式管理分布式集群的安装配置部署，主要语言是ruby。
facter是用python写的一个节点资源采集库，用于采集节点的系统信息，例如OS信息，主机信息等。由于ambari-agent主要是用python写的，因此用facter可以很好地采集到节点信息。

2. Ambari项目目录结构

2.1 总体目录

ambari-server	Ambari的Server程序，主要管理部署在每个节点上的管理监控程序
ambari-agent	部署在监控节点上运行的管理监控程序
ambari-web	Ambari页面UI的代码，作为用户与Ambari server交互的。
ambari-views	用于扩展Ambari Web UI中的框架
ambari-common	Ambari-server 和Ambari-agent 共用的代码
ambari-metrics	在Ambari所管理的集群中用来收集、聚合和服务Hadoop和系统计量
contrib	自定义第三方库
docs	文档

2.2 ambari-server 目录

目录	描述
org.apache.ambari.server.api.services	对web接口的入口方法，处理/api/v1/* 的请求
org.apache.ambari.server.controller	对Ambari中cluster的管理处理，如新增host，更service、删除component等
org.apache.ambari.server.controller.internal	主要存放ResourceProvider和PropertyProvider；
org.apache.ambari.service.orm.*	对数据库的操作
org.apache.ambari.server.agent.rest	处理与Agent的接口的入口方法
org.apache.ambari.security	使用Spring Security来做权限管理

每一种Resource都对应一个ResourceProvider,如下表所示：

Resource.Type	ResourceProvider
Workflow	WorkflowResourceProvider
Job	JobResourceProvider
TaskAttempt	TaskAttemptResourceProvider
View	ViewResourceProvider
ViewInstance	ViewInstanceResourceProvider
Blueprint	BlueprintResourceProvider
Cluster	ClusterResourceProvider
Service	ServiceResourceProvider
Component	ComponentResourceProvider
Host	HostResourceProvider
HostComponent	HostComponentResourceProvider
Configuration	ConfigurationResourceProvider
Action	ActionResourceProvider
Request	RequestResourceProvider
Task	TaskResourceProvider
User	UserResourceProvider
Stack	StackResourceProvider
StackVersion	StackVersionResourceProvider
StackService	StackServiceResourceProvider
StackServiceComponent	StackServiceComponentResourceProvider
StackConfiguration	StackConfigurationResourceProvider
OperatingSystem	OperatingSystemResourceProvider
Repository	RepositoryResourceProvider
RootService	RootServiceResourceProvider
RootServiceComponent	RootServiceComponentResourceProvider
RootServiceHostComponent	RootServiceHostComponentResourceProvider
ConfigGroup	ConfigGroupResourceProvider
RequestSchedule	RequestScheduleResourceProvider

2.3 Ambari-agent目录

3. Ambari-server

3.1 ambari-server架构

ambari-server是一个有状态的，它维护着自己的一个有限状态机FSM，同时这些状态机存储在数据库中，默认数据库为postgressql数据库。

Ambarii-Server提供ambari web，rest api，ambari shell三大方式操作机群；
ambari将集群的配置、各个服务的配置等信息存在ambari server端的DB中；
ambari server与ambari agent的交流走RPC，即agent向server报告心跳，server将command通过respons发回给agent，agent本地执行命令，比如：agent端执行相应的python脚本；
ambari有自己的一套监控、告警、镜像服务，以可插拔的形式供上层服务调用；

Ambari-Server是一个WEB Server，提供统一的REST API接口，同时向web和agent开放了两个不同的端口（默认前者是8080, 后者是8440或者8441）。它是由Jetty Server容器构建起来的，通过Spring Framework构建出来的WEB服务器，其中大量采用了google提供的Guice注解完成spring框架所需要的注入功能，REST服务由JAX-RS标准来实现。

如下图所示，server端主要维护三类状态：

Live Cluster State：集群现有状态，各个节点汇报上来的状态信息会更改该状态;
Desired State：用户希望该节点所处状态，是用户在页面进行了一系列的操作，需要更改某些服务的状态，这些状态还没有在节点上产生作用;
Action State：操作状态，是状态改变时的请求状态，也可以看作是一种中间状态，这种状态可以辅助Live Cluster State向Desired State状态转变。

Ambari-server的Heartbeat Handler模块用于接收各个agent的心跳请求（心跳请求里面主要包含两类信息：节点状态信息和返回的操作结果），把节点状态信息传递给FSM状态机去维护着该节点的状态，并且把返回的操作结果信息返回给Action Manager去做进一步的处理。
Coordinator模块又可以称为API handler，主要在接收WEB端操作请求后，会检查它是否符合要求，stage planner分解成一组操作，最后提供给Action Manager去完成执行操作。

因此，从上图就可以看出，Ambari-Server的所有状态信息的维护和变更都会记录在数据库中，用户做一些更改服务的操作都会在数据库上做一些相应的记录，同时，agent通过心跳来获得数据库的变更历史。

Ambari Server 会读取 Stack 和 Service 的配置文件。当用 Ambari 创建集群的时候，Ambari Server 传送 Stack 和 Service 的配置文件以及 Service 生命周期的控制脚本到 Ambari Agent。Agent 拿到配置文件后，会下载安装公共源里软件包（Redhat，就是使用 yum 服务）。安装完成后，Ambari Server 会通知 Agent 去启动 Service。之后 Ambari Server 会定期发送命令到 Agent 检查 Service 的状态，Agent 上报给 Server，并呈现在 Ambari 的 GUI 上。
Ambari Server 支持 Rest API，这样可以很容易的扩展和定制化 Ambari。甚至于不用登陆 Ambari 的 GUI，只需要在命令行通过 curl 就可以控制 Ambari，以及控制 Hadoop 的 cluster。具体的 API 可以参见 Apache Ambari 的官方网页 API reference。

4. Ambari-agent

4.1 ambari-agent架构

ambari-agent是无状态的，其功能主要分两部分：

采集所在节点的信息并且汇总发心跳汇报给ambari-server
处理ambari-server的执行请求

因此它有两种队列：

消息队列MessageQueue，或为ResultQueue。包括节点状态信息（包括注册信息）和执行结果信息，并且汇总后通过心跳发送给ambari-server;
操作队列ActionQueue。用于接收ambari-server返回过来的状态操作，然后能过执行器按序调用puppet或python脚本等模块完成任务。

4.2 Ambari-agent引导流程

分别是用SSH和人工手动的非SSH
步骤：

Ambari Server通过调用bootstrap.py来初始化整个bootstrap进程
Server端通过SSH Keys在Agent上配置Ambari Repo：通过scp 命令将Ambari Server上的ambari.repo文件拷贝到Agent Host上。
复制Ambari Agent Setup script：利用scp命令将setupAgent.py脚本复制到Agent host上。
在各个Agent上执行Ambari Agent Setup script：SSH到各个Agent Host上然后执行setupAgent.py。
在Agent上安装epel-release：用yum工具来安装epel-release包
在Agent上安装Ambari-agent：用yum工具来安装Ambari-Agent包
配置Ambari-agent.ini：修改/etc/ambari-agent/conf/ambari-agent.ini，并设置agent host上的hostname
启动Ambari-agent:启动Ambari-agent进程
开始Ambari Agent注册：agent开始registration进程

人工手动引导
具体步骤内容基本同上

4.3 Agent注册流程

步骤

连接握手端口8441：Ambari Agent连接到Ambari Server的握手端口8441。
下载Server Certification：Ambari Agent下载Server Certification。
请求签署Agent Certification：Ambari Agent请求Ambari Server来签署Agent证书。
签署Agent Cert：Ambari Server通过密码签署Agent证书。
下载Agent Cert并断掉连接：Ambari Agent下载Agent证书，然后断掉之前的连接。
连接注册端口8440：Ambari Agent连接到Ambari Server的注册端口8441
用Agent Cert执行2WAY auth：在Agent和Server之间完成2WAY权限认证。
获取FQDN：Ambari Agent host获取Fully Qualified Domain Name（FQDN）
注册Host：利用FQDN，host向Ambari Server提出注册。
完成Host注册：Ambari Server完成host的注册过程，把host加入到Ambari数据库。
Agent心跳程序启动：Ambari Agent向Ambari Server开启心跳程序，确认各种命令的执行。

5. Ambari-web内部架构

Ambari-web使用了一个流行的前端Embar.js MVC框架实现，Embar.js是一个TodoMVC框架，它涵盖了现今典型的单页面应用（single page application）几乎所有的行为。

使用了nodejs

使用brunch 作为项目的构建管理工具

Brunch ,是一个超快的HTML5构建工具。它有如下功能：

（1）编译你的脚本、模板、样式、链接它们。

（2）将脚本和模板封装进common.js/AMD模块里，链接脚本和样式。

（3）为链接文件生成源地图，复制资源和静态文件。

（4）通过缩减代码和优化图片来收缩输出，看管你的文件更改。

（5）并通过控制台和系统提示通知你错误。

Nodejs 是一个基于Chrome JavaScript运行时建立的一个平台，用来方便的搭建快速的易于扩展的网络应用，NodeJS借助事件驱动，非阻塞I/O模型变得轻量和高效，非常适合运行在分布式设备的数据密集型的实时应用。

6. 源码分析

6.1 ambari-server处理ambari-agent请求

Agent发送过来的心跳请求由org.apache.ambari.server.agent.HeartBeatHandler.handleHeartBeat(HeartBeat)来处理，执行完后，同时会返回org.apache.ambari.server.agent.HeartBeatResponse给agent。 org.apache.ambari.server.agent.HeartBeat里面主要含了两类信息：节点的状态信息nodeStatus和服务状态信息componentStatus。

public class HeartBeatHandler {
  ...
    public HeartBeatResponse handleHeartBeat(HeartBeat heartbeat)
      throws AmbariException {
    long now = System.currentTimeMillis();
    if (heartbeat.getAgentEnv() != null && heartbeat.getAgentEnv().getHostHealth() != null) {
      heartbeat.getAgentEnv().getHostHealth().setServerTimeStampAtReporting(now);
    }

    String hostname = heartbeat.getHostname();
    Long currentResponseId = hostResponseIds.get(hostname);
    HeartBeatResponse response;

    if (currentResponseId == null) {
      //Server restarted, or unknown host.
      LOG.error("CurrentResponseId unknown for " + hostname + " - send register command");
      // 无responseId, 新请求，就进行注册, responseId ＝0
      return createRegisterCommand();
    }

    LOG.debug("Received heartbeat from host"
        + ", hostname=" + hostname
        + ", currentResponseId=" + currentResponseId
        + ", receivedResponseId=" + heartbeat.getResponseId());

    if (heartbeat.getResponseId() == currentResponseId - 1) {
      LOG.warn("Old responseId received - response was lost - returning cached response");
      return hostResponses.get(hostname);
    } else if (heartbeat.getResponseId() != currentResponseId) {
      LOG.error("Error in responseId sequence - sending agent restart command");
      // 心跳是历史记录，那么就要求其重启，重新注册,responseId 不变
      return createRestartCommand(currentResponseId);
    }

    response = new HeartBeatResponse();
    //responseId 加 1 , 返回一个新的responseId，下次心跳又要把这个responseId带回来。
    response.setResponseId(++currentResponseId);

    Host hostObject;
    try {
      hostObject = clusterFsm.getHost(hostname);
    } catch (HostNotFoundException e) {
      LOG.error("Host: {} not found. Agent is still heartbeating.", hostname);
      if (LOG.isDebugEnabled()) {
        LOG.debug("Host associated with the agent heratbeat might have been " +
          "deleted", e);
      }
      // For now return empty response with only response id.
      return response;
    }
    //失去心跳，要求重新注册, responseId=0
    if (hostObject.getState().equals(HostState.HEARTBEAT_LOST)) {
      // After loosing heartbeat agent should reregister
      LOG.warn("Host is in HEARTBEAT_LOST state - sending register command");
      return createRegisterCommand();
    }

    hostResponseIds.put(hostname, currentResponseId);
    hostResponses.put(hostname, response);

    // If the host is waiting for component status updates, notify it
    //如果主机正在等待组件状态更新，请通知它
    //节点已经进行了注册，但是该节点还没有汇报相关状态信息,等待服务状态更新
    if (heartbeat.componentStatus.size() > 0
        && hostObject.getState().equals(HostState.WAITING_FOR_HOST_STATUS_UPDATES)) {
      try {
        LOG.debug("Got component status updates");
        //更新服务状态机
        hostObject.handleEvent(new HostStatusUpdatesReceivedEvent(hostname, now));
      } catch (InvalidStateTransitionException e) {
        LOG.warn("Failed to notify the host about component status updates", e);
      }
    }

    if (heartbeat.getRecoveryReport() != null) {
      RecoveryReport rr = heartbeat.getRecoveryReport();
      processRecoveryReport(rr, hostname);
    }

    try {
      if (heartbeat.getNodeStatus().getStatus().equals(HostStatus.Status.HEALTHY)) {
        //向状态机发送更新事件，更新节点至正常状态
        hostObject.handleEvent(new HostHealthyHeartbeatEvent(hostname, now,
            heartbeat.getAgentEnv(), heartbeat.getMounts()));
      } else { // 把节点列入不健康
        hostObject.handleEvent(new HostUnhealthyHeartbeatEvent(hostname, now, null));
      }
    } catch (InvalidStateTransitionException ex) {
      LOG.warn("Asking agent to re-register due to " + ex.getMessage(), ex);
      hostObject.setState(HostState.INIT);
      return createRegisterCommand();
    }

    /**
     * A host can belong to only one cluster. Though getClustersForHost(hostname)
     * returns a set of clusters, it will have only one entry.
     *主机只能属于一个集群。 通过getClustersForHost(hostname)返回一组集群，它只有一个条目。
     *
     * TODO: Handle the case when a host is a part of multiple clusters.
     * 处理 主机是多个集群的一部分时的 情况。
     */
    Set clusters = clusterFsm.getClustersForHost(hostname);

    if (clusters.size() > 0) {
      String clusterName = clusters.iterator().next().getClusterName();

      if (recoveryConfigHelper.isConfigStale(clusterName, hostname, heartbeat.getRecoveryTimestamp())) {
        RecoveryConfig rc = recoveryConfigHelper.getRecoveryConfig(clusterName, hostname);
        response.setRecoveryConfig(rc);

        if (response.getRecoveryConfig() != null) {
          LOG.info("Recovery configuration set to {}", response.getRecoveryConfig().toString());
        }
      }
    }

    heartbeatProcessor.addHeartbeat(heartbeat);

    // Send commands if node is active
    if (hostObject.getState().equals(HostState.HEALTHY)) {
      sendCommands(hostname, response);
      annotateResponse(hostname, response);
    }

    return response;
  }

  ...
}

6.2 Ambari-Agent执行流程

安装ambari-agent 服务时会把相应在的python代码置于python执行的环境上下文中，例如其入口代码可能是/usr/lib/python2.6/site-packages/ambari_agent/main.py，并且进行相关初始化工作（例如验证参数，与server建立连接，初始化安全验证证书），最后会产生一个新的控制器Controller子线程来统一管理节点的状态。Controller线程里面有一个动作队列ActionQueue线程，并且开启向Server注册和发心跳服务。可以看出来，ambari-agent主要由两个线程组成，Controller线程向Server发送注册或心跳请求，请求到的Action数据放到ActionQueue线程里面，ActionQueue线程维护着两个队列：CommandQueue和ResultQueue。ActionQueue线程会监听CommandQueue的状况。

class Controller(threading.Thread):    
  def __init__(self, config, range=30):  
  // 在初始化Controller之前，ambari-agent就会在main.py里面进行判断：ambari-server是否正常，正常才会初始化Controller  
  // 省略初始化代码
  def run(self):
    try:
      // 初始化队列线程
      self.actionQueue = ActionQueue(self.config, controller=self)
      self.actionQueue.start()
      // 初始化注册类
      self.register = Register(self.config)
      // 初始化心跳类
      self.heartbeat = Heartbeat(self.actionQueue, self.config, self.alert_scheduler_handler.collector())

      opener = urllib2.build_opener()
      urllib2.install_opener(opener)

      while True:
        self.repeatRegistration = False
        //开始注册 并且 定时发心跳 
        self.registerAndHeartbeat()
        if not self.repeatRegistration:
          logger.info("Finished heartbeating and registering cycle")
          break
    except:
      logger.exception("Controller thread failed with exception:")
      raise

    logger.info("Controller thread has successfully finished")

CommandQueue队列主要有3类command:

REGISTER_COMMAND：该类命令主要通知agent重新向server发送注册请求。
STATUS_COMMAND：该类命令主要告诉agent需要向server发送某组件的状态信息。
EXECUTION_COMMAND：要求agent执行puppet或者软件集升级任务

三、获取指标流程：

jersy接口接收到请求，创建一个ResourceInstance实例；
解析http请求构造一个Request对象，然后交给reques的process()方法来处理；
reques解析url或http_body得到一个Predicate对象；
根据http类型获取handler，GET请求对应ReadHandler；
handler向Query对象中添加分页、Render、Predicate等属性后，然后让query.execute()；
根据Resource.Type获得对应的ResourceProvider对象，调用其getResources方法得到Set；
调用对应的PropertyProvider填充Resource；
处理结果，放回json结果

Ambari-Server启动

Ambari-Server接受来自两处的REST请求，Agent过来的请求处理逻辑由包org.apache.ambari.server.agent处理，而API所的处理逻辑来自org.apache.ambari.server.api。详见如下代码：

“`

Ambari-Server有一个状态机管理模块，所有节点的状态信息更改都最终提供给状态机进行更改操作，因此状态机是一个很忙的组件。在Ambari-Server里面，把每一次更改操作都把它当作是一类事件，采用事件驱动机制完成对应的任务。这种思想有点借鉴已经运用在hadoop 2.x YARN里面的事件驱动机制。事件驱动机制能够一种高效的异步RPC请求方式，直接调用需要执行相应的代码逻辑，而事件驱动只需要产生事件统一提交给事件处理器，因此事件驱动需要一个更复杂的有限状态机结合起来一同使用。

DeepSeek预测2030年：全球 50% 的白领工作将由 AI Agent 辅助完成，金融、医疗等专业渗透率超 70% 未来AI编程 DeepSeek入门到精通人工智能金融
基于当前技术趋势、行业动态及搜索结果中的关键信息，对未来的发展进行多维度预测，涵盖人工智能、搜索行业、全球经济格局等领域：一、人工智能技术的革命性突破低成本高性能模型的普及DeepSeek-R1等国产大模型通过混合专家架构（MoE）和算法优化，以OpenAI1/70的训练成本实现同等性能，推动AI开发从“重训练”向“重推理”转型。这一模式将加速中小企业和新兴国家进入AI赛道，形成“算力平权”效应。
检测加密货币挖矿活动的异常端口扫地僧009 大数据安全分析深度学习机器学习安全
以下是基于DeepSeek架构思想实现的服务器异常端口检测案例与代码示例。我们以检测加密货币挖矿活动的异常端口为例，使用无监督学习（自编码器）实现动态基线建模。案例背景某云服务器出现异常流量：正常端口：80(HTTP),443(HTTPS),22(SSH)异常端口：6666（检测到高频TCP长连接，疑似门罗币挖矿流量）目标：通过自编码器学习正常端口行为模式，自动标记6666端口的异常活动。代码实现
架构师论文《论湖仓一体架构及其应用》 pccai-vip 架构软考论文
软考论文-系统架构设计师摘要作为某省级商业银行数据中台建设项目技术负责人，我在2020年主导完成了从传统数据仓库向湖仓一体架构的转型。针对日益增长的支付流水、用户行为埋点及信贷审核影像文件等多模态数据处理需求，原有系统存在存储成本激增、实时分析能力不足等问题。新平台需整合12个核心业务系统数据资源，建设支持实时反欺诈、客户画像分析的高性能数据底座。本项目采用Iceberg+Spark架构实现湖仓一
七.智慧城市数据治理平台架构 moton2017 大数据治理大数据数据架构数据库数据治理大数据治理数据分析智慧城市数据治理
一、整体架构概览智慧城市数据治理平台架构描绘了一个全面的智慧城市数据治理平台，旨在实现城市数据的统一管理、共享和应用，为城市运行、管理和决策提供数据支撑。整体架构呈现出分层、模块化、集约化的特点，并强调数据安全和标准规范。智慧城市数据治理平台架构二、核心模块解析1.城市驾驶舱统一数据管理门户:作为数据资源的统一入口，提供数据检索、申请、使用等服务。公共数据开放门户:向社会开放公共数据，支持数据目录
UE5网络通信架构解析努力的小钟 ue5
文章目录前言一、客户端-服务器架构（C/SModel）二、对等网络架构（P2P，非原生支持）三、混合架构（自定义扩展）四、UE5网络核心机制前言UE5的网络通信主要基于客户端-服务器（C/S）模型，以下是其核心架构及扩展可能性：一、客户端-服务器架构（C/SModel）这是UE5默认且最常用的架构，强调服务器的权威性，客户端通过服务器同步状态。具体分为两种模式：监听服务器（ListenServer
TCP/IP协议 DL庭网络
TCP/IP（TransmissionControlProtocol/InternetProtocol）是互联网的基础通信协议套件，定义了计算机在网络中通信的标准方式。它由多个协议组成，采用分层架构，确保数据在不同设备和网络间可靠传输。以下是TCP/IP协议的详细介绍：一、历史背景起源：20世纪70年代由美国国防部高级研究计划局（DARPA）开发，最初用于ARPANET（互联网前身）。标准化：19
【系统架构设计师-2024上半年真题】案例分析-答案及详解数据知道系统架构架构论文软考高级系统架构设计师案例分析
更多内容请见：备考系统架构设计师-核心总结索引文章目录【材料1】（软件架构设计与评估）问题1问题2问题3【材料2】（系统设计与建模）问题1问题2问题3问题4【材料3】（嵌入式）问题1问题2问题3【材料4】（数据库缓存）问题1问题2问题3【材料5】（Web架构）问题1问题2问题3【材料1】（软件架构设计与评估）问题1(7分)简述微服务架构，并对比单体架构和微服务架构微服务架构的优缺点。参考答案：微服
AutoMQ 可观测性实践：如何使用 OpenTelemetry 监控 Kafka 和底层流存储后端java
前言我们在之前的文章里介绍了AutoMQ如何与Prometheus、观测云[1]、夜莺监控[2]等后端进行集成并实现对AutoMQ的监控，本文将进一步介绍AutoMQ的可观测性架构，以及AutoMQ如何实现多云可观测性。可观测架构ApacheKafka的Server侧主要依赖YammerMetrics[3]这一第三方Library实现了指标的定义和采集，并通过将指标注册到MBeansServer的
《架构演进之路：突破与成长》——二次初稿感悟和思考猿脑2.0 架构演进之路 python
前言：时间一晃，第二次初稿的时间(9月13日）已经过去8天了，剩下的5位合写团队成员未按时间提交二次初稿，我有一点小失望，失望的不是大家没有按时交稿，而是没有提前沟通卡点和未交稿的原因，好像已经从生活中忘却。既然问题来了，作为发起人我有主要责任。因为是非协议性合写，所以当问题来了，我第一想到的是要如何解决问题，而不是苛责他人。列出几个大家可能没有按时交稿的原因：1合写的责任弱相关性导致动力不足。优
量子通信：未来信息传输的革命性技术给生活加糖！热门知识量子计算
随着信息技术的飞速发展，数据安全性和传输效率已经成为全球关注的焦点。量子通信作为一种新兴的通信技术，凭借其基于量子力学原理的独特性质，在信息传输的安全性、隐私保护和数据传输速率等方面展现出巨大的潜力。量子通信不仅有望解决现有加密技术的局限性，还将彻底改变传统通信系统的架构和发展方向。本文将详细探讨量子通信的定义、原理、关键技术、应用前景以及面临的挑战。一、量子通信的定义量子通信是基于量子力学原理的
国产替代 | 星环科技Sophon替代SAS，助力大型国有银行智能化营销星环科技数据库架构数据挖掘
分布式架构的｜国产智能分析工具在银行交易中，20%的头部优质客户会给银行贡献80%的利润，而赢得一个新客户的成本是保留一个老客户的5至6倍。某大型国有银行在面临此类数据挖掘的业务时，使用的是SAS产品。由于SAS是集中式的，对单台服务器要求太高，算力无法支撑需求，且无法支持可视化的机器学习，对于业务人员来说使用门槛过高。在经过产品选型后，决定采用星环科技的智能分析工具Sophon替换原有SAS，用
一文讲解Redis中的主从复制 Journey_CR Redis redis 数据库缓存
主从复制是指将一台Redis服务器的数据，复制到其他的Redis服务器。前者称为主节点master，后者称为从节点slave。且数据的复制是单向的，只能由主节点到从节点。三分恶面渣逆袭：Redis主从复制简图在Redis主从架构中，主节点负责处理所有的写操作，并将这些操作异步复制到从节点。从节点主要用于读取操作，以分担主节点的压力和提高读性能。主从复制主要的作用是什么?①、数据冗余：主从复制实现了
.NET Core Web API架构解析：应用场景与实例详解阿宝Altai .netcore 前端架构
“.NETCoreWebAPI架构深度解析：实战应用场景与代码示例”内容概述引言简要介绍.NETCore和WebAPI的基本概念。阐述本文的目的：深入解析.NETCoreWebAPI的架构，探讨其在实际项目中的应用场景，并提供代码示例。.NETCoreWebAPI架构解析核心组件：介绍ASP.NETCore框架中的关键组件，如Kestrel服务器、中间件管道、路由等。MVC模式：在WebAPI中的
[创业之路-232]：《华为闭环战略管理》-5-组织架构、业务架构、产品架构、技术架构、项目架构各自设计的原则是什么？文火冰糖的硅基工坊创业之路架构产品经理创业战略管理
目录一、组织架构设计原则二、业务架构设计原则三、产品架构设计原则四、技术架构设计原则五、项目架构设计原则一、各自的组成元素组织架构、业务架构、产品架构、技术架构、项目架构各自的组成元素具体如下：组织架构-组织企业相似资源的方式（人、财、物、信息）组织架构的组成元素主要包括：运营核心：直接制造产品和提供服务的员工，是组织的心脏，生产关键的产品，确保组织生存下去。战略高层：制定组织的总体战略和方向。中
ResNet代码详解与具体实现墨小傲 python 人工智能神经网络深度学习
现在在搞一个项目，想将目前模型架构中的vgg换成resnet网络，所以写了这篇文章。代码都是官网的代码，只是对内容进行了解释。1.BasicBlock类中的init()函数是先定义网络架构，forward()的函数是前向传播，实现的功能就是残差块，importtorch.nnasnnimportmathimporttorch.utils.model_zooasmodel_zoo#这个文件内包括6中
领域驱动设计（DDD）详解：聚合根和值对象在 .NET Core 中的实现与应用江沉晚呤时 Net core DDD net .netcore c#架构
在复杂的业务系统开发中，如何处理和组织业务逻辑是一个至关重要的挑战。领域驱动设计（Domain-DrivenDesign，简称DDD）为我们提供了一种有效的方法论，通过精确的领域建模，帮助我们在解决业务问题的同时构建清晰、可维护的系统架构。在DDD中，**聚合根（AggregateRoot）和值对象（ValueObject）**是两个非常重要的概念，它们在领域层的设计中占据着核心地位。本文将深入探
每日一道面试题(技术随机）什么是前端工程化？它有什么意义？晚夜微雨问海棠呀前端
前端工程化是一种系统化、规范化的前端开发方法论，通过整合工具链、制定标准流程和实施最佳实践，将软件工程思想应用于前端开发领域。其核心目标是提升开发效率、保障代码质量和增强可维护性。核心要素：模块化架构采用ESModules/CommonJS实现代码拆分组件化开发（如React/Vue组件体系）//ESModule示例import{utils}from'./core-module';exportde
51、深度学习-自学之路-自己搭建深度学习框架-12、使用我们自己建的架构重写RNN预测网络小宇爱深度学习-自学之路深度学习 rnn 人工智能
importnumpyasnpclassTensor(object):def__init__(self,data,autograd=False,creators=None,creation_op=None,id=None):self.data=np.array(data)self.autograd=autogradself.grad=Noneif(idisNone):self.id=np.rand
云原生架构概念睡不醒的小泽软件架构云原生微服务
云原生架构概念云原生架构（CloudNativeArchitechtrue）作为一种现代软件开发的革新力量，正在逐渐改变企业构建、部署和管理应用程序的方式。它的核心优势在于支持微服务架构，使得应用程序能够分解为独立、松耦合的服务，每个服务都可以单独开发、部署和扩展，从而提高了敏捷性和迭代速度。此外，云原生架构通过容器化技术，如Docker和Kubernetes，确保了应用程序在不同环境中的一致性和
python向企业微信推送文件鱼弦【HOT】技术热谈 python 企业微信数据库
鱼弦：CSDN内容合伙人、CSDN新星导师、全栈领域创作新星创作者、51CTO(Top红人+专家博主)、github开源爱好者（go-zero源码二次开发、游戏后端架构https://github.com/Peakchen）Python与企业微信的通信原理是通过企业微信提供的API接口进行交互。企业微信是一款为企业内部通讯和协作而设计的通讯工具，提供了丰富的接口和功能，包括发送消息、获取部门成员、
【云原生】云原生后端：案例研究与最佳实践丶2136 web 后端云原生
目录引言案例一：Netflix的云原生转型1.1背景1.2转型过程1.3成果1.4经验总结案例二：Spotify的云原生实践2.1背景2.2转型过程2.3成果2.4经验总结案例三：Alibaba的云原生架构3.1背景3.2转型过程3.3成果3.4经验总结总结引言在快速发展的软件行业，云原生架构已经成为提升应用开发和部署效率的关键理念。通过采用微服务、容器化、自动化和持续交付等技术，企业能够更快速地
开源分布式存储系统在云原生数据库领域的实践与应用 ITPUB-微风开源分布式云原生
本文深入探讨了Curve项目，一个专为云原生环境设计的开源分布式存储系统。文章详细介绍了Curve的块存储架构、其在云原生数据库领域的实际应用，并展望了项目的未来发展方向。一、Curve项目介绍Curve项目致力于打造一个云原生、高性能、稳定且易运维的开源分布式存储系统。它支持私有云、公有云和混合云上的部署，兼容CSI插件，并支持容器化部署和Kubernetes集成。Curve的设计理念在于提供高
Hadoop--Secondary NameNode工作机制，作用及与NameNode HA的区别 Cynthiaaaaalxy hadoop 大数据分布式
SecondaryNameNode主要用于辅助NameNode进行元数据的管理和检查点（Checkpoint）的生成。1.SecondaryNameNode的工作机制详解SecondaryNameNode的工作机制可以分为以下步骤：①SecondaryNameNode询问NameNode是否需要CheckpointSecondaryNameNode会定期（由dfs.namenode.check
【云原生迁移】云原生迁移案例 gskyi 云原生
一、回答框架（STAR-R模型）Situation（背景）→Task（任务）→Action（行动）→Result（结果）→Reflection（反思）二、高频问题应答模板1.请描述您主导的云原生迁移项目回答示例：Situation：主导官网系统迁移，单体架构面临扩展性瓶颈，部署耗时长达2小时/次，且突发流量常导致服务雪崩Task：6个月内完成200+服务迁移实现零停机迁移，SLA从99.9%提升至
14.10 Auto-GPT 记忆系统架构设计：实现智能体的长期记忆与经验复用少林码僧 AI大模型应用实战专栏 gpt 开源架构语言模型人工智能
Auto-GPT记忆系统架构设计：实现智能体的长期记忆与经验复用关键词：Auto-GPT记忆系统、分层存储架构、向量记忆检索、经验缓存策略、记忆持久化1.记忆系统的分层架构设计三级存储架构解析：
MySql主从同步延迟怎么办？你喝不喝热水啊数据库 mysql 数据库
文章目录什么是MySQL主从架构主从架构的组成工作原理主从复制的步骤主从架构的优点主从架构的缺点什么是主从同步延迟为什么会导致主从延迟主从延时的排查和解决如果发现主从数据不一致怎么办？我们常说的业务量越来越大，I/O访问频率过高，单机无法满足，就会用到读写分离之类的多库方案所以我们首先要知道什么是MySQL主从架构什么是MySQL主从架构通过字面上来看，最起码要有两台数据库，并且他们的关系是主与从
开源模型应用落地-Qwen1.5-MoE-1/3的激活参数量达到7B模型的性能开源技术探险家开源模型-实际应用落地 #深度学习语言模型自然语言处理
一、前言2024.03.28阿里推出Qwen系列的首个MoE模型，Qwen1.5-MoE-A2.7B。它仅拥有27亿个激活参数，但其性能却能与当前最先进的70亿参数模型，如Mistral7B和Qwen1.5-7B相媲美。但是目前只有HFtransformers和vLLM支持该模型。二、术语介绍2.1.混合专家(MoE)架构是一种机器学习模型的结构设计,它将一个复杂的任务分解成多个相对简单的子任务,
下载CentOS 10 明明见自己 CentOS 10 centos linux 运维
1.进入官网：https://www.centos.org/2.点击右上角的Download进入下载页面。3.选择对应的CPU架构，点击ISOs下面的Mirrors开始下载。
微服务的优势以及在Spring生态下的开源解决方案。 dushky 微服务 spring 开源
使用微服务架构是为了解决单体应用在复杂业务场景下的局限性，其核心思想是通过解耦和模块化提升系统的灵活性、可维护性和扩展性。以下是微服务的核心优势及对应的Spring生态下的技术栈实现方案：一、微服务的核心优势与实现1.服务独立开发与部署优势：每个微服务独立开发、测试、部署和扩展，避免单体应用“牵一发而动全身”的问题。SpringCloud实现方案：服务拆分：基于业务边界定义独立服务模块（如订单服务
时序大模型：技术需求、现有成果及主流模型、模型架构、数据处理方式、优势、缺点及未来展望 xl.liu 架构人工智能
时序大模型：技术需求、现有成果及主流模型、模型架构、数据处理方式、优势、缺点及未来展望时序大模型如何保证数据的完整性和准确性时序大模型的性能高度依赖于数据的质量和完整性。为了确保模型的预测和分析结果准确可靠，需要采取一系列措施来保证数据的完整性和准确性。数据清洗：去除异常值：通过统计方法或机器学习算法检测并去除异常值，确保数据的合理性。填补缺失值：使用插值方法、均值填充、中位数填充或基于模型的预测
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {