呆萌钟

分布式链路监控追踪分析与实践

转载声明：商业转载请联系作者获得授权,非商业转载请注明出处.原文来自 © 呆萌钟分布式链路监控追踪系统调研分析

背景

随着互联网架构的扩张，分布式系统变得日趋复杂，越来越多的组件开始走向分布式化，如微服务、消息收发、分布式数据库、分布式缓存、分布式对象存储、跨域调用，这些组件共同构成了繁杂的分布式网络，那现在的问题是一个请求经过了这些服务后其中出现了一个调用失败的问题，只知道有异常，但具体的异常在哪个服务引起的就需要进入每一个服务里面看日志，这样的处理效率是非常低的。

现实中的分布式服务之间的调用链比上图还要复杂，像一张大网，盘根错节。所以，我们急需一种能追踪其调用链的方案，以快速完成问题的定位。

那什么是分布式调用链呢？

分布式调用链其实就是将一次分布式请求还原成调用链路。显式的在后端查看一次分布式请求的调用情况，比如各个节点上的耗时、请求具体打到了哪台机器上、每个服务节点的请求状态等等。

链路追踪系统应该具备的功能

根据前面的分析，我们已经知道追踪分布式调用链是解决上述场景的一个可行方案，那分布式链路追踪应该具备哪些功能才能达到我们的要求呢？

故障快速定位

通过调用链跟踪，一次请求的逻辑轨迹可以用完整清晰的展示出来。开发中可以在业务日志中添加调用链ID，可以通过调用链结合业务日志快速定位错误信息。

各个调用环节的性能分析

在调用链的各个环节分别添加调用时延，可以分析系统的性能瓶颈，进行针对性的优化。通过分析各个环节的平均时延，QPS等信息，可以找到系统的薄弱环节，对一些模块做调整，如数据冗余等。

数据分析

调用链绑定业务后查看具体每条业务数据对应的链路问题，可以得到用户的行为路径，经过了哪些服务器上的哪个服务，汇总分析应用在很多业务场景。

生成服务调用拓扑图

通过可视化分布式系统的模块和他们之间的相互联系来理解系统拓扑。点击某个节点会展示这个模块的详情，比如它当前的状态和请求数量。

分布式调用跟踪系统的设计

我们前面已经说了链路追踪系统需要具备的功能，那从哪些方面考虑去设计它呢？

（1）分布式调用跟踪系统的设计目标

低侵入性，应用透明：作为非业务组件，应当尽可能少侵入或者无侵入其他业务系统，对于使用方透明，减少开发人员的负担
低损耗：服务调用埋点本身会带来性能损耗，这就需要调用跟踪的低损耗，实际中还会通过配置采样率的方式，选择一部分请求去分析请求路径
大范围部署，扩展性：作为分布式系统的组件之一，一个优秀的调用跟踪系统必须支持分布式部署，具备良好的可扩展性

（2）埋点和生成日志

埋点即系统在当前节点的上下文信息，可以分为客户端埋点、服务端埋点，以及客户端和服务端双向型埋点。埋点日志通常要包含以下内容：
TraceId、RPCId、调用的开始时间，调用类型，协议类型，调用方ip和端口，请求的服务名等信息；
调用耗时，调用结果，异常信息，消息报文等；
预留可扩展字段，为下一步扩展做准备；

（3）抓取和存储日志

日志的采集和存储有许多开源的工具可以选择，一般来说，会使用离线+实时的方式去存储日志，主要是分布式日志采集的方式。典型的解决方案如Flume结合Kafka等MQ。

（4）分析和统计调用链数据

一条调用链的日志散落在调用经过的各个服务器上，首先需要按 TraceId 汇总日志，然后按照RpcId 对调用链进行顺序整理。用链数据不要求百分之百准确，可以允许中间的部分日志丢失。

（5）计算和展示

汇总得到各个应用节点的调用链日志后，可以针对性的对各个业务线进行分析。需要对具体日志进行整理，进一步储存在HBase或者关系型数据库中，可以进行可视化的查询。

链路追踪Trace模型分析

目前，几乎所有的分布式链路追踪都是来自于谷歌的一篇论文而设计开发而成的，论文名称：Dapper，大规模分布式系统的跟踪系统

Trace调用模型，主要有以下概念：

Trace：一次完整的分布式调用跟踪链路。
Span：追踪服务调基本结构，表示跨服务的一次调用；多span形成树形结构，组合成一次Trace追踪记录。
Annotation：在span中的标注点，记录整个span时间段内发生的事件。
BinaryAnnotation：可以认为是特殊的Annotation，用户自定义事件。
Annotation类型：保留类型
Cs CLIENT_SEND，客户端发起请求
Cr CLIENT_RECIEVE，客户端收到响应
Sr SERVER_RECIEVE，服务端收到请求
Ss SERVER_SEND，服务端发送结果
用户自定义类型：
Event 记录普通事件
Exception 记录异常事件
Client && Server：对于跨服务的一次调用，请求发起方为client，服务提供方为server

各术语在一次分布式调用中，关系如下图所示：

调用跟踪系统对比

当下互联网环境，大的互联网公司都有自己的分布式跟踪系统，比如Google的Dapper，Twitter的zipkin，淘宝的鹰眼，新浪的Watchman，京东的Hydra等，下面来简单分析。

Google的Drapper（闭源）

Dapper是Google生产环境下的分布式跟踪系统，Dapper有三个设计目标：

低消耗：跟踪系统对在线服务的影响应该做到足够小。
应用级的透明：对于应用的程序员来说，是不需要知道有跟踪系统这回事的。如果一个跟踪系统想生效，就必须需要依赖应用的开发者主动配合，那么这个跟踪系统显然是侵入性太强的。
延展性：Google至少在未来几年的服务和集群的规模，监控系统都应该能完全把控住。

处理分为3个阶段：

①各个服务将span数据写到本机日志上；

②dapper守护进程进行拉取，将数据读到dapper收集器里；

③dapper收集器将结果写到bigtable中，一次跟踪被记录为一行。

大众点评——CAT

架构简单。可以实现一个Trace系统的所有功能。架构如下图所示：

跟踪模型

Transaction是最重要的事件消息类型，适合记录跨越系统边界的程序访问行为,比如远程调用，数据库调用，也适合执行时间较长的业务逻辑监控，记录次数与时间开销。Transaction可嵌套。

跨服务的跟踪功能与点评内部的RPC框架集成，这部分未开源。

客户端接入方式

对于方法调用、sql、url请求等粒度较小的兴趣点，需要业务人员手写代码实现。

日志收集方式

直接向日志收集器发异步请求（有本地内存缓存），一台客户端会连向几个服务端，当一个服务端出问题，数据不会丢失。

当所有服务端都挂掉，消息会存入queue，当queue满了，就丢弃了，没有做数据存储本地等工作。

全量采样，系统繁忙的时候对性能影响较大（可能达到10%的影响）

最后一个稳定版本是2014年1月，之后已经失去维护。

阿里-鹰眼（闭源）

埋点和生成日志
- 基于中间件、TraceId/RpcId、异步写、采样
抓取和存储日志
- 实时抓日志，实时+离线结合的存储
汇总和重组调用链
- 按TraceId汇总、按RpcId重组
分析和统计调用链
- 入口标准化、带上下文的调用统计

京东-hydra

与dubbo框架集成。对于服务级别的跟踪统计，现有业务可以无缝接入。对于细粒度的兴趣点，需要业务人员手动添加。架构如下：

Hydra中跟踪数据模型

Trace: 一次服务调用追踪链路。

Span: 追踪服务调基本结构，多span形成树形结构组合成一次Trace追踪记录。

Annotation: 在span中的标注点，记录整个span时间段内发生的事件。

BinaryAnnotation: 属于Annotation一种类型和普通Annotation区别，这键值对形式标注在span中发生的事件，和一些其他相关的信息。

日志收集方式

与CAT类似。支持自适应采样，规则粗暴简单，对于每秒钟的请求次数进行统计，如果超过100，就按照10%的比率进行采样。

开源项目已于2013年6月停止维护

Twitter—Zipkin

功能、数据跟踪模型与hydra类似。Zipkin本身不开源，开源社区的是另外一套scala实现，依托于finagle这个RPC框架。架构如下：

Zipkin与其他Trace系统的不同之处

Zipkin中针对 HttpClient、jax-rs2、jersey/jersey2等HTTP客户端封装了拦截器。可以在较小的代码侵入条件下实现URl请求的拦截、时间统计和日志记录等操作。

日志收集

Cat是直接将日志发往消费集群；
hydra是发给日志收集器，日志收集器推到消息队列；
Zipkin的client将统计日志发往消息队列，日志收集器读取后落地存储；
Dapper和Eagle eye是记录本地文件，后台进程定期扫描。

Trace系统现状分析

以上几款链路跟踪系统都各自满足了请求链路追踪的功能，但落实到我们自己的生产环境中时，这些Trace系统存在诸多问题：

Google和alibaba的Trace系统不开源，但现阶段来说阿里是做得最好的，如果用的是阿里的服务器，可考虑直接用阿里的追踪系统以节省开发代价；
京东和点评的虽然开源，但是已经多年没有维护，项目依赖的jdk版本以及第三方框架过于陈旧等等，不适合用在生产环境中；
Twitter的OpenZipkin使用scala开发，而且其实现基于twitter内部的RPC框架finagle，第三方依赖比较多，接入和运维的成本比较高。

如果不是用阿里的服务，我们可以借鉴这些开源实现的思想, 自行开发Trace系统。那是自己从0开始开发还是基于开源方案二次开发？这里面也要考虑到跨平台，如NET和java环境，尽量减少原系统的侵入性或只需要更改少量的代码即可接入，在这里可以基于zipkin和pinpoint进行二次开发，功能可参考阿里的系统。

参考文章：

https://www.cnblogs.com/zhangs1986/p/8879744.html

https://www.cnblogs.com/yeahwell/p/cat.html

你可能感兴趣的:(分布式)

分布式因果推断在美团履约平台的探索与实践思维导图-java架构用心去追梦 java 架构开发语言
为了创建一个关于“分布式因果推断在美团履约平台的探索与实践”的思维导图，并且专注于Java架构下的实现，我们可以将这个主题分解为几个关键领域。这包括：项目背景、因果推断的基本概念、数据收集与预处理、分布式系统设计、算法选择与实现、性能优化策略、以及效果评估与迭代。以下是这个主题的思维导图结构建议：思维导图结构1.项目背景美团履约平台简介平台业务流程（如外卖配送、闪购等）履约效率的重要性分布式因果推
如何在 PyTorch 分布式训练中使用 TORCH_DISTRIBUTED_DEBUG=INFO 进行调试 weixin_48705841 pytorch 分布式人工智能
如何在PyTorch分布式训练中使用TORCH_DISTRIBUTED_DEBUG=INFO进行调试在使用PyTorch进行分布式训练时，调试分布式训练过程中的问题可能非常棘手。尤其是在多卡、多节点的训练环境中，常常会遇到通信延迟、同步错误等问题。为了帮助调试这些问题，PyTorch提供了一个非常有用的环境变量TORCH_DISTRIBUTED_DEBUG，通过设置它，你可以在控制台输出更多的调试
OpenCompass评测大模型辣条少年人工智能
OpenCompass简介上海人工智能实验室科学家团队于2024.01.30正式发布了大模型开源开放评测体系“司南”(OpenCompass2.0)，用于为大语言模型、多模态模型等提供一站式评测服务。OpenCompass平台广泛支持超过100种HuggingFace和API模型，融合了100多个数据集，包含约40万个问题，用以从八个维度评估模型。其高效的分布式评估系统能够快速且全面地评估十亿级规
分布式IO模块与S7-1200 PLC：打造高效分拣系统的新引擎明达技术分布式物联网
在现代化物流中心，快速、高效、准确的包裹分拣是衡量整个系统性能的关键指标。为了实现这一目标，国产IO模块与西门子S7-1200PLC的结合应用，正成为越来越多企业的首选方案。这一组合不仅优化了数据采集和处理流程，还显著提升了分拣效率，降低了运营成本。精准配合分布式IO模块是工业自动化系统中的关键组件，负责采集现场设备的各种信号，并将这些信号转换为数字信号传输给PLC。在分拣系统中，这些模块外接了各
科技护航：分布式 IO 模块与大型 PLC，稳筑地铁安全防线明达技术科技分布式
在城市的地下脉络中，地铁如灵动的巨龙，承载着无数人的出行需求。保障地铁的稳定安全运行，是城市高效运转的关键，而这背后，分布式IO模块与大型PLC的默契协作，功不可没。智慧大脑大型PLC，作为自动化控制领域的核心力量，犹如地铁控制系统的“智慧大脑”。它具备强大的数据处理与逻辑运算能力，能够精准调控地铁运行的各个环节。从列车的启动、加速、减速到停靠，从站台屏蔽门的开关，到通风、照明系统的有序运作，大型
可以自己部署的微博 Mastodon HoneyMoose 前端
Mastodon（又称乳齿象、长毛象或万象）是一个自由开源的去中心化的分布式微博客社交网络。它的用户界面和操作方式跟推特（Twitter）类似，但整个网路并非由单一机构运作，而是以多个由不同营运者独立运作的伺服器以互联方式交换资料而组成的去中心化社交网络。每个Mastodon的营运站点被称为“实例（Instance）”，用户可到任何开放登记的实体登记，任何一个实体上的用户可以与其他实体上的用户沟通
【YashanDB知识库】重装新库及元数据和数据导出导入指导数据库
本文内容来自YashanDB官网，原文内容请见https://www.yashandb.com/newsinfo/7253741.html?templateId=171...开始本文操作之前默认已经部署有3mn3cn3-3dn的yashan分布式数据库，并且已经配置好环境变量，开始操作之前请先停止所有业务。从旧库导出数据创建目录$cd~$mkdir-p/data/yashan/save\_data
Oracle 到 Elasticsearch 数据迁移同步
简述Elasticsearch是一个分布式的实时搜索与数据分析引擎，具有强大的可扩展性和高度的灵活性。CloudCanal对于Elasticsearch的支持经过了多轮迭代，支持版本从6.x和7.x一路扩展到8.x，并适配了其丰富多样的API。同时CloudCanal对Oracle源端同步技术进行了多处优化，大幅提升了数据同步的稳定性和可靠性。本文主要介绍如何使用CloudCanal快速构建一条O
Kafka 到 Kafka 数据同步
简述Kafka为处理实时数据提供了一个统一、高吞吐、低延迟的平台，其持久化层本质上是一个“按照分布式事务日志架构的大规模发布/订阅消息队列”，这使它作为企业级基础设施来处理流式数据非常有价值。因此实现Kafka到Kafka的数据同步也成了一项重要工作。本篇文章主要介绍如何使用CloudCanal构建一条Kafka到Kafka的数据同步链路。技术点消费者消息推送在任务创建后，CloudCanal会自
Golang网络刘贤松精品文章 golang 游戏服务器
golang游戏服务器框架在Go语言中，有许多优秀的游戏服务器框架，以下是一些比较流行的框架：Leaf：一个轻量级的游戏服务器框架，支持多进程、分布式、热更新等特性。它提供了一些常用的组件，如网络层、定时器、数据库等等，可以帮助开发者快速构建游戏服务器。go-ethereum：一个基于以太坊协议的区块链游戏服务器框架，支持智能合约、代币、加密等特性。它提供了丰富的API，可以轻松构建去中心化的游戏
有了TiDB，是否还需要“散装”大数据组件？狮歌~资深攻城狮 tidb 数据仓库数据分析数据库分布式
有了TiDB，是否还需要“散装”大数据组件？最近和同事们讨论一个问题：在大数据应用日益增多的今天，如果使用了TiDB这样的一体化数据库，还需要使用那些传统的大数据组件（比如Hadoop、Spark等）吗？相信大家在公司或项目中，常常遇到需要处理大量数据的场景，特别是互联网、金融、电商等行业。随着TiDB的兴起，它作为一款分布式关系型数据库，似乎能够解决不少大数据问题。那么，问题来了：如果我们已经选
什么时候用MPP，什么时候用TiDB？狮歌~资深攻城狮 tidb 数据仓库数据分析数据库分布式
什么时候用MPP，什么时候用TiDB？在面对海量数据时，我们常常需要选择适合的数据库架构来满足业务需求。常见的选择之一是MPP（大规模并行处理）架构，而TiDB作为一种分布式数据库，也逐渐成为了很多开发者的选择。那么，这两者有什么区别，我们应该如何选择呢？今天，我们就来聊聊这两者的适用场景。1.什么是MPP，什么是TiDB？MPP（大规模并行处理）MPP是一种数据处理架构，它通过将任务分割成多个子
Hadoop是什么，怎么部署安装？狮歌~资深攻城狮 hadoop 大数据分布式
Hadoop是什么？Hadoop是一个由Apache基金会开发的开源分布式系统基础架构，主要用于处理和存储大规模数据集。它包括两个核心组件：Hadoop分布式文件系统（HDFS）和HadoopYARN（YetAnotherResourceNegotiator）。HDFS提供了一个高吞吐量的数据访问接口，允许用户在集群中存储大量数据。它通过将文件分割成多个块并分布在集群的不同节点上来实现高可靠性和可
TiDB 的优势与劣势狮歌~资深攻城狮 tidb 数据仓库数据分析
TiDB的优势与劣势TiDB作为一款新兴的分布式数据库，在业界逐渐崭露头角。它兼具传统关系型数据库的特性，又充分利用分布式架构的优势。那么，TiDB究竟有怎样的优缺点呢？今天我们来聊聊TiDB的优势与劣势，帮你全面了解它。TiDB的优势1.水平扩展能力强TiDB最大的亮点之一就是它的水平扩展性。在传统数据库中，当数据量增加时，我们需要对服务器进行纵向扩展（比如升级硬件）。而TiDB是基于分布式架构
【RabbitMQ 消息丢失常见情况分析】高飞的Leo 市场问题处理总结 rabbitmq 分布式
RabbitMQ消息丢失分析：常见场景与解决策略RabbitMQ作为一种流行的消息队列中间件，广泛应用于各类分布式系统中。它通过发布/订阅模式解耦了生产者和消费者，提高了系统的可扩展性和可靠性。然而，在实际应用中，消息丢失仍然是一个亟待关注的问题。本文将探讨导致RabbitMQ消息丢失的几种常见场景，尤其是Exchange没有绑定Queue的情况，并提供相应的解决策略。1.RabbitMQ工作原理
高可用高负载高并发的互联网应用的架构设计 AI架构设计之禅 AI大语言模型和知识图谱融合 Python入门实战大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
高可用高负载高并发的互联网应用的架构设计关键词：高可用性、高负载、高并发、分布式系统、负载均衡、缓存、数据库优化、微服务架构1.背景介绍在当今数字化时代，互联网应用已经成为我们日常生活中不可或缺的一部分。随着用户数量的激增和业务需求的不断扩大，构建高可用、高负载、高并发的互联网应用架构已经成为现代软件工程中的一个重要挑战。本文将深入探讨如何设计和实现一个能够满足这些要求的互联网应用架构，从而为读者
Kestra实战指南:构建高效可靠的数据工作流 ivwdcwso 运维开发 Kestra 工作流运维开发
在当今数据驱动的世界中,高效管理和执行复杂的数据工作流变得越来越重要。Kestra作为一款开源的分布式工作流和任务管理系统,为我们提供了一个强大的解决方案。本文将深入探讨Kestra的安装、配置和使用,帮助您充分利用这个强大的平台来优化您的数据处理流程。©ivwdcwso(ID:u012172506)什么是Kestra?Kestra是一个基于JVM构建的开源分布式工作流和任务管理系统。它支持对任务
14天学习微服务--＞第1天：微服务架构入门码上分享架构学习微服务
一、微服务架构概述微服务架构是一种将复杂应用程序分解为一组小型、独立服务的架构风格。每个服务围绕特定的业务功能构建，并且可以独立部署和扩展。这种架构风格在过去十年中迅速发展，成为构建现代分布式系统的首选方式之一。二、微服务架构与单体架构的区别特性微服务架构单体架构服务划分按业务功能拆分为多个独立服务所有功能集成在一个大型应用程序中技术栈可以使用不同的技术栈开发不同服务通常使用统一的技术栈部署方式独
分布式 IO 模块：开启药品罐装产线高效生产新纪元明达技术分布式
在药品生产的精密领域，每一个环节都关乎着客户的健康与安全。药品罐装产线作为药品生产的关键环节，其高效运行与精准控制至关重要。明达技术MR30分布式IO模块，正以其卓越的性能，成为实现药品罐装产线高效控制，确保产品质量稳定、工厂可用性高以及生产效率大幅提升的核心驱动力。精准把控，铸就稳定产品质量药品罐装过程对剂量的精准度要求近乎苛刻。哪怕是极其微小的剂量偏差，都可能影响药品疗效，甚至危害患者健康。M
全面指南：使用JMeter进行性能压测与性能优化（中间件压测、数据库压测、分布式集群压测、调优） vip1024p 面试学习路线阿里巴巴 jmeter 性能优化中间件
目录一、性能测试的指标1、并发量2、响应时间3、错误率4、吞吐量5、资源使用率二、压测全流程三、其他注意点1、并发和吞吐量的关系2、并发和线程的关系四、调优及分布式集群压测（待仔细学习）1.线程数量超过单机承载能力时的解决方案2.如何搭建分布式集群3.实施集群压测及监控4.处理集群中单台施压机报错的情况5.长时间压测（10小时）的注意事项6.处理混合场景：用户思考时间及多个服务同时压测7.开发压测
大模型的部署方法三：使用Xinference部署大模型微调部署人工智能 AI大模型大模型 AI 深度学习大模型部署
Xinference是一个分布式推理框架，它支持一键部署各种模型，包括大型语言模型（LLMs）。使用Xinference部署AI大模型的步骤：一、安装Xinference1）环境准备：确保您的系统上安装了Python3.9或以上版本。安装Docker（如果选择使用Docker部署）。2）安装Xinference：通过Python的包管理工具pip安装Xinference：pipinstall"xi
深入探秘 Java 网络编程：从基础到多线程服务器的全方位指南 2的n次方_ java 网络服务器
我的主页：2的n次方_Java作为一门功能强大的编程语言，不仅在桌面应用、移动开发、后端开发等领域表现出色，还在网络编程中拥有广泛的应用。网络编程涉及在两个或多个设备之间通过网络进行通信，这对于构建分布式系统、客户端-服务器应用程序、以及互联网服务至关重要。在这篇博客中，我们将详细探讨Java网络编程的基础知识，并通过代码示例展示如何在Java中实现网络通信。1.Java网络编程基础Java网络编
分布式资源管理和调度架构 johnny233 架构架构
概述不管是计算任务还是数据存储都会涉及资源分配，资源包括但不限于硬件资源如CPU、内存、硬盘、网口。在单机环境中，资源管理相对简单；分布式环境中，资源分布相对分散，如何协调资源应对计算任务和数据存储就是亟待解决的问题。资源管理和调度是将计算任务分配到资源的过程，为了处理并发的计算任务，系统会通过集群的方式组织资源。集群中的资源可以按照服务器或者虚拟机的方式划分。注：本文是《分布式架构原理与实践》的
分布式存储的技术选型之HDFS、Ceph、MinIO对比 Linux运维老纪勇敢向前迎接运维开发之挑战分布式 hdfs ceph 云原生运维开发大数据云计算
分布式存储的技术选型比：HDFS、Ceph、MinIO对比一文读懂分布式存储在当今数字化时代，数据呈爆炸式增长，分布式存储技术应运而生，成为大数据存储与管理的得力助手。它将数据分散存于多台独立设备，构建起一个庞大而可靠的虚拟存储体系，有效突破了传统集中式存储的性能瓶颈，大幅提升了可靠性、可用性及存取效率，轻松应对海量数据的存储挑战。分布式存储的应用场景极为广泛。在大数据处理领域，如互联网公司应对海
动手写分布式缓存 11 qq_50996930 Go语言学习专栏分布式缓存
main函数实现定义一个map模拟数据库。varmysql=map[string]string{"Tom":"630","Jack":"589","Sam":"567",}为多个端口处创建rpc服务服务名就是ip+端口。将各个服务器的ip+端口加到每个服务器的哈希环里。为每个服务器创建缓存池组。缓存池组和rpc服务绑定。持续监听端口addrs:=[]string{"localhost:9999",
Java 驱动大数据流处理：Storm 与 Flink 入门（大数据）用心去追梦大数据 java storm
Java是一种广泛使用的编程语言，特别适用于企业级应用开发。随着数据量的不断增长，处理大数据流成为了现代软件开发中的一个重要领域。ApacheStorm和ApacheFlink是两个用于处理大规模数据流的开源框架，它们都支持用Java编写的应用程序。下面将简要介绍这两个框架，并提供一些入门指导。ApacheStormApacheStorm是一个免费、开源的分布式实时计算系统。Storm让用户能够轻
SpringCloud Alibaba：RocketMQ - 分布式消息中间件的最佳实践 mckim_ 笔记学习 spring cloud rocketmq
引言随着分布式系统和微服务架构的发展，消息队列作为异步通信的关键组件，其重要性日益凸显。RocketMQ作为一款高性能、高可靠的消息中间件，在处理海量消息方面表现卓越。本文将结合实际应用场景，全面介绍RocketMQ的基础知识、配置要点、高级特性以及性能监控的最佳实践。一、RocketMQ基础知识1.概述RocketMQ是由阿里巴巴开源的一款分布式消息中间件，以其高效、可靠、易用的特点著称。它支持
RocketMQ如何保证消息顺序？ java1234_小锋 java rocketmq
大家好，我是锋哥。今天分享关于【RocketMQ如何保证消息顺序？】面试题。希望对大家有帮助；RocketMQ如何保证消息顺序？1000道互联网大厂Java工程师精选面试题-Java资源分享网RocketMQ是阿里巴巴开源的一款分布式消息队列，它能够保证消息的顺序性。为了保证消息顺序，RocketMQ采用了特定的机制和设计。具体来说，RocketMQ主要通过以下几个方式来确保消息的顺序：1.消息的
RocketMQ的集群架构是怎样的? java1234_小锋 java java-rocketmq rocketmq 架构
大家好，我是锋哥。今天分享关于【RocketMQ的集群架构是怎样的?】面试题。希望对大家有帮助；RocketMQ的集群架构是怎样的?1000道互联网大厂Java工程师精选面试题-Java资源分享网RocketMQ是阿里巴巴开源的分布式消息中间件，广泛用于处理高吞吐量、高可用的消息队列服务。它的集群架构设计非常注重高可用性、可扩展性和高效性。以下是RocketMQ的集群架构主要组件和工作原理：1.集
【YashanDB知识库】手工迁移Doris数据到崖山分布式数据库
本文内容来自YashanDB官网，原文内容请见https://www.yashandb.com/newsinfo/7253739.html?templateId=171...本方案采用csv文件格式进行数据的导出和导入。具体步骤如下：通过sql语句将Doris表导出成csv文件注：导出到本地文件时需要先在fe.conf中配置enable_outfile_to_local=true并重启fe节点--
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他