云博士的AI课堂

【大模型开发】深入解析 DeepSpeed：原理、核心技术与示例代码

深入解析 DeepSpeed：原理、核心技术与示例代码

DeepSpeed 是由微软开源的高性能深度学习训练优化引擎，专注于帮助研究人员和工程团队在分布式环境中高效地训练超大规模模型。其核心目标是提供 高吞吐、低内存占用、低成本 的分布式训练方案，让数千亿甚至万亿级参数模型的训练成为可能。本文将从 DeepSpeed 的核心原理、关键组件、代码示例 及 实现过程详解 等方面做详细阐述，帮助读者更好地理解并使用 DeepSpeed。

DeepSpeed 简介
核心原理与关键组件
- ZeRO Optimizer
- 并行策略
- DeepSpeed Engine
- DeepSpeed Inference
DeepSpeed 代码示例
- 示例 1：最小训练脚本
- 示例 2：在 Hugging Face Transformers 中集成 DeepSpeed
关键实现过程详解
- 配置文件 deepspeed_config.json
- 主程序结构
- 参数分布与通信过程
- 动态切分与自动并行
总结与实践建议

DeepSpeed 简介

在深度学习模型参数规模不断增长的趋势下，传统的数据并行（Data Parallel）已经无法满足超大模型的内存需求和训练效率。DeepSpeed 的出现，旨在通过多项技术创新大幅优化大模型训练的资源利用效率与训练速度：

ZeRO (Zero Redundancy Optimizer)：通过将优化器状态、梯度、参数分散到不同 GPU 上，显著降低单张 GPU 的内存负担；
多重并行策略：结合数据并行（DP）、模型并行（MP）、流水线并行（PP）等，最大化利用集群硬件；
可扩展到数千 GPU，且训练速度近乎线性增长；
Inference Engine：支持大模型分布式推理，减少推理时延。

总体而言，DeepSpeed 让 “大模型” 能在 “相对少的硬件资源” 上实现高效训练与推理，极大地降低了研究和产业落地的门槛。

核心原理与关键组件

1. ZeRO Optimizer

1.1 背景

在训练超大模型时，最主要的内存开销来自 优化器状态 (Optimizer States)、梯度 (Gradients) 和 模型权重 (Parameters)。传统的数据并行会在每张 GPU 上保留完整的这三份拷贝，因此当模型参数量超过数十亿甚至上千亿时，单卡内存远远不足。

1.2 ZeRO 的核心思路

ZeRO 的全称是 Zero Redundancy Optimizer，它通过 分块（Sharding） 的方式将参数、梯度和优化器状态分别切分，分配到不同的 GPU 上，从而 消除冗余：

Stage 1：仅对优化器状态进行切分，梯度和模型参数仍完整存储在每个 GPU 上；
Stage 2：对优化器状态和梯度均进行切分，模型参数仍保留完整拷贝；
Stage 3：对优化器状态、梯度和模型参数都进行切分，极大地压缩了单卡所需的内存占用。

在 ZeRO-3 模式下，每张 GPU 仅持有完整模型参数的一部分，以及相应的部分梯度和优化器状态。其余切分数据存放在其他 GPU 上，通过全局通信进行同步计算。

1.3 性能与内存占用优势

在 ZeRO-3 模式下，相比传统数据并行，单卡内存占用可以减少 数倍到数十倍。在多机多卡环境中，ZeRO 能接近线性地扩展到上千张 GPU。

2. 并行策略

深度学习的大规模训练常结合多种并行方式，DeepSpeed 也为以下模式提供了支持：

数据并行 (Data Parallel, DP)
- 将训练数据切分到不同 GPU，每个 GPU 独立训练后再聚合梯度；
- ZeRO 优化器让 DP 模式内存占用大幅下降。
模型并行 (Model Parallel, MP)
- 将单个模型的某些层或张量切分到不同 GPU，例如在某些层级进行张量并行（Tensor Parallel）；
- 能进一步应对超大模型单卡无法容纳的情况。
流水线并行 (Pipeline Parallel, PP)
- 将模型分为若干阶段，每段在不同 GPU 上串行执行“正向 + 反向”；
- 与张量并行可结合成 混合并行。

DeepSpeed 提供便捷的接口让用户在同一引擎中同时使用 ZeRO + MP + PP 等组合并行策略。

3. DeepSpeed Engine

DeepSpeed Engine 是一个高层封装，统管 通信策略、优化器切分、梯度汇总 等功能，对外提供易用的 Python 接口。核心包括：

DeepSpeed.initialize(...)
- 读取 deepspeed_config.json 配置文件，初始化 ZeRO、并行策略等；
- 返回封装后的 model_engine 与 optimizer、training_dataloader。
model_engine.forward/backward/step
- 取代传统 PyTorch model 的前向、后向、更新三步；
- 内部自动处理参数分配、梯度通信。
自动微调
- 提供 FP16 / BF16 混合精度；
- 可结合 Adam、LAMB、One-bit Adam 等优化器。

4. DeepSpeed Inference

在推理阶段，DeepSpeed Inference Engine 提供大模型多卡并行推理能力：

ZeRO-Inference：对超大模型的权重进行切分与加载，实现分布式推理；
Inference Pipeline：可进一步缩小单卡显存压力，提高推理吞吐；
张量并行：切分计算以加速单次推理并减少时延。

DeepSpeed 代码示例

以下通过两个示例演示 DeepSpeed 的基本用法：

最小训练脚本：从零开始展示如何使用 DeepSpeed 初始化并训练一个简单模型；
在 Hugging Face Transformers 中集成：展示 DeepSpeed 在主流 NLP 框架中的用法。

示例 1：最小训练脚本

1. 项目目录结构

.
├── train.py
└── deepspeed_config.json

2. `deepspeed_config.json`（ZeRO 配置示例）

{
  "train_batch_size": 8,
  "gradient_accumulation_steps": 2,
  "fp16": {
    "enabled": true
  },
  "zero_optimization": {
    "stage": 2
  }
}

train_batch_size: 全局训练的 batch size（多卡合计），与 gradient_accumulation_steps 结合来控制单次迭代的有效批次。
fp16.enabled: 开启混合精度训练。
zero_optimization.stage: 设置 ZeRO 的级别（1~3）。

3. `train.py`

import torch
import torch.nn as nn
import torch.optim as optim
import deepspeed
from torch.utils.data import Dataset, DataLoader

# 1. 简易数据集定义
class RandomDataset(Dataset):
    def __init__(self, size=64, length=1000):
        super().__init__()
        self.size = size
        self.length = length
        self.data = torch.randn(length, size)
        self.labels = torch.randint(0, 2, (length,))
    def __len__(self):
        return self.length
    def __getitem__(self, idx):
        return self.data[idx], self.labels[idx]

# 2. 简单模型定义
class SimpleModel(nn.Module):
    def __init__(self, input_dim=64, hidden_dim=32):
        super(SimpleModel, self).__init__()
        self.linear1 = nn.Linear(input_dim, hidden_dim)
        self.relu = nn.ReLU()
        self.linear2 = nn.Linear(hidden_dim, 2)
    def forward(self, x):
        x = self.relu(self.linear1(x))
        return self.linear2(x)

def main():
    # DeepSpeed 将通过命令行/脚本参数解析 config 等
    import argparse
    parser = argparse.ArgumentParser()
    parser = deepspeed.add_config_arguments(parser)
    args = parser.parse_args()
    
    # 1. 初始化数据
    dataset = RandomDataset()
    train_loader = DataLoader(dataset, batch_size=4)
    
    # 2. 构建模型
    model = SimpleModel()
    
    # 3. 定义优化器 (DeepSpeed需要原生参数)
    optimizer = optim.Adam(model.parameters(), lr=1e-3)
    
    # 4. 初始化 DeepSpeed Engine
    model_engine, optimizer_engine, train_loader, _ = deepspeed.initialize(
        model=model,
        optimizer=optimizer,
        args=args,
        training_data=dataset  # 也可传入 train_loader
    )
    
    # 5. 训练循环
    for epoch in range(3):
        for step, batch in enumerate(train_loader):
            inputs, labels = batch
            inputs, labels = inputs.to(model_engine.local_rank), labels.to(model_engine.local_rank)
            
            outputs = model_engine(inputs)
            loss_fn = nn.CrossEntropyLoss()
            loss = loss_fn(outputs, labels)
            
            # DeepSpeed的后向与优化 step
            model_engine.backward(loss)
            model_engine.step()

            if step % 10 == 0:
                print(f"Epoch {epoch}, Step {step}, Loss={loss.item():.4f}")

if __name__ == "__main__":
    main()

4. 启动命令

deepspeed train.py --deepspeed_config deepspeed_config.json

或指定 --num_gpus 进行多卡训练：

deepspeed --num_gpus=4 train.py --deepspeed_config deepspeed_config.json

示例 2：在 Hugging Face Transformers 中集成 DeepSpeed

Hugging Face Transformers 自带 DeepSpeed 支持，可在 Trainer 或 Accelerate 中使用。下面以 Trainer 为例：

from transformers import Trainer, TrainingArguments, AutoModelForSequenceClassification, AutoTokenizer
import datasets
import deepspeed

model_name = "bert-base-uncased"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForSequenceClassification.from_pretrained(model_name, num_labels=2)

# 加载 IMDb 二分类数据集
imdb = datasets.load_dataset("imdb")
def tokenize_fn(examples):
    return tokenizer(examples["text"], truncation=True, padding="max_length", max_length=128)

train_data = imdb["train"].map(tokenize_fn, batched=True)
test_data = imdb["test"].map(tokenize_fn, batched=True)
train_data.set_format("torch", columns=["input_ids", "attention_mask", "label"])
test_data.set_format("torch", columns=["input_ids", "attention_mask", "label"])

training_args = TrainingArguments(
    output_dir="./ds_transformers",
    per_device_train_batch_size=4,
    per_device_eval_batch_size=4,
    num_train_epochs=1,
    logging_steps=100,
    evaluation_strategy="epoch",
    save_strategy="epoch",
    # 指定 DeepSpeed 配置
    deepspeed="./ds_config.json"
)

trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=train_data,
    eval_dataset=test_data,
)

trainer.train()

其中 ds_config.json 与上例类似，指定 ZeRO stage 及 FP16 等信息。运行时仅需 python your_script.py，Transformers 会自动调用 DeepSpeed 进行分布式训练。

关键实现过程详解

1. 配置文件 deepspeed_config.json

train_batch_size：全局批次大小（所有 GPU 的累积 batch）。
gradient_accumulation_steps：梯度累加步数，以缓解大 batch 对显存的压力。
fp16 / bf16：指定是否开启半精度/混合精度。

zero_optimization：指定 ZeRO stage 及一些高级参数：

"zero_optimization": {
  "stage": 3,
  "contiguous_gradients": true,
  "overlap_comm": true,
  "reduce_scatter": true,
  "reduce_bucket_size": 200000000
}

optimizer / scheduler：可在 json 中配置优化器类型（如 adamw）和学习率策略。

2. 主程序结构

DeepSpeed.initialize(...) 做了以下几件事：

解析配置：读取 JSON 中的参数，设置 ZeRO、FP16、并行模式等。
包装模型与优化器：返回封装后的 model_engine 和 optimizer_engine。
处理数据加载器：可将 training_data 或现有的 train_loader 传入，用于自动分发到多 GPU。

训练循环中，代替原生的 loss.backward() 和 optimizer.step()，使用 model_engine.backward(loss) 与 model_engine.step()，让 DeepSpeed 内部处理梯度通信、同步。

3. 参数分布与通信过程

以 ZeRO-2 为例：

Optimizer State Sharding：将 Adam 的内部状态（如 exp_avg、exp_avg_sq）分割到不同 GPU。
Gradient Partitioning：将每层梯度分割存储到不同 GPU。反向传播结束后，通过全局通信聚合必要的梯度，然后分散更新。
参数广播：每次需要使用某层参数时，DeepSpeed 会确保正确的参数块在本地 GPU 上。

ZeRO-3 进一步把模型参数本身也做切分，内存占用更低，但通信量更大。

4. 动态切分与自动并行

Pipeline并行 & ZeRO：DeepSpeed 支持将模型划分为多个 pipeline stage，并行执行，同时每个 stage 内部使用 ZeRO 分布式优化器。
自动并行：通过 DeepSpeed 配置，可在后端自动将部分算子分配到不同 GPU 上，显式减少人工对并行策略的干预。

总结与实践建议

挑选合适的 ZeRO Stage
- 对于数亿到几十亿参数的模型，ZeRO-2 通常即可满足需求；
- 对于上百亿或上千亿参数模型，ZeRO-3 才能显著降低内存占用。
结合 Pipeline 并行 / 张量并行
- DeepSpeed 允许与 Megatron-LM 式的张量并行结合；
- 大规模训练往往多种并行混合使用，以获得最佳扩展性。
注意通信开销和网络带宽
- ZeRO-3 切分更彻底，但通信量和同步频率也更大；
- 在大型集群上，需要高性能网络（如 InfiniBand、NVLink）来发挥全部优势。
推理阶段也可用 DeepSpeed
- 对于大模型部署，DeepSpeed Inference 可有效降低单卡内存负担，并支持多卡推理加速。
与 Hugging Face Transformers 等生态集成
- 在已有 NLP / CV 框架中启用 DeepSpeed，能够大幅简化开发流程；
- 在大模型（GPT-3、OPT、BLOOM 等）微调场景下尤其有效。

结语

DeepSpeed 通过 ZeRO Optimizer、多重并行策略 与 高性能引擎 的深度整合，帮助研究者和企业以相对有限的 GPU 资源训练超大规模模型。本文详细介绍了 DeepSpeed 的原理、关键组件及示例代码，希望能为读者搭建或优化大模型训练流程提供帮助。

如果你在项目中需要训练数十亿甚至上千亿参数的大模型，不妨试试 DeepSpeed —— 它或许能让大模型训练的门槛大幅降低，并在保证吞吐的同时显著节省显存和算力投入。祝大家在大模型的世界里训练顺利、研发愉快！

【哈佛博后带小白玩转机器学习】 哔哩哔哩_bilibili

总课时超400+，时长75+小时

【笔记】DIDs 去中心化身份的相关名词释义 m0_47843842 去中心化
Authenticate身份验证是一个过程（通常是某种类型的协议），通过该过程，实体可以使用一种或多种验证方法证明其具有特定属性或掌控特定秘密。对于DID，一个常见的例子是证明对与DID文档中发布的公钥相关联的私钥的控制。Decentralizedidentifier(DID)不需要中心注册机构的全球唯一持久标识符，因为它是通过加密方式生成和/或注册的。DID的通用格式在DID核心规范[DID-C
ECDSA数字签名
ECDSA算法（深入浅出密码学笔记）ECDSA标准中的步骤与DSA方案的步骤在概念上紧密相连，但ECDSA中的离散对数问题是在椭圆曲线群中构建起来的。因此，实际计算一个ECDSA签名所执行的算术运算与DSA中的完全不同。ECDSA标准是针对素数域Zp\mathbb{Z}_pZp和有限域GF(2m)GF(2^m)GF(2m)上的椭圆曲线定义的密钥生成使用椭圆曲线EEE，其中：模数为ppp；系数为aa
从传统Cube到现代化指标体系：物化视图驱动的指标平台升级之路镜舟科技 StarRocks 物化视图数据架构 OLAP 数据分析数据库湖仓一体
在高并发、高吞吐量的数据分析场景下，简单的事情往往变得不那么简单。一个业务逻辑简单的指标大盘，在日常情况下可能运行良好，但一旦面临大促或年终数据汇总等高峰期，就会出现卡顿甚至崩溃的情况。为什么在这些特定场景下，原本稳定的系统会变得不稳定？这是因为传统的指标大盘解决方案在设计时，往往没有针对高并发、多维度分析和秒级刷新等特殊需求做好充分准备。一、传统数据架构在指标分析场景下的困境1.指标平台的常见诉
R语言倾向性匹配得分（PSM）分析后端工程实践 r语言 java 开发语言 R语言
R语言倾向性匹配得分（PSM）分析倾向性匹配得分（PropensityScoreMatching,PSM）是一种常用的统计方法，用于处理观察研究中的选择性偏倚。它通过建立一个倾向性得分模型，将受试者分为处理组和对照组，以实现类似于随机对照试验的效果。本文将介绍如何使用R语言进行倾向性匹配得分分析，并提供相应的源代码。导入所需的R包在进行PSM分析之前，首先需要导入所需的R包。常用的包包括Match
python + selenium通过滑块验证 weixin_51144854 python selenium 爬虫 opencv
1、介绍使用python进行自动化操作或者爬虫过程中，可能会遇到需要进行验证的情况。本文介绍了两种通过滑块验证的方法：轮廓检测通过OpenCV进行轮廓检测，找到滑块背景中缺口的位置，计算缺口到滑块的距离。模板匹配通过OpenCV分析滑块背景图与滑块的相似度，找到滑块背景图中与滑块最相似的区域就是缺口的位置，然后计算缺口到滑块的距离。2、轮廓检测测试地址：https://accounts.douba
Python爬虫实战：研究MarkupSafe库相关技术 ylfhpy 爬虫项目实战 python 爬虫开发语言 MarkupSafe
1.引言1.1研究背景与意义随着互联网数据量的爆炸式增长，网页内容自动提取与分析技术在信息检索、舆情监控、数据挖掘等领域的需求日益凸显。网络爬虫作为获取网页内容的核心工具，能够自动化采集互联网信息。然而，直接渲染爬取的网页内容存在安全隐患，特别是跨站脚本攻击（XSS）风险。攻击者可能通过注入恶意脚本窃取用户信息或破坏网站功能。MarkupSafe作为Python的安全字符串处理库，能够有效处理不可
Python爬虫实战：研究sanitize库相关技术 ylfhpy 爬虫项目实战 python 爬虫网络开发语言安全 sanitize
1.引言1.1研究背景与意义在当今数字化时代，互联网已成为人们获取信息、交流互动的重要平台。随着Web2.0技术的发展，用户生成内容(UGC)、社交媒体嵌入、第三方插件等功能极大丰富了网页的内容和交互性，但也带来了严峻的安全挑战。根据Web应用安全联盟(WAS)的统计数据，2025年全球范围内因网页安全漏洞导致的数据泄露事件超过15万起，造成的经济损失高达250亿美元。其中，跨站脚本攻击(XSS)
Python爬虫实战：研究xmltodict库相关技术 ylfhpy 爬虫项目实战 python 爬虫开发语言 xmltodict
1.引言1.1研究背景与意义气象数据在农业生产、交通规划、灾害预警等多个领域具有重要应用价值。传统的气象数据获取方式主要依赖于气象部门发布的统计信息，存在更新不及时、数据维度有限等问题。随着互联网技术的发展，气象网站提供了丰富的实时气象数据，但这些数据通常以HTML、XML等非结构化或半结构化形式存在，难以直接利用。因此，开发高效的数据采集与解析系统具有重要的现实意义。1.2国内外研究现状网络爬虫
【TVM 教程】PAPI 入门
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/性能应用程序编程接口（PerformanceApplicationProgrammingInterface，简称PAPI）是一个可在各种平台上提供性能计数器的库。在指定的运行期间，性能计数器提供处理器行为的准确底层信息，包含简单的指标，如总
trycatch捕获不到的错误前端javascript
在浏览器环境的JavaScript中，try...catch是处理运行时错误的常用机制，但并非所有错误都能被其捕获。以下是无法被try...catch捕获的几类错误及其原因与解决方案：⚠️1.语法错误（SyntaxErrors）原因：语法错误发生在代码解析阶段，此时代码尚未执行，try...catch无法捕获。示例：try{consta=;//缺少赋值表达式}catch(e){console.lo
Pthon httpx 使用代理下载文件（qbit）
前言技术栈Python3.11.8httpx0.28.1示例代码#encoding:utf-8#author:qbit#date:2025-06-30#summary:httpx使用代理下载文件importhttpxproxy='http://127.0.0.1:8081'defDownFile(url,file):withopen(file,'wb')asf:withhttpx.stream('
.net和Java微服务框架列举及.net技术选型步、步、为营 java 微服务开发语言 .net
.NET与Java微服务框架大盘点及.NET技术选型指南前言在当今的软件开发领域，微服务架构凭借其灵活性和可扩展性，成为了众多企业构建复杂应用的首选方案。.NET和Java作为两大主流的开发平台，各自拥有丰富的微服务框架。本文将为大家详细介绍.NET和Java的一些常见微服务框架，并探讨.NET技术选型的相关要点。.NET微服务框架介绍1.ASP.NETCoreASP.NETCore是构建微服务的
PCDN与边缘计算：流量处理的双赢方案数据库
PCDN与边缘计算：流量处理的双赢方案在数字化时代，宽带流量的快速增长对传统网络架构提出了更高要求。视频、直播、云计算等应用消耗了大量带宽资源，如何高效、低成本地处理流量成为行业关注的重点。PCDN（Peer-to-PeerContentDeliveryNetwork）与边缘计算的结合，为流量优化提供了双赢解决方案。PCDN通过利用用户闲置带宽和存储资源，构建分布式网络，使内容分发更接近终端用户。
python网络安全实战_基于Python网络爬虫实战 weixin_39907850 python网络安全实战
文件的操作：一般都要使用os模块和os.path模块importos.pathos.path.exists('D:\\Python\\1.txt')#判断文件是否存在abspath(path)#返回path所在的绝对路径dirname(p)#返回目录的路径exists(path)#判断文件是否存在getatime(filename)#返回文件的最后访问时间getctime(filename)#返回
实战｜StarRocks 通过 JDBC Catalog 访问 MongoDB 的数据
方案介绍本文档介绍如何通过StarRocks的JDBCCatalog功能，结合MongoDBBIConnector，将MongoDB数据便捷接入StarRocks，实现数据打通和SQL查询分析，以下是整体流程图。前提条件StarRocks环境：版本≥3.0，支持JDBCCatalog功能。MongoDBBIConnector：已安装并运行，版本需与MongoDB兼容（参考MongoDB官方文档）。
VTJ.PRO：打破次元壁！AI驱动 + 双向代码自由穿梭，重新定义Vue高效开发！前端人工智能vue3
“既要低代码的速度，又要手写代码的自由？”——现在，无需妥协！VTJ.PRO革命性推出“双向代码转换引擎”，让开发者在可视化设计与源码编辑间无缝切换，真正实现“设计即代码，代码即设计”的终极工作流！✨核心黑科技：双向自由转换可视化设计→纯净源码拖拽生成的界面，一键转换为高质量Vue3组件代码，无冗余、无黑盒！支持导出标准.vue文件，无缝嵌入现有工程，源码100%自主可控！手写代码→可视化编辑将已
Java流式处理太阳伞下的阿呆 java 生成器迭代器 stream 流式处理
在Java中，没有直接类似Python生成器的语法，但可以通过迭代器（Iterator）和流式处理（如使用Spliterator或ReactiveStreams）来实现类似生成器的功能。此外，也可以通过BlockingQueue和线程的组合实现异步文件解压流。以下是几种实现方式：**方法1：使用****Iterator**实现一个Iterator，在每次调用next()时返回解压完成的下一个文件名
JVM调优实战 Day 11：JVM参数调优最佳实践在未来等你 JVM调优实战 JVM Java 性能优化调优虚拟机
【JVM调优实战Day11】JVM参数调优最佳实践文章标签jvm,jvm调优,java性能优化,jvm参数配置,垃圾回收,JVM监控,Java开发,架构设计文章简述在Java应用的性能调优过程中，JVM参数的合理配置是影响系统稳定性和吞吐量的关键因素。本文作为“JVM调优实战”系列的第11天内容，全面讲解JVM参数调优的核心概念、技术原理与实际应用场景。文章从JVM内存模型、GC策略出发，深入分析
设计模式精讲 Day 13：责任链模式（Chain of Responsibility Pattern）
【设计模式精讲Day13】责任链模式（ChainofResponsibilityPattern）文章内容在“设计模式精讲”系列的第13天，我们将深入讲解责任链模式（ChainofResponsibilityPattern）。这是一种行为型设计模式，它通过将请求的发送者和接收者解耦，使得多个对象都有机会处理请求，从而避免了请求的发送者与接收者之间的紧耦合。责任链模式的核心思想是：将请求的处理过程组织
JVM调优实战 Day 5：内存泄漏与溢出分析在未来等你 JVM调优实战 JVM Java 性能优化调优虚拟机
【JVM调优实战Day5】内存泄漏与溢出分析文章简述在Java应用中，内存泄漏和内存溢出是常见的性能瓶颈问题。本文作为“JVM调优实战”系列的第五天内容，深入讲解了JVM中内存泄漏与溢出的基本概念、原理机制、常见问题及诊断方法。文章通过理论结合实践的方式，介绍了如何使用JVM工具如jstat、jmap、jhat等进行堆内存分析，并提供了完整的代码示例和配置参数。同时，文中还包含一个真实生产环境中的
互联网大厂Java求职面试：Spring AI最佳实践与AI应用架构设计在未来等你 Java场景面试宝典 AI 技术编程 Java Spring
互联网大厂Java求职面试：SpringAI最佳实践与AI应用架构设计引言在当前AI技术快速发展的背景下，企业对AI能力的需求日益增长。作为Java开发人员，掌握SpringAI的最佳实践和相关技术栈变得尤为重要。本文将深入探讨SpringAI的应用场景、架构设计以及实际案例，帮助读者更好地理解和应用这一前沿技术。技术总监的提问与郑薪苦的回答第一轮提问技术总监（严肃）：“郑薪苦，首先请你说说你在项
导数：微积分的核心概念与实用解析你一身傲骨怎能输数学分析导数
文章摘要导数是描述函数瞬时变化率的数学工具，定义为极限值(f’(a)=lim⁡h→0f(a+h)−f(a)h)\lim_{h\to0}\frac{f(a+h)-f(a)}{h})limh→0hf(a+h)−f(a))，若存在则称函数在点a可导。其几何意义是函数图像在点(a,f(a))处切线的斜率。导数计算的是函数值增量与自变量增量比值的极限，反映瞬时变化率。例如，(f(x)=x^2)的导数为(f’
领域驱动设计实战：高效在线教育平台开发你一身傲骨怎能输软件工程领域驱动设计
文章摘要领域驱动设计实战：构建高效的在线教育平台本文系统介绍了领域驱动设计（DDD）在在线教育平台中的应用。核心内容包括：DDD核心理念：以业务领域为中心，通过限界上下文划分复杂系统，实现业务与代码结构一致。领域划分：在线教育平台分为课程管理、用户权限、订单支付等核心领域，各领域通过领域事件或API通信。建模实战：以课程管理为例，设计聚合根（Course）、实体（Chapter）和值对象（Mate
零信任架构——重构企业安全边界的新范式月_o9 网络安全
零信任架构——重构企业安全边界的新范式（字数：998）传统边界的崩塌与信任危机防火墙与VPN构筑的“城堡护城河”模型在云原生与远程办公时代彻底瓦解。当数据散布于公有云、边缘设备与SaaS平台，当供应链攻击可穿透层层防护，“内部可信”的假设已成为最大安全漏洞。零信任（ZeroTrust）的核心哲学正是：永不信任，持续验证（NeverTrust,AlwaysVerify）。它并非单一技术，而是以身份为
【Python系列PyCharm控制台pip install报错】如何解决pip安装报错ModuleNotFoundError: No module named ‘numpy’问题
【Python系列PyCharm控制台pipinstall报错】如何解决pip安装报错ModuleNotFoundError:Nomodulenamed‘numpy’问题摘要在日常Python开发过程中，pipinstall相关的问题频繁困扰着新手和老手。尤其是在PyCharm控制台下执行pipinstallnumpy后，仍然报ModuleNotFoundError:Nomodulenamed'n
【Python系列PyCharm控制台pip install报错】如何解决pip安装报错ModuleNotFoundError: No module named ‘flask’问题 lyzybbs 全栈Bug解决方案专栏 python pycharm pip sklearn 开发语言 flask pandas
【Python系列PyCharm控制台pipinstall报错】如何解决pip安装报错ModuleNotFoundError:Nomodulenamed‘flask’问题摘要在进行Python开发时，我们常常会遇到通过pipinstall安装依赖包时出现的各种问题。其中最常见的报错之一是ModuleNotFoundError:Nomodulenamed‘flask’。这个错误通常发生在安装Flas
自己做一个简单的蓝牙app 特辣的海菜物联网嵌入式学习笔记
在物联网做项目的过程中，会用到app与不同的无线模块建立通信，来显示接收来自单片机发来的内容和发送数据到单片机上。制作APP的在线网站APPInventor网站：MITAppInventor（可以QQ邮箱注册/登录）1.准备工作要求：连接蓝牙和解除蓝牙连接按下右上角的设计面板里先拉一个列表选择框，文本修改为蓝牙连接，再拉一个按键，文本修改为退出蓝牙。拉个标签到中间用来描述蓝牙连接状态，在从左侧的通
MCP+A2A：从实验室到生产环境的落地之旅 CarlowZJ AI应用落地+MCP+A2A 数据库 MCP+A2A
目录摘要一、引言二、MCP与A2A概念讲解（一）MCP（ModelContextProtocol）（二）A2A（Application-to-Application）（三）MCP与A2A的融合三、MCP+A2A技术架构图与工作流程图（一）整体架构图（二）工作流程图四、MCP+A2A代码示例（一）基于Python的MCP+A2A通信示例（二）基于Java的MCP+A2A应用集成示例五、MCP+A2A
什么是分布式系统?
大家好，我是锋哥。今天分享关于【什么是分布式系统?】面试题。希望对大家有帮助；什么是分布式系统?超硬核AI学习资料，现在永久免费了！分布式系统是指由多个独立的计算节点（计算机或设备）组成的系统，这些节点通过网络进行通信与协调，完成共同的任务。每个节点通常有自己的处理器、内存和存储，而系统的整体目标是通过这些节点的协作来提供一种统一的服务。分布式系统的主要特点：节点独立性：每个节点都有自己的硬件和操
文心大模型4.5及X1重磅上线，真实测评
2025年3月16日，人工智能领域迎来一场重要盛事——百度文心大模型4.5如期正式发布。与此同时，百度还惊喜推出了另一款全新模型——文心大模型X1。目前，文心大模型4.5和X1已在文心一言官网（https://yiyan.baidu.com/）正式上线，并免费向用户开放。其中，文心大模型4.5面向企业用户和开发者，用户可以通过登录百度智能云千帆大模型平台，轻松调用文心大模型4.5的API接口，快速
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h