Charles_yy

基于DeepSpeed对 llama2-7b的LORA精调

DeepSpeed数据并行研究

1. 技术调研

a. DeepSpeed

DeepSpeed是一个开源深度学习训练优化库，其中包含一个新的显存优化技术—— ZeRO（零冗余优化器）。该框架包含四个技术亮点：

用 3D 并行化实现万亿参数模型训练： DeepSpeed 实现了三种并行方法的灵活组合，它们分别为ZeRO 支持的数据并行，流水线并行和张量切片模型并行。3D 并行性适应了不同工作负载的需求，以支持具有万亿参数的超大型模型，同时实现了近乎完美的显存扩展性和吞吐量扩展效率。

ZeRO-Offload 使 GPU 单卡能够训练 10 倍大的模型：ZeRO-Offload背后的核心技术是在ZeRO-2的基础上将优化器状态和梯度卸至CPU内存，通过同时利用GPU和宿主CPU的计算和存储资源，提升了较少的GPU资源下可以高效训练的最大模型规模。

通过 DeepSpeed Sparse Attention 用6倍速度执行10倍长的序列： DeepSpeed提供了sparse attention kernel ——一种工具性技术，它可以支持长序列的模型输入，包括文本输入，图像输入和语音输入。与经典的稠密 Transformer 相比，它支持的输入序列长一个数量级，并在保持相当的精度下获得最高 6 倍的执行速度提升。但由于该技术仅支持A100显卡，因此现有的实验环境暂时无法将该技术投入公司应用。

OneBitAdam 减少 5 倍通信量： Adam 是一个在大规模深度学习模型训练场景下的高效的（也许是最广为应用的）优化器。然而，它与通信效率优化算法往往不兼容。因此DeepSpeed将误差补偿压缩的方法与Adam优化器相结合，提供了OneBitAdam优化器，大大减少了通信量并提升了训练速度。

b. ZeRO

DeepSpeed提供了ZeRO内存优化技术供用户使用。ZeRO主要是参考了Megatron-LM中张量并行的思想，对训练过程中的优化器状态、梯度、模型参数进行分区，减少了冗余内存，实现了内存的优化。以下是DeepSpeed配置中Zero参数Stage的含义：

zero_stage=0表示禁用ZeRO；

zero_stage=1表示启用优化器状态分区；

zero_stage=2表示启用优化器状态分区和梯度分区；

zero_stage=2表示启用优化器状态分区、梯度分区和参数分区。

c. 模型简介：opt-1.3b

为了使得测试过程中获取实验结果的效率更高，基于DeepSpeed框架进行的实验采用的模型是opt-1.3b，接下来对该模型进行简要介绍。OPT（Open Pre-trained Transformer Language Models）是由FaceBook的研究人员发布并开源的大语言模型，其参数规模高达1750亿，与GPT-3几乎一样。由于GPT-3并未开源，使得研究人员无法对这个强大的模型进行进一步探索，在这样的背景下，OPT模型诞生了，其完成任务的水平几乎与GPT-3的水平一致。OPT模型版本如表格所示：

d. 数据集简介：Dahoas/rm-static

用于opt-1.3b有监督精调的数据集为rm-static，其数据样本如下表所示。由于有监督微调以问答对的形式进行指令对齐，因此样本需要以问答对的形式出现。其中，Promp表示给定的上下文或情境，是对话或文本的背景信息，可以帮助模型更好地理解对话或者文本的语义语境；Response则表示模型需要生成的回复或文本，是模型需要预测的目标。

2. DeepSpeed调参实验

为了获取适用于实验环境的DeepSpeed参数，为后续实验提供参考，我们进行了基于DeepSpeed框架的调参实验。为了使得测试过程中获取实验结果的效率更高，我们选取了参数较少的模型opt-1.3b进行实验，测试其有监督微调的实验过程。调参实验主要分为两大部分，分别为基于OneBitAdam优化器相关参数的调参实验和基于ZeRO相关参数的调参实验，下面将对其进行详细介绍。

a. OneBitadam

大模型（如 BERT 和 GPT-3）的扩展训练需要基于模型设计，体系结构和系统功能的细致优化。从系统的角度来看，通信效率已成为主要的瓶颈。解决该问题需要压缩通信，而压缩通信的最有效方法之一是误差补偿压缩，即使在1比特压缩下，它也可以提供稳定的收敛速度。但是，最新的误差补偿技术仅适用于一些和梯度线性相关的简单优化器，例如随机梯度下降（SGD）和 Momentum SGD。这些技术无法和 Adam 之类的非线性优化器整合，后者在许多任务（包括训练类似 BERT 的模型）中带来了最好的收敛率和精度。

因此DeepSpeed提供了OneBitAdam优化器，它是DeepSpeed博客中介绍的4大亮点之一。博客中介绍到，他能够减少5倍的通信量并提升3.4倍的训练速度,因此我们基于该优化器进行了实验，观察GPU Memory-Usage和CurrSamplesPerSec能否取得提升。

ⅰ. 实验结果

ⅱ. 实验结论

OneBitAdam优化器主要影响的是模型的训练过程，对于GPU Memory-Usage(GiB)、CurrSamplesPerSec这些关键参数影响不大。

b. ZeRO

在调参实验中，我们先对ZeRO相关的所有参数做了一次实验，单次实验只改变一个实验参数，最后锁定了与zero_stage=3相关的三个参数以及参数reduce_bucket_size，针对这些参数进行了一系列调参实验。在各个调参实验中，针对各个参数示例代码中的值以及官方文档中的默认值确定实验参数变化的上下阈值，再在实验过程中找出一个变化约呈线性的范围，观察实验结果。最后确定一个GPU内存使用较小，每秒钟处理的样本数又较多的值作为后续试验的参考值。

ⅰ. stage3_param_persistence_threshold

stage3_param_persistence_threshold表示进行参数分区时，当参数量小于该阈值，则不进行参数分区，参数量高于该阈值才进行参数分区。因此较小的值使用较少的内存，但可以大大减少通信代价。以下是基于该参数进行调参实验获得的实验结果：

ⅱ. stage3_max_live_parameters

stage3_max_live_parameters表示释放前每个GPU允许驻留的最大参数数量。较小的值使用较少的内存，但执行更多的通信。以下是基于该参数进行调参实验获得的实验结果：

ⅲ. stage3_prefetch_bucket_size

stage3_prefetch_bucket_size表示用于预取参数的缓冲区的参数数量。较小的值使用较少的内存，但可能会因通信而增加停顿。以下是基于该参数进行调参实验获得的实验结果：

ⅳ. reduce_bucket_size

除了以上三个参数外，还对参数reduce_bucket_size进行了调参实验，该参数表示一次reduced/allreduced的元素数量。限制大模型进行allgather所需的内存。以下是基于该参数进行调参实验获得的实验结果：

c. 实验结论

ZeRO相关参数调参实验结论：stage3_param_persistence_threshold、stage3_max_live_parameters、reduce_bucket_size等参数对内存影响较大，当内存遇到out of memory的情况时可以适当调节以上参数使得程序能够正常进行。最后的参数确定为如下值：

3. DeepSpeed工具模块的探索学习

a. Autotuning

ⅰ. 功能概述

Autotuning是DeepSpeed提供的一个可用于自动参数调节的工具库，但是其可自动调节参数较少，仅包括ZeRO stage, micro-batch size per GPU和ZeRO configurations (offloading is not yet supported)。要想得到更细致的调参结果，还需依赖于人工调参实验。

ⅱ. 运行结果

目前的实验条件显存不足，暂时无法调用该工具库

b. Flops Profiler

ⅰ. 功能概述

DeepSpeed Flops Profiler 是由DeepSpeed提供的一个分析器，可帮助用户测量模型及其子模块的模型训练/推理速度（延迟、吞吐量）和效率（每秒浮点运算数，即 FLOPS），着眼于消除现有实验中的低效率问题。DeepSpeed Flops Profiler 能够输出模型的参数数量、浮点运算 (flops)、FLOPS、延迟和吞吐量（以样本/秒为单位），帮助用户调整训练或推理设置以获得更好的性能。用户可以了解每个层或子模块如何对整体模型复杂性/性能做出的贡献，从而调整或重构模型设计以提高性能。例如，使用分析器，DeepSpeed 用户可以定量地判断堆叠较小的层是否比堆叠较大的层更轻或性能更高。

ⅱ. 实验结果

以下为调用该工具的效果截图。该分析工具能输出对一些基本信息的概述，还同时也会显示在不同模型深度下参数量、加乘运算或前向计算延迟排名前1的模块。

c. Data Efficiency

ⅰ. 功能概述

DeepSpeed 数据效率库是一个可组合框架，可以更好地利用数据、提高训练效率并提高模型质量。DeepSpeed Data Efficiency 考虑了可扩展性、灵活性和可组合性，具体体现了以下创新：通过课程学习进行有效的数据采样；提出了一种称为随机分层令牌丢弃（随机LTD）的新颖数据路由技术，以跳过所有中间层输入令牌子集的计算。

其中，课程学习旨在通过在训练过程中较早地呈现相对容易或更简单的示例来提高训练收敛速度。要运用课程学习，共包含三个应用步骤，分别是数据分析、预训练、评估/微调。

而 random-LTD是一种随机且分层的token丢弃机制，它仅处理所有中间层的整个数据批次中的token子集，以节省计算成本。

实现难点：由于课程学习的应用步骤并非并列的关系，且现有的实验环境不足以支持模型的预训练，因此该工具无法直接用于微调，仅作了解。

4. DeepSpeed双机四卡的有监督微调实验

代码在A和B服务器上都有部署。该实验使用的是Dahoas/rm-static数据集对opt-1.3b模型进行有监督微调，使用的虚拟环境为peft，共跑通了两组多机并行实验：

双机双卡：A：GPU1@B：GPU1

双机四卡：A：GPU0，GPU1@B：GPU0，GPU1

a. 如何运行脚本文件

ⅰ. 打开防火墙端口以便双机通信，在终端输入以下命令：

sudo firewall-cmd --zone=public --add-port=33000-65000/tcp --permanent

sudo firewall-cmd --reload

ⅱ. 确定要使用的GPU，修改parallelism_main_sft.sh

ⅲ. 直接在终端运行./parallelism_main_sft.sh。

ⅳ. 为保证服务器安全，实验结束后需要关闭端口，在终端输入以下命令：

sudo firewall-cmd --zone=public --remove-port=33000-65000/tcp --permanent

sudo firewall-cmd --reload

b. 多机环境配置问题汇总

ⅰ. ssh免密通信配置（参考：https://www.cnblogs.com/zpzp7878/p/10466973.html）

本机的sshkey也要拷贝到自己的authorized_keys中，步骤与上一条所述相同（可做可不做），我做到上一步已经可以实现ssh免密通信。

ⅱ. hostfile的编辑

直接写ip地址，不需要写server1、server2，其中slots表示每台服务器上可用的GPU个数

ⅲ. nccl通信问题

要想详细查看NCCL的日志输出从而锁定问题，需要配置环境变量NCCL_DEBUG，在.bash文件头加上环境变量：

export NCCL_DEBUG=INFO：

export NCCL_SOCKET_IFNAME=eth1,eno2

则在程序运行的过程中会依次找名字为eth1，eno2的网卡。

查看防火墙状态：这会显示防火墙是否正在运行以及当前的防火墙策略；

- systemctl status firewalld

查看防火墙规则：这会列出当前设置的防火墙规则，包含被允许通信的端口。

- firewall-cmd --list-all

其余防火墙配置参考本节 a（i）即可。

c. 实验结果

以下为基于DeepSpeed框架，采用Dahoas/rm-static对opt-1.3b模型进行有监督微调获得的实验结果：

实验结论：使用单机双卡每秒钟处理的样本数为10.1。由于通讯的问题，使用双机双卡会使得每秒钟处理的样本数约为单机双卡的一半；双机四卡相较于双机双卡会使得每秒钟处理的样本数有所提升，但并非呈线性增长；双机四卡相较于双机双卡每块GPU消耗显存有所减少。

5. 基于现有实验环境对于LORA精调全参数微调llama2-7b的测试实验

掌握了DeepSpeed多机并行的运行方法后，我们结合现有的实验环境，进行了一系列测试实验，为后续实验以及算力资源的购置提供参考。

a. opt-1.3b的全参数微调测试

ⅰ. 实验结果

ⅱ. 实验结论

若不启用ZeRO-Offload技术，以现有的实验资源无法进行opt-1.3b的全参数微调。

b. llama2-7b的全参数精调测试

ⅰ. 实验结果

ⅱ. 实验结论

以现有的实验资源无法进行llama2-7b的全参数微调。

c. llama2-7b的LORA精调测试（max_seq_len=1024）

ⅰ. 实验结果

ⅱ. 实验结论

以现有的实验资源，若固定max_seq_len=1024，则无法进行llama2-7b的全参数微调。

d. llama2-7b的LORA精调测试（改变max_seq_len）

ⅰ. 实验结果

在实验过程中，固定batch_size=1，改变最大序列长度max_seq_len，测试在不同的zero_stage、不同的卡数下不同微调方法能够支持最大的序列长度。

ⅱ. 实验结论

从表格中我们可以看到，对于llama2-7b模型，除zero_stage为0以外，单机单卡对该模型进行LORA精调支持的最大长度都为256，zero_stage为1或2时，单机双卡和双机四卡对llama2-7b模型进行LORA精调的最大长度都为512。而对于llama2-7b模型的全参数训练，现有的实验环境双机四卡也无法实现。

现有的实验环境仅支持llama2-7b模型的LORA精调，且训练中最大序列长度仅为512；只有当train_micro_batch_size_per_gpu为1时，精调才能够运行起来，但同时每秒钟能处理的样本数也极小。

BUUCTF [b01lers2020]little_engine 皮皮蟹！ BUUCTF
1.拿到文件，进入主函数：这个是动调之前的主函数，开始动调：其中，已知字符串已经给出，为unk_5617CE521220，一共300位：进入加密函数sub_5608DAAB8510：通过多次动态调试，得到了加密算法的逻辑。看判断函数sub_5608DAAB85A0：综上，写出加密脚本：a=[0xE1,0xE
几种不同数据采集的概念：遥测、遥控、遥信、遥调、遥视、遥感 CServer_01 big data 物联网
遥测、遥控、遥信、遥调、遥视、遥感、遥视：这几种技术在概念上容易混淆，在数据自动采集中常常用到，各自有不同的用途，下面加以简述：遥测(Telemetry)：通过远程传输数据来监测远程系统中的各种物理量。如:电压、电流、频率等，数据通过远程系统种的传感器、PLC等方式获取后传输到远方。遥信(Teleprotection):通过远程传输信号来传递系统状态和故障信息。如:当发生故时，遥信系统可以远程传输
2025年蛇年新版运势系统源码网友阿贵源码 phpstorm vscode php vue html css3
八字精批、事业财运、姓名分析、宝宝起名、公司测名、姓名配对、综合详批、姻缘测算、生肖运势、PC版测算、八字合婚、紫微斗数、流年运程、月老姻缘、许愿祈福、号码解析、塔罗运势、脱单占卜、感情继续、脱单占卜、塔罗爱情、心理有你、能否复合、暗恋对象、是否分手、爱着别人、大师服务（包含多项功能）共计30余项功能，全网功能全，完善的版本。演示图：新版运势测算源码：下载此处内容作者设置了回复可见原文链接：202
Python酷库之旅-第三方库Pandas(036) 神奇夜光杯 python pandas 开发语言人工智能 excel 学习与成长基础知识
目录一、用法精讲111、pandas.Series.item方法111-1、语法111-2、参数111-3、功能111-4、返回值111-5、说明111-6、用法111-6-1、数据准备111-6-2、代码示例111-6-3、结果输出112、pandas.Series.xs方法112-1、语法112-2、参数112-3、功能112-4、返回值112-5、说明112-6、用法112-6-1、数据准备
VSCode：deepspeed调试【.vscode/launch.json配置】 u013250861 图神经网络 #LLM/训练 vscode ide 编辑器
在控制台利用whichdeepspeed找到deepspeed路径：/home/wyr/anaconda3/envs/rlhf/bin/deepspeed{//使用IntelliSense了解相关属性。//悬停以查看现有属性的描述。//欲了解更多信息，请访问:https://go.microsoft.com/fwlink/?linkid=830387"version":"0.2.0","confi
C、C++、Java到Python，编程入门学习什么语言好? 明天会比今天更好 C/C++编程入门编程语言程序员
最近，TIOBE更新了7月的编程语言榜单，常年霸榜的C、Java和Python依然蝉联前三位。万万没想到的是，R语言居然冲到了第八位，创下了史上最佳记录。而且后续随着业内对数据统计和挖掘需求的上涨，R语言热度颇有些势不可挡的架势。然而作为程序员吃饭的工具，编程语言之间也形成了某种鄙视链，各大论坛里弥漫着剑拔弩张的气氛，众口难调。也难怪有很多初学者会有疑惑，为什么会有这么多编程语言，我到底应该学什么
实战LLM强化学习——使用GRPO（DeepSeek R1出圈算法） FF-Studio DeepSeek R1 算法语言模型人工智能自然语言处理机器学习
——关于使用Unsloth库、LoRa微调及GRPOTrainer自定义奖励函数实现“只输出10个英语单词”的探索为什么要进行“只输出10个英文单词”的极端尝试？在大模型的训练或微调当中，大多数场景我们都希望它能“自由发挥”，给出越丰富越好的答案。但，为了更好的理解强化学习在LLM训练过程中发挥的意义，也为了学习GPRO这个强化学习算法，笔者出此题目，方便大家学习理解。GRPO（GroupRela
比较EFI和BIOS weixin_33948416
文章太长，有很多人会看不进去。在这个浮躁的社会里，能够把一本书逐字阅读已经变成了一种奢侈，尤其是现在大行其道的速读阅读法，讲究快即是美。而技术来不得半点取巧，需要一点点的读，一点点的思考和吸收，浮躁了，你就变成啥也懂，啥也不精的伪专家。一个显著的区别就是EFI是用模块化，C语言风格的参数堆栈传递方式，动态链接的形式构建的系统，较BIOS而言更易于实现，容错和纠错特性更强，缩短了系统研发的时间。它运
用自然语言与mysql数据库对话几种方案的思考闲云野鹤_SG 数据库 mysql AI text2sql 自然语言本地部署大模型
如何用自然语言与mysql数据库对话,而不是用sql语句去查询数据库?处于安全考虑,可训练一个本地大语言模型来完成此项任务,mysql服务器中的数据大约有两万多条记录,服务器的作用主要是记录设备的出库和回库的流水账(即以时间为序的记录),但有一些sql查询比较复杂,必须根据特定的sql语句查询,否则很难得到准确稳定的答案,调试和训练大模型的方法有多种方式,比如lora训练模型,提示词方式,rag方
Python酷库之旅-第三方库Pandas(005) 神奇夜光杯 python pandas 开发语言标准库及第三方库基础知识学习和成长
目录一、用法精讲7、pandas.read_clipboard函数7-1、语法7-2、参数7-3、功能7-4、返回值7-5、说明7-6、用法7-6-1、代码示例7-6-2、结果输出8、pandas.DataFrame.to_clipboard函数8-1、语法8-2、参数8-3、功能8-4、返回值8-5、说明8-6、用法8-6-1、代码示例8-6-2、结果输出9、pandas.read_excel函
敏捷管理随记未定义的半分醒项目管理职场和发展学习经验分享
敏捷随记精益生产的基本思想精益生产起源于日本丰田汽车公司的生产方式，精益管理的本质是通过消除各种形式的浪费,不断提升价值流效率。精益生产的基本思想—及时生产（JIT）精：少而精，不投入多余的生产要素，只在适当时间生产必要的产品。益：所有经营活动有益有效，具有经济意义（产出）。及时生产,即JustInTime（JIT）：可译为“旨在需要的时候，按需要的量，生产所需的产品”。有些管理专家也称精益生产方
TPA注意力机制详解及代码复现清风AI 深度学习算法详解及代码复现深度学习人工智能 python 神经网络算法机器学习
基本原理在深入探讨TPA注意力机制的数学表达之前，我们需要先理解其基本原理。TPA注意力机制是一种创新的注意力机制，旨在解决传统注意力机制在处理大规模数据时面临的内存和计算效率问题。TPA注意力机制的核心思想是利用张量分解来压缩注意力机制中的Q、K、V表示，同时保留上下文信息。这种方法类似于一种“动态的LoRA”，通过巧妙的数学变换，在不牺牲性能的前提下大幅降低了模型的内存需求。TPA注意力机制的
Springboot实现多数据源整合的两种方式咸猪手呆呆 java 开发语言后端
一、前言大家好，我是小诚，不知不觉上一次更文已经是20多天前了！其实这段时间也一直没有闲着，一个是在梳理之前的文章知识和资源，用于搭建技术圈子，另外一个就是在思考自己的一个输出方向，社区发展得很迅速，热榜各种各类的文章都有，深思熟虑后，还是坚持文章在精不在多，质量标准更加重要，所以今后博文的方向会更加偏向实战和经验，争取分享更加有价值的博文！如果文章对你有帮助，可以帮忙一键三连和专栏订阅哦！技术圈
lorawan服务器通信协议,LoRaWAN网络架构和解决方案介绍胡晓晴 lorawan服务器通信协议
一个LoRaWAN典型的网络架构中包含了终端、基站、NS(网络服务器)、应用服务器这四个部分。基站和终端之间采用星型网络拓扑，由于LoRa的长距离特性，它们之间得以使用单跳传输。基站则对NS和终端之间的LoRaWAN协议数据做转发处理，将LoRaWAN数据分别承载在了LoRa射频传输和UDP上。如下是LoRaWAN典型的网络架构图：厦门四信提供LoRaWAN系列完整的终端(模块)、网关、服务器通信
Hive全面解析精讲绿萝蔓蔓绕枝生 hive 数据库大数据 Hive精讲
目录一、Hive概述1、定义2、起源3、Hive的优势和特点4、Hive下载安装二、Hive的命令行模式1、Hive命令行模式2、Beenline命令行模式三、Hive的交互模式1、Hive元数据管理1、Hive交互模式2、Beeline交互模式3、交互模式操作四、Hive数据1、数据库(Database)2、数据表3、Hive数据类型4、Hive数据结构5、HQL五、Hive建表语句1、默认分隔
Python酷库之旅-第三方库Pandas(189) 神奇夜光杯 python pandas 开发语言人工智能标准库及第三方库 excel 学习与成长
目录一、用法精讲876、pandas.Index.duplicated方法876-1、语法876-2、参数876-3、功能876-4、返回值876-5、说明876-6、用法876-6-1、数据准备876-6-2、代码示例876-6-3、结果输出877、pandas.Index.equals方法877-1、语法877-2、参数877-3、功能877-4、返回值877-5、说明877-6、用法877-
MATLAB算法实战应用案例精讲-【优化算法】蘑菇繁殖优化算法(MRO)(附MATLAB代码实现) 林聪木 matlab 开发语言
目录前言算法原理算法思想算法步骤优缺点带模糊需求的开放式选址路径问题的混合离散蘑菇繁殖算法１ＯＬＲＰ⁃ＦＤ模型１.１可信度理论１.２问题描述１.３模型２求解ＯＬＲＰ⁃ＦＤ的混合离散蘑菇繁殖算法２.２初始化２.３改进蘑菇繁殖算法２.４随机模拟程序２.５ＨＤＭＲＯ算法流程基于改进蘑菇繁殖算法的机器人路径规划机器人路径规划方法研究现状路径规划方法传统路径规划方法智能路径规划方法机器人群体系统结构分布式结
终于把前后端sm加解密以及加签验证调通了。清风孤客前端 javascript spring java spring boot
终于把前后端sm加解密以及加签验证调通了！领导要求我对项目的数据传输安全考虑下，因此就想到了对敏感字段做加密和对请求、响应做数字签名验证。网上看了很多文章，可能是因为我对加密这块不了解，感觉都比较乱。所以前前后后花了4天才把前后端调通。特地写一篇文章记录下流程。这里使用的是sm国密算法。不对的地方请读者评论指出。1.简单说明：前端使用sm-crypto库后端加密库使用bc库，架构上使用aop，注解
Go-并行编程新手指南 jimiStephen golang 开发语言后端
Go并行编程新手指南在Go语言中，并行编程是充分利用多核CPU资源、提升程序性能的重要手段。它的核心概念包括goroutine和channel，这些特性使得Go在处理并发任务时表现出色。goroutine：轻量级的并发执行单元goroutine是Go并行编程的基础。它类似于线程，但更为轻量级。与传统线程相比，创建和销毁goroutine的开销极小，且栈空间可按需动态增长。在Go语言中，只需在函数调
2024 年，CloudCanal 做了 3 件事... ClouGence CloudCanal 数据库 elasticsearch oracle postgresql
CloudCanal的2024，稳扎稳打，开拓创新。这一年里，CloudCanal依旧保持稳定的更新频率，共发布13个版本，CloudCanal本年度累计开发170+项新特性，完成120+处功能优化，修复大大小共220+个bug，在功能完备性和稳定性方面有了质的飞跃。每一次版本更新，都是产品精益求精的见证，也是吸引用户长期使用的基础。总结起来，CloudCanal一共做了3件事。P.S文后有彩蛋丰
Python酷库之旅-第三方库Pandas(138) 神奇夜光杯 python pandas 开发语言人工智能标准库及第三方库 excel 学习与成长
目录一、用法精讲621、pandas.plotting.lag_plot方法621-1、语法621-2、参数621-3、功能621-4、返回值621-5、说明621-6、用法621-6-1、数据准备621-6-2、代码示例621-6-3、结果输出622、pandas.plotting.parallel_coordinates方法622-1、语法622-2、参数622-3、功能622-4、返回值62
【微服务与分布式实践】探索 Sentinel Forest 森林微服务与分布式实践 sentinel
参数设置熔断时长、最小请求数、最大RTms、比例阈值、异常数熔断策略慢调⽤⽐例当单位统计时⻓内请求数⽬⼤于设置的最⼩请求数⽬，并且慢调⽤的⽐例⼤于阈值，则接下来的熔断时⻓内请求会⾃动被熔断异常⽐例当单位统计时⻓内请求数⽬⼤于设置的最⼩请求数⽬，并且异常的⽐例⼤于阈值，则接下来的熔断时⻓内请求会⾃动被熔断异常数当单位统计时⻓内的异常数⽬超过阈值之后会⾃动进⾏熔断熔断规则熔断条件接口异常率超过10%，
ESP32 之 ESP-IDF 教学（十二）WiFi篇—— LwIP 之 TCP 通信 Augtons正(单片机) ESP32 教学专栏 (基于ESP-IDF)udp tcp/ip 单片机物联网 c语言
本文章来自原创专栏《ESP32教学专栏(基于ESP-IDF)》，讲解如何使用ESP-IDF构建ESP32程序，发布文章并会持续为已发布文章添加新内容！每篇文章都经过了精打细磨！↓↓↓通过下方对话框进入专栏目录页↓↓↓CSDN请求进入目录_Ox是否进入ESP32教学导航(基于ESP-IDF)?确定文章目录一、建立连接——ESP32作TCPClient客户端1.TCPClient的基本思路2.TCPC
日志收集Day008 ccnnlxc java 开发语言
1.zk集群优化修改zookeeper的堆内存大小，一般情况下，生产环境给到2G足以，如果规模较大可以适当调大到4G。(1)配置ZK的堆内存vim/app/softwares/zk/conf/java.envexportJAVA_HOME=/sortwares/jdk1.8.0_291exportJVMFLAGS="-Xms256m-Xmx256m$JVMFLAGS"EOF(2)同步文件到其他节点
湿度传感器pcb遇到的问题司端杨
画湿度传感器pcb遇到的问题：1.lora模块封装画反了。由于在布局时，使用快捷键X使被选中的器件左右对调，导致封装反了。重新调整lora模块部分布局。再画pcb时要注意快捷键X、Y的使用（X：被选中的器件左右对调；Y:被选中的器件上下对调）。2.去耦电容的位置摆放：几乎所有芯片的电源和地之间都会放置去耦电容，作用有两个，其一是滤除沿电源传导过来的高频干扰，其二是及时补充器件高速工作时所需的尖峰电
华为OD机试C卷-- 精准核酸检测（Java & JS & Python & C）飞码创造者华为OD机试题库华为od c语言 java javascript python
获取题库不需要订阅专栏，可直接私信我进入CSDN领军人物top1博主的华为OD交流圈观看完整题库、最新面试实况、考试报告等内容以及大佬一对一答疑。题目描述为了达到新冠疫情精准防控的需要，为了避免全员核酸检测带来的浪费，需要精准圈定可能被感染的人群。现在根据传染病流调以及大数据分析，得到了每个人之间在时间、空间上是否存在轨迹交叉。现在给定一组确诊人员编号（X1,X2,X3,…,Xn），在所有人当中，
2024年华为OD机试E卷- Boss的收入-（Java&c++&Python） ai因思坦华为OD机试2024真题题库华为od c++开发语言矩阵算法 python java
最新华为OD机试考点合集：华为OD机试2024年真题题库（E卷+D卷+C卷）_华为od机试题库-CSDN博客每一题都含有详细的解题思路和代码注释，精编c++、JAVA、Python三种语言解法。帮助每一位考生轻松、高效刷题。订阅后永久可看，发现新题及时跟新。题目描述：一个XX产品行销总公司，只有一个boss，其有若千一级分销，一级分销又有若干二级分销，每个分错只有唯一的上级分销。规定，每个月
在亚马逊云科技上用Stable Diffusion 3.5 Large生成赛博朋克风图片（上）佛州小李哥 AWS技术科技 stable diffusion 人工智能亚马逊云科技 aws ai 语言模型
背景介绍在2024年的亚马逊云科技re:Invent大会上提前预告的StableDiffusion3.5Large，现在已经在AmazonBedrock上线了！各位开发者们现在可以使用该模型，根据文本提示词文生图生成高质量的图片，并且支持多种图片风格生成，助力媒体、游戏、广告和零售等行业的开发者们加速概念艺术、视觉特效以及精修产品宣传图的生成创作。2024年10月，图像生成模型厂商Stabilit
Python 安装库报错 “python setup.py egg_info did not run successfully.“ SmallerFL 其他问题 fix Mac 环境设置安装 Python相关 python 开发语言人工智能 nlp
文章目录1.Python安装库报错2.问题解决3.参考1.Python安装库报错有时Python用pipinstall安装库的时候会报错，pythonsetup.pyegg_infodidnotrunsuccessfully.，我在安装deepspeed报错示例如下：Preparingmetadata(setup.py)...errorerror:subprocess-exited-with-er
ARM中的寄存器 lexc_ arm开发
ARM处理器具有一组**通用寄存器**和**专用寄存器**，这些寄存器被用于存储数据、地址以及处理器状态等信息。根据ARM架构的不同版本，寄存器的数量和用途略有差异。这里介绍的是典型的**ARM架构v7（ARM32位）**中的寄存器结构。1.通用寄存器ARM有16个通用寄存器，分别命名为R0到R15，其中R13到R15有特殊用途。-R0-R12：这些是通用寄存器，通常用于存储数据、临时值以及函数调
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS

基于DeepSpeed对 llama2-7b的LORA精调

你可能感兴趣的:(llama2-7b,DeepSpeed,LORA精调)