onlyfansnft.art

LoRA 的学习笔记

什么是 LoRA 模型

LoRA 的全称是 LoRA: Low-Rank Adaptation of Large Language Models，是一种以极低资源微调大模型的方法，其来自于论文 LoRA: Low-Rank Adaptation of Large Language Models ¹。

LoRA 的核心思想是冻结预训练的模型权重，并将可训练的秩分解矩阵注入 Transformer 架构的每一层，从而大大减少了下游任务的可训练参数数量。相比于完全微调，LoRA 可以节省显存、提高训练速度、减少推理延迟，并且保持或提升模型质量。

LoRA 可以应用于自回归模型（如 GPT 系列）和 Encoder-Decoder 模型（如 T5），并且可以与不同规模的预训练模型（如 RoBERTa, DeBERTa, GPT-2, GPT-3）兼容。

LoRA 的原理和实现

大模型微调的困境

随着模型规模的不断扩大，模型会“涌现”出各种能力。特别是对大语言模型 (LLM) 来说，随着规模的扩大其在 zero-shot、常识推理等能力上会有大幅度的提高。

但是，大模型的微调成本和部署成本也非常高。例如，GPT-3 175B 模型微调需要 1.2TB 的显存。此外，若针对不同下游任务微调多个模型，那么就需要为每个下游任务保存一份模型权重，成本非常高。在某些场景下，甚至可能需要针对不同的用户微调不同的模型，那么模型微调和部署的成本将不可接受。

因此，如何降低大模型微调和部署成本，将是大模型商用的重要一环。

LoRA 之前的方法

在 LoRA 方法提出之前，也有很多方法尝试解决大模型微调困境的问题。其中有两个主要的方向：

添加 adapter 层；
使用 prefix-tuning。

但是这两种方法都有局限性：

Adapter 层会引入推理时延。简单来说，它的主要思想是在预训练模型的每一层 Transformer 中插入一个小的可训练的模块，称为 adapter。这样可以保持预训练模型的权重不变，只更新 adapter 的参数，从而实现参数高效和灵活的迁移学习12。
Prefix-tuning 难以优化。prefix-tuning 方法是受语言模型 in-context learning 能力的启发，只要有合适的上下文则语言模型可以很好地解决自然语言任务。但是，针对特定的任务找到离散 token 的前缀需要花费很长时间，prefix-tuning 提出使用连续的 virtual token embedding 来替换离散 token。这些 virtual token embedding 需要作为可训练参数进行优化，而且会减少下游任务的序列长度。

LoRA 的方法

LoRA 为了更加参数高效，使用相对非常小的参数 $\Theta$ 来表示任务相关的参数增量 $\Delta\Phi=\Delta\Phi (\Theta)$ ，其中 $|\Theta|\ll |\Phi_0|$ 。寻找 $\Delta\Phi$ 的任务就变成对 $\Theta$ 的优化：

$\max_ {\Theta}\sum_ { (x,y)\in\mathcal {Z}}\sum_ {t=1}^ {|y|}\log (p_ {\Phi_0+\Delta\Phi (\Theta)} (y_t|x,y_ {Θmax(x,y)∈Z∑t=1∑∣y∣log(pΦ0+ΔΦ(Θ)(yt∣x,y<t))$

LoRA 将会使用低秩表示来编码 $\Delta\Phi$ ，同时实现计算高效和存储高效。当预训练模型是 175B GPT-3，可训练参数 $|\Theta|$ 可以小至 $|\Phi_0|$ 的 0.01% 。

对于预训练权重矩阵 $W_0\in\mathbb {R}^ {d\times k}$ ，可以通过低秩分解来表示其更新 $W_0+\Delta W=W_0+BA，B\in\mathbb {R}^ {d\times r},A\in\mathbb {R}^ {r\times k}$ 且秩 $r\ll\min (d,k)$ 。在训练过程中， $W_0$ 被冻结且不接受梯度更新， $A$ 和 $B$ 则是可训练参数。注意， $W_0$ 和 $\Delta W=BA$ 都会乘以相同的输入。对于 $h=W_0x$ ，前向传播变为：

$h=W_0x+\Delta Wx=W_0x+BAx$

对矩阵 $A$ 使用随机高斯初始化，对矩阵 $B$ 使用 0 进行初始化，因此 $\Delta W=BA$ 在训练的开始为 0。使用 $\frac {\alpha} {r}$ 来缩放 $\Delta Wx$ 。当使用 Adam 优化时，经过适当的缩放初始化，调优 $\alpha$ 与调优学习率大致相同。

当进行部署时，以显式的计算和存储 $W=W_0+BA$ ，并正常执行推理。 $W_0$ 和 $B A$ 都是 $\mathbb {R}^ {d\times k}$ 。当需要转换至另一个下游任务，可以通过减去 $B A$ 来恢复 $W_0$ ，然后添加不同的 $B^{'} A^{'}$ 。

LoRA 的实验结果和分析

LoRA 的实验设置

论文中使用了四种不同规模的预训练模型：RoBERTa-base, DeBERTa-base, GPT-2-medium, GPT-3-175B。其中前两种是 Encoder 模型，后两种是 Decoder 模型。

论文中使用了八个下游任务：SQuAD v1.1, SQuAD v2.0, CoQA, RACE, MNLI, SST-2, QQP, QNLI。其中前四个是机器阅读理解任务，后四个是 GLUE 任务。

论文中将 LoRA 与以下方法进行了比较：

Full fine-tuning：完全微调所有参数；
Adapter：在每一层 Transformer 中添加 adapter 层；
Prefix-tuning：在每一层 Transformer 中添加 virtual token embedding；
Freeze：冻结所有参数，只微调输出层。

论文中使用了两种评价指标：模型质量和推理时延。模型质量使用 F1 或者准确率来衡量。推理时延使用单个 GPU 上的推理时间来衡量。

LoRA 的实验结果

论文中给出了各种方法在不同任务上的模型质量和推理时延的结果。这里只展示部分结果，完整结果可以参考原论文。

RoBERTa-base 在 GLUE 上的结果

LoRA 在模型质量上与 full fine-tuning 相当或者更好，并且远超过其他方法。同时，LoRA 的推理时延与 full fine-tuning 和 freeze 相同，并且比 adapter 和 prefix-tuning 小很多。

LoRA 的分析和讨论

论文中还对 LoRA 的一些性质和特点进行了分析和讨论，这里只简要介绍一些，完整内容可以参考原论文。

LoRA 的秩选择。论文中发现，对于不同的预训练模型和下游任务，LoRA 的最优秩是不同的。一般来说，秩越大，模型质量越高，但是也会增加计算和存储的开销。论文中提供了一些经验性的秩选择方法，例如根据预训练模型的层数或者下游任务的难度来选择秩。
LoRA 的初始化。论文中发现，对于 LoRA 的低秩矩阵 $A$ 和 $B$ ，使用随机高斯初始化 $A$ ，使用 0 初始化 $B$ 是比较合理的。这样可以保证 $\Delta W=BA$ 在训练开始时为 0，不会影响预训练模型的权重。同时，使用 $\frac {\alpha} {r}$ 来缩放 $\Delta Wx$ 可以避免过大或过小的梯度更新。
LoRA 的有效性。论文中通过实验发现，预训练模型在适应下游任务时，其权重更新具有低秩的特性。也就是说，只需要少量的参数就可以实现较大的性能提升。这也说明了 LoRA 的设计思想是合理的。

LoRA 的优缺点

根据论文和网上的一些资料²³，我们可以总结出 LoRA 模型的一些优缺点：

优点

参数高效。LoRA 只需要少量的可训练参数就可以实现与完全微调相当或更好的模型质量。这样可以节省显存、提高训练速度、减少存储空间。
推理高效。LoRA 不会增加额外的推理时延，因为它只是在预训练模型的权重上加上一个低秩矩阵，并不改变模型的结构和计算流程。
通用性强。LoRA 可以应用于自回归模型和 Encoder-Decoder 模型，并且可以与不同规模的预训练模型兼容。
灵活性强。LoRA 可以通过调整低秩矩阵的秩来平衡模型质量和计算开销。同时，LoRA 可以通过减去低秩矩阵来恢复预训练模型的权重，并添加不同的低秩矩阵来适应不同的下游任务。

缺点

秩选择困难。LoRA 的低秩矩阵的秩对于模型质量和计算开销都有影响，但是没有一个统一的方法来确定最优的秩。需要根据不同的预训练模型和下游任务进行尝试和调整。
初始化敏感。LoRA 的低秩矩阵的初始化对于模型的收敛和性能都有影响，需要使用合适的初始化方法和缩放因子。如果初始化不当，可能会导致模型无法收敛或者性能下降。
低秩假设不一定成立。LoRA 的设计基于一个假设，即预训练模型在适应下游任务时，其权重更新具有低秩的特性。这个假设在一些实验中得到了验证，但是也可能存在一些反例，即需要较高秩的权重更新才能实现较好的模型质量。

LoRA 的应用场景

LoRA 模型作为一种以极低资源微调大模型的方法，可以应用于以下一些场景：

需要使用大规模预训练语言模型来解决特定的自然语言处理任务，例如机器阅读理解、文本摘要、文本分类等，但是又受限于硬件资源或者成本预算的场景。
需要根据不同的用户或者领域来定制化大规模预训练语言模型的生成风格或者内容，例如对话系统、文本生成、文本风格转换等，但是又不想为每个用户或者领域保存一份完整微调的模型的场景。
需要在不同的下游任务之间快速切换大规模预训练语言模型的能力，例如多任务学习、元学习、迁移学习等，但是又不想重新训练或者加载完整微调的模型的场景。

LoRA 的代码实现

论文中提供了一个开源的代码库，可以方便地将 LoRA 集成到 PyTorch 模型中，并提供了 RoBERTa, DeBERTa, 和 GPT-2 的实现和模型检查点。代码库的地址是：https://github.com/microsoft/LoRA

代码库中包含了以下几个部分：

lora.py：包含了 LoRA 的核心实现，即低秩矩阵注入和参数恢复等功能。
models.py：包含了 RoBERTa, DeBERTa, 和 GPT-2 的 LoRA 版本的实现。
run_glue.py：包含了在 GLUE 任务上使用 RoBERTa 或者 DeBERTa 的 LoRA 版本进行微调和评估的脚本。
run_squad.py：包含了在 SQuAD 任务上使用 RoBERTa 或者 DeBERTa 的 LoRA 版本进行微调和评估的脚本。
run_race.py：包含了在 RACE 任务上使用 RoBERTa 或者 DeBERTa 的 LoRA 版本进行微调和评估的脚本。
run_coqa.py：包含了在 CoQA 任务上使用 GPT-2 或者 GPT-3 的 LoRA 版本进行微调和评估的脚本。

代码库中还提供了一些使用说明和示例命令，可以参考 README.md 文件。

Source: Conversation with Bing, 2023/6/12
(1) 你真的会用LORA吗？超详细讲解LORA分层控制 - 知乎. https://zhuanlan.zhihu.com/p/621260240.
(2) LoRA 指南 - 知乎. https://zhuanlan.zhihu.com/p/600628691.
(3) 什么是LoRA模型，如何使用和训练LoRA模型？你想要的都在这！. https://zhuanlan.zhihu.com/p/624230991.

Source: Conversation with Bing, 2023/6/12
(1) LoRA: Low-Rank Adaptation of Large Language Models. https://arxiv.org/abs/2106.09685.
(2) 【自然语言处理】【大模型】极低资源微调大模型方法LoRA … https://zhuanlan.zhihu.com/p/618073170.
(3) 论文阅读：LORA-大型语言模型的低秩适应 - 知乎. https://zhuanlan.zhihu.com/p/611557340.

补充

具体说说 lora 是怎么实现将可训练的秩分解矩阵注入 Transformer 架构的每一层，举个具体的例子

LoRA 的基本思想是对于预训练模型的权重矩阵 $W_0$ ，使用一个低秩矩阵 $\Delta W=BA$ 来表示其更新，其中 $B$ 和 $A$ 是可训练的参数，而 $W_0$ 是固定的。这样可以保证 $\Delta W$ 的参数数量远小于 $W_0$ 的参数数量，从而实现参数高效。
LoRA 可以应用于 Transformer 架构的不同部分，例如自注意力、交叉注意力、前馈网络等。具体来说，LoRA 可以将低秩矩阵注入到这些部分的输入或输出端，或者在这些部分的中间添加一个低秩矩阵。
举个例子，假设我们要对一个自注意力层进行 LoRA 微调，该层的输入为 $Q, K, V$ ，输出为 $Z$ 。我们可以在输入端注入低秩矩阵 $\Delta Q$ , $\Delta K$ , $\Delta V$ ，即：

$Q'=Q+\Delta Q=Q+B_QA_Q$

$K'=K+\Delta K=K+B_KA_K$

$V'=V+\Delta V=V+B_VA_V$

然后使用 $Q^{'}$ , $K^{'}$ , $V^{'}$ 来计算自注意力的输出 $Z$ 。这样相当于在输入端增加了一个残差连接。

我们也可以在输出端注入低秩矩阵 $\Delta Z$ ，即：

$Z'=Z+\Delta Z=Z+BA$

然后使用 $Z^{'}$ 作为自注意力的输出。这样相当于在输出端增加了一个残差连接。

我们还可以在自注意力的中间添加一个低秩矩阵 $\Delta A$ ，即：

$A=\mathrm {softmax} (\frac {QK^T} {\sqrt {d_k}})+\Delta A=\mathrm {softmax} (\frac {QK^T} {\sqrt {d_k}})+BA$

然后使用 $A$ 来计算自注意力的输出 $Z$ 。这样相当于在自注意力的中间增加了一个残差连接。

这些方法都可以实现将可训练的秩分解矩阵注入 Transformer 架构的每一层，从而实现 LoRA 微调。

Source: Conversation with Bing, 2023/6/12
(1) Using LoRA for Efficient Stable Diffusion Fine-Tuning … https://huggingface.co/blog/lora.
(2) Picotest-J2101A Injection Transformer 10Hz - 45MHz. https://www.picotest.com/products_J2101A.html.
(3) GitHub - Blealtan/RWKV-LM-LoRA: RWKV is a RNN with … https://github.com/Blealtan/RWKV-LM-LoRA.

为什么 adapter 会引入时延？

adapter 的基本形式是一个两层的前馈网络，其中第一层将输入从 hidden_size 降维到 bottleneck_size，第二层将输出从 bottleneck_size 升维到 hidden_size。这样可以保证 adapter 的输出与原始 Transformer 层的输出具有相同的维度，从而可以进行残差连接¹²。
举个例子，假设我们要对一个自注意力层进行 adapter 微调，该层的输入为 $Q$ , $K$ , $V$ ，输出为 $Z$ 。我们可以在输入端或者输出端插入一个 adapter 层，例如：

$Q'=Q+\mathrm {adapter} (Q)$

$K'=K+\mathrm {adapter} (K)$

$V'=V+\mathrm {adapter} (V)$

然后使用 $Q^{'}$ , $K^{'}$ , $V^{'}$ 来计算自注意力的输出 $Z$ 。或者：

$Z'=Z+\mathrm {adapter} (Z)$

然后使用 $Z^{'}$ 作为自注意力的输出。

这些方法都会引入推理时延，因为 adapter 层需要额外的计算和通信。具体来说，adapter 层需要计算两次矩阵乘法和两次激活函数，并且需要与原始 Transformer 层进行残差连接。这些操作都会增加推理时延，尤其是在大规模的预训练模型和下游任务上。

¹: Houlsby, N., Giurgiu, A., Jastrzebski, S., Morrone, B., de Laroussilhe, Q., Gesmundo, A., … & Gelly, S. (2019). Parameter-efficient transfer learning for NLP. arXiv preprint arXiv:1902.00751.

²: Pfeiffer, J., Rücklé, A., Eger, S., & Gurevych, I. (2020). AdapterHub: A framework for adapting transformers. arXiv preprint arXiv:2007.07779.

Source: Conversation with Bing, 2023/6/12
(1) Compacter: Efficient Low-Rank Hypercomplex Adapter Layers. https://arxiv.org/abs/2106.04647.
(2) Parameter-Efficient Transfer Learning for NLP - arXiv.org. https://arxiv.org/pdf/1902.00751.pdf.
(3) Adapters for Generative and Seq2Seq Models in NLP. https://adapterhub.ml/blog/2021/04/adapters-for-generative-and-seq2seq-models-in-nlp/.
(4) Adapters: A Compact and Extensible Transfer Learning … https://medium.com/dair-ai/adapters-a-compact-and-extensible-transfer-learning-method-for-nlp-6d18c2399f62.

那 lora 是不是也会引入推理时延？

不会。LoRA 是不会引入推理时延的，因为 LoRA 不会改变预训练模型的结构和计算流程。具体来说，LoRA 只是在预训练模型的权重矩阵上加上一个低秩矩阵，而这个低秩矩阵可以在训练时就计算好，并且与原始权重矩阵相加，得到一个新的权重矩阵。这样，在推理时，就不需要额外的计算和通信，只需要使用新的权重矩阵进行原始 Transformer 层的计算即可。因此，LoRA 是不会引入推理时延的，这也是它与 adapter 的一个优势。

lora 相对于只微调模型最后的输出层(freeze)的异同

异

LoRA 是在预训练模型的每一层 Transformer 中注入可训练的低秩矩阵，而 freeze 是只在预训练模型的最后一层添加一个可训练的输出层。
LoRA 的可训练参数数量取决于低秩矩阵的秩，而 freeze 的可训练参数数量取决于输出层的大小。一般来说，LoRA 的可训练参数数量会比 freeze 少很多。
LoRA 的模型质量与完全微调相当或者更好，而 freeze 的模型质量通常会比完全微调差很多。这是因为 LoRA 可以更好地利用预训练模型的各层信息，而 freeze 只能利用预训练模型的最后一层信息。
LoRA 的推理时延与完全微调和 freeze 相同，而 adapter 和 prefix-tuning 的推理时延会比完全微调和 freeze 大很多。这是因为 LoRA 不会改变预训练模型的结构和计算流程，而 adapter 和 prefix-tuning 会增加额外的计算和通信。

同

LoRA 和 freeze 都是为了降低大模型微调和部署的成本，使得大模型可以在有限的硬件资源和预算下适应特定的下游任务或者领域。
LoRA 和 freeze 都是基于一个假设，即预训练模型在适应下游任务时，其权重更新具有低秩或者稀疏的特性。也就是说，只需要少量的参数就可以实现较大的性能提升。

Source: Conversation with Bing, 2023/6/12
(1) Using LoRA for Efficient Stable Diffusion Fine-Tuning … https://huggingface.co/blog/lora.
(2) What is the difference between LoRa and LoRaWAN … https://www.techtarget.com/searchnetworking/answer/What-is-the-difference-between-LoRa-and-LoRaWAN.
(3) LoRA: Low-Rank Adaptation of Large Language Models. https://github.com/microsoft/LoRA.

FastAPI介绍 -zZR fastapi python
1.fastapi介绍一个用于构建API的现代、快速（高性能）的web框架。特点快速：可与NodeJS和Go并肩的极高性能（归功于Starlette和Pydantic）。最快的Pythonweb框架之一。高效编码：提高功能开发速度约200％至300％。更少bug：减少约40％的人为（开发者）导致错误。智能：极佳的编辑器支持。处处皆可自动补全，减少调试时间。简单：设计的易于使用和学习，阅读文档的时
【深度学习|变化检测孪生网络】基于共享权重的双流 U-Net 变化检测网络架构，附代码（一）努力学习的大大深度学习基础深度学习网络架构人工智能 python
【深度学习|变化检测孪生网络】基于共享权重的双流U-Net变化检测网络架构，附代码（一）【深度学习|变化检测孪生网络】基于共享权重的双流U-Net变化检测网络架构，附代码（一）文章目录【深度学习|变化检测孪生网络】基于共享权重的双流U-Net变化检测网络架构，附代码（一）基于共享权重的双流U-Net变化检测网络架构1.双流网络（SiameseNetwork）概述2.双流网络的应用——变化检测3.U
【2025优质学术推荐】征稿控制科学、仪器、智能系统、通信、计算机、电子信息、人工智能、大数据、机器学习、软件工程、网络安全方向努力学习的大大学术会议推荐人工智能大数据深度学习神经网络
【2025优质学术推荐】征稿控制科学、仪器、智能系统、通信、计算机、电子信息、人工智能、大数据、机器学习、软件工程、网络安全方向【2025优质学术推荐】征稿控制科学、仪器、智能系统、通信、计算机、电子信息、人工智能、大数据、机器学习、软件工程、网络安全方向文章目录【2025优质学术推荐】征稿控制科学、仪器、智能系统、通信、计算机、电子信息、人工智能、大数据、机器学习、软件工程、网络安全方向2025
【深度学习|迁移学习】Wasserstein距离度量和跨域原型一致性损失（CPC Loss）如何计算？以及Wasserstein距离和CPC Loss结合的对抗训练示例，附代码（二）努力学习的大大深度学习基础深度学习迁移学习人工智能 python
【深度学习|迁移学习】Wasserstein距离度量和跨域原型一致性损失（CPCLoss）如何计算？以及Wasserstein距离和CPCLoss结合的对抗训练示例，附代码（二）【深度学习|迁移学习】Wasserstein距离度量和跨域原型一致性损失（CPCLoss）如何计算？以及Wasserstein距离和CPCLoss结合的对抗训练示例，附代码（二）文章目录【深度学习|迁移学习】Wassers
一、新手学习爬虫第一课对网站发起请求（基于python语言） [木子加贝] python自学爬虫学习爬虫 python 开发语言后端
目录前言一、安装并引用请求模块requests1.安装请求模块2.引用requests请求模块3.引用requests请求模块并使用别名二、发起请求1.对网站发起get请求（最常用的请求）：（1）第一种方法（字符串）（2）第二种方法（变量）（3）第三种方法（关键字传参）2.对网站发起带参数的get请求：3.对网站发起post请求：4.对网站发JSON数据的post请求：4.注意事项总结前言爬虫的本
【学习笔记】手把手教你使用Autoware标定SICK-2D激光雷达和相机 Masec 学习笔记 Autoware标定二维雷达
2019/06/21更新说明：很多小伙伴反应从github上下载的Autoware没有CalibrationToolkit，是作者在github的新源码和我用的版本不一样了。该教程仅针对2018年11月7日的发布版本。网上Autoware的教程不多，而且都是关于多线的威力登雷达和相机的联合标定。自己摸索使用Autoware标定SICKTIM561单线激光雷达和相机的方法，写一个详细的教程，希望可以
Three.js学习笔记(一) hzxwonder three.js webgl three.js
Three.js学习笔记(一)1.四大组建1.场景任何要显示的东西，放在场景的任何位置一个页面可以有多个场景实现方式THREE.Scene=function()2.相机浏览器中所能看到的东西，就是由相机拍摄出来。即将相机能看到的内容显示在浏览器画面上分类1.透视相机近大远小+灭点2.正投影相机远处和近处一样大，也称正交相机参数THREE.PerspectiveCamera=function(fov
QT笔记——QComboBox 繁缕怀夕 QT qt 学习开发语言
文章目录一、概要二、基础函数三、基础应用1、内容居中显示一、概要本文章主要记录，在实际开发运行中，有关“QComboBox”相关的基础应用。二、基础函数函数名描述setCurrentIndex(intnum)设置当前选项的索引currentIndex()const获取当前选中项目的索引。如果没有选中任何项目，则返回-1currentText()const获取当前选中项目的文本––count()co
Qt笔记——QLineEdit 繁缕怀夕 QT qt 开发语言
QT零基础——QLineEdit1、QLineEdit类1.1、常用成员函数1.2、常用信号2、QLineEdit功能实现1、QLineEdit类//根据学习实践进度–程序更新1.1、常用成员函数成员函数说明clear()清空LineEdit中的文本内容text()const获取LineEdit的当前文本内容setText(constQString&)设置LineEdit的文本内容setText(
QT笔记——实现窗体自适应 lion_cxq QT qt
我们想要所有的控件都随窗口的大小改变而改变。第一种方法：思路：1.我们需要获取到所有的控件m_Widget=this->findChildren(QString(),Qt::FindDirectChildrenOnly);2.我们需要知道所有控件的位置以及大小3.重写resizeEvent事件protected:voidresizeEvent(QResizeEvent*event);4.获取主窗口
CSS学习笔记9——定位position green_pine_ CSS css 学习笔记前端 html
CSS定位可以让盒子自由的在某个盒子内移动位置或者固定屏幕中某个位置，并且可以压住其他盒子定位组成定位=定位模式+边偏移定位模式用于指定一个元素在文档中的定位方式边偏移决定了该元素的最终位置定位模式通过position属性来设置值语义static静态定位relative相对定位absolute绝对定位fixed固定定位边偏移属性：top、bottom、left、right属性示例描述toptop:
QT 笔记繁缕怀夕 QT 笔记
本文详述了QT的基础应用，其中包括基础控件应用、多线程等工具类使用、以及显示2D、3D图像等功能，适用于C++和计算机视觉领域的开发者。1、基础控件QLineEditQComboBoxQMenuQToolBar2、基础功能2.1、多线程线程QThread2.2、多语言静态显示动态切换3、QChart4、QGraphicsView5、PCL之VTK
游戏AI 技术方案部分解析 |用 AI 技术，练就 FPS 游戏中的刚枪王！游戏智眼游戏 AI 人工智能
一、整体方案详情FPS作为重度竞技游戏品类，存在显著的新手留存问题及高端匹配困难问题，通过引入AI陪玩智能体来针对性解决FPS品类通用痛点。在这个过程中，我们用到了强化学习，让AI通过自我在游戏中学习探索，最终成为超越或比肩人类顶尖玩家水平的强大AI。1.针对新手留存问题通过引入不同水平的陪玩智能体+智能投放来为新手玩家设计好前20局甚至前50局的对战，为玩家制造一个平滑的新手过渡期，帮手玩家更顺
Python数据分析案例教程 kkchenjj 数据挖掘 python 数据分析信息可视化
Python数据分析案例教程Python在数据分析中的应用Python因其简洁的语法、强大的库支持以及广泛的社区资源，已成为数据分析领域的首选语言。它能够处理从数据清洗、数据可视化到机器学习模型构建的整个数据科学流程。本节将深入探讨Python在数据分析中的具体应用，包括但不限于数据清洗、数据探索、统计分析和预测建模。数据清洗数据清洗是数据分析的首要步骤，涉及处理缺失值、异常值、重复数据以及数据类
2025年新出炉的MySQL面试题长风清留扬 150道MySQL高频面试题 mysql 数据库面试 sql
作者简介：CSDN\阿里云\腾讯云\华为云开发社区优质创作者，专注分享大数据、Python、数据库、人工智能等领域的优质内容个人主页：长风清留杨的博客形式准则：无论成就大小，都保持一颗谦逊的心，尊重他人，虚心学习。✨推荐专栏：Python入门到入魔，Mysql入门到入魔，Python入门基础大全，Flink入门到实战若缘分至此，无法再续相逢，愿你朝朝暮暮，皆有安好，晨曦微露道早安，日中炽热说午安，
精选了几道MySQL的大厂面试题，被提问的几率很高！长风清留扬 150道MySQL高频面试题 mysql android 数据库面试学习 MySQL面试
作者简介：CSDN\阿里云\腾讯云\华为云开发社区优质创作者，专注分享大数据、Python、数据库、人工智能等领域的优质内容个人主页：长风清留杨的博客形式准则：无论成就大小，都保持一颗谦逊的心，尊重他人，虚心学习。✨推荐专栏：Python入门到入魔，Mysql入门到入魔，Python入门基础大全，Flink入门到实战若缘分至此，无法再续相逢，愿你朝朝暮暮，皆有安好，晨曦微露道早安，日中炽热说午安，
有史以来最全的异常类讲解没有之一！第二部分爆肝2万字，终于把Python的异常类写完了！最全Python异常类合集和案例演示，第二部分长风清留扬最新Python入门基础合集 python 笔记学习异常处理改行学it 异常 BUG
本文是第二部分，第一部分请看：有史以来最全的异常类讲解没有之一！爆肝3万字，终于把Python的异常类写完了！最全Python异常类合集和案例演示，第一部分博客主页：长风清留扬-CSDN博客系列专栏：Python基础专栏每天更新大数据相关方面的技术，分享自己的实战工作经验和学习总结，尽量帮助大家解决更多问题和学习更多新知识，欢迎评论区分享自己的看法感谢大家点赞收藏⭐评论异常类型IndexError
还在为Python“运算符”中遇到的BUG而发愁吗？，变量相关的问题和解决办法看这篇文章就够了！长风清留扬 android python bug 运算符
博客主页：长风清留扬-CSDN博客系列专栏：Python疑难杂症百科-BUG编年史每天更新大数据相关方面的技术，分享自己的实战工作经验和学习总结，尽量帮助大家解决更多问题和学习更多新知识，欢迎评论区分享自己的看法感谢大家点赞收藏⭐评论关于运算符中常见的问题和解决方法在Python编程的浩瀚宇宙中，变量如同星辰般璀璨，它们承载着数据，驱动着程序的运行。然而，即便是这些看似简单的构建块，也时常隐藏着令
Python全网最全基础课程笔记(十三)——作用域，跟着思维导图和图文来学习，爆肝2w字，无数代码案例！长风清留扬最新Python入门基础合集 python 笔记学习作用域面试跳槽改行学it
本专栏系列为Pythong基础系列，每篇内容非常全面，包含全网各个知识点，非常长，请耐心看完。每天都会更新新的内容，搜罗全网资源以及自己在学习和工作过程中的一些总结，可以说是非常详细和全面。以至于为什么要写的这么详细：自己也是学过Python的，很多新手只是简单的过一篇语法，其实对于一个知识点的底层逻辑和其他使用方法以及参数详情根本不是很了解，这就导致学完很容易忘记，而且在实战过程中也是半知半解，
Python全网最全基础课程笔记(三)——所有运算符+运算符优先级长风清留扬最新Python入门基础合集开发语言 python 运算符 Python基础 numpy pandas pip
本专栏系列为Pythong基础系列，每天都会更新新的内容，搜罗全网资源以及自己在学习和工作过程中的一些总结，可以说是非常详细和全面。以至于为什么要写的这么详细：自己也是学过Python的，很多新手只是简单的过一篇语法，其实对于一个知识点的底层逻辑和其他使用方法以及参数详情根本不是很了解，这就导致学完很容易忘记，而且在实战过程中也是半知半解，所以自己就尽量写的详细些，让需要的人能更了解Python的
【OTFS与信号处理：论文阅读1】：考虑分数多普勒的OTFS系统有效信道估计（24.01.16更新） Cuby! OTFS论文学习信号处理论文阅读人工智能
2023.06.05最近在研究OTFS考虑分数多普勒时信道估计与信号检测相关问题，最近精读了一篇论文，并针对论文中部分公式进行推导，故记录一下学习过程。【OTFS与信号处理：论文阅读1】EfficientChannelEstimationforOTFSSystemsinthePresenceofFractionalDoppler前言一、摘要及背景摘要分数多普勒的引入估计分数多普勒的意义研究现状二、
免费开源的后端API服务-supabase安装和使用-简直是前端学习者福音前端三评 strapi Ajax 工具开源前端 supabase
文章目录它是什么安装和部署关于安装关于部署1、注册用户2、创建组织3、创建项目创建数据库表（填充内容）填充数据库表使用postman联调API它是什么一个开源免费的后端框架，firebase的替代品。可以简单理解类似于headlesscms，但是不仅仅只提供内容，它还集成了服务订阅、即时API，用户身份认证（包括第三方身份认证，比如使用github、Google等账号实现快速登录和注册）、边缘函数
2025数学建模美赛B题完整建模思路——管理可持续旅游业鹿鹿数模数学建模
2025MCM问题B：管理可持续旅游业以下是我们对该题目的赛题分析，由于完整内容过长，因此在此处放出部分内容，欢迎从文末小卡片处加群获取。赛题分析以下内容包括三个主要部分：(1)题目的中文翻译(2)对题目的整体分析与思路综述(3)对题目要求的逐项详细分析与求解思路。本文的撰写将综合运用多元的数学模型、算法以及机器学习/深度学习的方法，并在必要时给出题外假设与可行的创新性思路，以期为参赛者提供较为系
AcWing算法基础课笔记——高斯消元 SharkWeek. AcWing 算法笔记数论
高斯消元用来求解方程组a11x1+a12x2+⋯+a1nxn=b1a21x1+a22x2+⋯+a2nxn=b2…an1x1+an2x2+⋯+annxn=bna_{11}x_1+a_{12}x_2+\dots+a_{1n}x_n=b_1\\a_{21}x_1+a_{22}x_2+\dots+a_{2n}x_n=b_2\\\dots\\a_{n1}x_1+a_{n2}x_2+\dots+a_{nn}x
使用YOLOv8训练一个无人机（UAV）检测模型，深度学习目标检测中_并开发一个完整的系统 yolov8来训练无人机数据集并检测无人机 QQ_767172261 无人及视角 YOLO 无人机深度学习
使用YOLOv8训练一个无人机（UAV）检测模型，深度学习目标检测中_并开发一个完整的系统yolov8来训练无人机数据集并检测无人机无人机数据集，yolo格式种类为uav，一共近5w张图片，如何用yolov8代码训练无人机检测数据集文章目录以下文章及内容仅供参考。1.环境部署2.数据预处理数据集准备划分数据集3.模型定义4.训练模型5.评估模型6.结果分析与可视化7.集成与部署PyQt6GUI(`
2025年全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽安全-黑客4148 网络安全 web安全 linux 密码学 CTF python ddos
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
基于springboot在线考试系统 2201_75927219 计算机毕业设计 spring boot 后端 java
基于SpringBoot的在线考试系统是一种现代化的教育考试解决方案，它结合了SpringBoot框架的高效性和在线考试的便捷性，为教育机构、教师和学生提供了一个功能强大、易于使用的在线考试平台。一、系统背景与意义随着教育数字化的推进和在线学习需求的增长，传统的纸质考试方式已经逐渐显示出局限性，特别是在灵活性和可访问性方面。在线考试系统的开发正是响应这一趋势，它允许教育机构在任何时间、任何地点进行
【微信小程序】5步轻松掌握微信小程序获取位置API，你get到了吗？墨瑾轩微信小程序微信小程序 notepad++小程序
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣5步轻松掌握微信小程序获取位置API，你get到了吗？亲爱的小伙伴们，大家好呀！今天我们要一起来探讨微信小程序中的获取位置API——wx.getLocation。无论你是小程序的新手，还是有一定经验的开发者，这篇文章都会带你深入了解wx.getLocation
智能运维分析决策系统：赋能数字化转型的智慧引擎我的运维人生运维运维开发技术共享
智能运维分析决策系统：赋能数字化转型的智慧引擎在数字化转型的大潮中，企业运维管理正经历着从传统手动运维向智能化、自动化运维的深刻转变。智能运维分析决策系统（AIOps，ArtificialIntelligenceforITOperations）作为这一转变的核心驱动力，通过融合大数据、机器学习、人工智能等先进技术，实现了对运维数据的深度洞察与智能决策，极大地提升了运维效率与质量，为企业数字业务的连
C++的list-map链表与映射表芯动大师 C++语法嵌入式开发应用案例 c++list 链表
C++list-map链表与映射表的简单使用，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值。list链表链表是由节点之间通过指针连接而成的链式结构存储结构体，对于链表，C++标准库中已经提供了封装好的链表了。require:#include //1.包含头文件usingnamespacestd; //2.打开标准命名空间定义链表，并在首、尾添加、删除元素listlst
apache 安装linux windows 墙头上一根草 apache inux windows
linux安装Apache 有两种方式一种是手动安装通过二进制的文件进行安装，另外一种就是通过yum 安装，此中安装方式，需要物理机联网。以下分别介绍两种的安装方式通过二进制文件安装Apache需要的软件有apr,apr-util,pcre 1，安装 apr 下载地址：htt
fill_parent、wrap_content和match_parent的区别 Cb123456 match_parent fill_parent
fill_parent、wrap_content和match_parent的区别: 1）fill_parent 设置一个构件的布局为fill_parent将强制性地使构件扩展，以填充布局单元内尽可能多的空间。这跟Windows控件的dockstyle属性大体一致。设置一个顶部布局或控件为fill_parent将强制性让它布满整个屏幕。 2） wrap_conte
网页自适应设计天子之骄 html css 响应式设计页面自适应
网页自适应设计网页对浏览器窗口的自适应支持变得越来越重要了。自适应响应设计更是异常火爆。再加上移动端的崛起，更是如日中天。以前为了适应不同屏幕分布率和浏览器窗口的扩大和缩小，需要设计几套css样式，用js脚本判断窗口大小，选择加载。结构臃肿，加载负担较大。现笔者经过一定时间的学习，有所心得，故分享于此，加强交流，共同进步。同时希望对大家有所
[sql server] 分组取最大最小常用sql 一炮送你回车库 SQL Server
--分组取最大最小常用sql--测试环境if OBJECT_ID('tb') is not null drop table tb;gocreate table tb( col1 int, col2 int, Fcount int)insert into tbselect 11,20,1 union allselect 11,22,1 union allselect 1
ImageIO写图片输出到硬盘 3213213333332132 java image
package awt; import java.awt.Color; import java.awt.Font; import java.awt.Graphics; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imagei
自己的String动态数组宝剑锋梅花香 java 动态数组数组
数组还是好说，学过一两门编程语言的就知道，需要注意的是数组声明时需要把大小给它定下来，比如声明一个字符串类型的数组：String str[]=new String[10]; 但是问题就来了，每次都是大小确定的数组，我需要数组大小不固定随时变化怎么办呢？动态数组就这样应运而生，龙哥给我们讲的是自己用代码写动态数组，并非用的ArrayList 看看字符
pinyin4j工具类 darkranger .net
pinyin4j工具类Java工具类 2010-04-24 00:47:00 阅读69 评论0 字号：大中小引入pinyin4j-2.5.0.jar包: pinyin4j是一个功能强悍的汉语拼音工具包，主要是从汉语获取各种格式和需求的拼音，功能强悍，下面看看如何使用pinyin4j。本人以前用AscII编码提取工具，效果不理想，现在用pinyin4j简单实现了一个。功能还不是很完美，
StarUML学习笔记----基本概念 aijuans UML建模
介绍StarUML的基本概念，这些都是有效运用StarUML?所需要的。包括对模型、视图、图、项目、单元、方法、框架、模型块及其差异以及UML轮廓。模型、视与图（Model, View and Diagram） &
Activiti最终总结 avords Activiti id 工作流
1、流程定义ID：ProcessDefinitionId，当定义一个流程就会产生。 2、流程实例ID：ProcessInstanceId，当开始一个具体的流程时就会产生，也就是不同的流程实例ID可能有相同的流程定义ID。 3、TaskId，每一个userTask都会有一个Id这个是存在于流程实例上的。 4、TaskDefinitionKey和（ActivityImpl activityId
从省市区多重级联想到的，react和jquery的差别 bee1314 jquery UI react
在我们的前端项目里经常会用到级联的select，比如省市区这样。通常这种级联大多是动态的。比如先加载了省，点击省加载市，点击市加载区。然后数据通常ajax返回。如果没有数据则说明到了叶子节点。针对这种场景，如果我们使用jquery来实现，要考虑很多的问题，数据部分，以及大量的dom操作。比如这个页面上显示了某个区，这时候我切换省，要把市重新初始化数据，然后区域的部分要从页面
Eclipse快捷键大全 bijian1013 java eclipse 快捷键
Ctrl+1 快速修复(最经典的快捷键,就不用多说了)Ctrl+D: 删除当前行 Ctrl+Alt+↓ 复制当前行到下一行(复制增加)Ctrl+Alt+↑ 复制当前行到上一行(复制增加)Alt+↓ 当前行和下面一行交互位置(特别实用,可以省去先剪切,再粘贴了)Alt+↑ 当前行和上面一行交互位置(同上)Alt+← 前一个编辑的页面Alt+→ 下一个编辑的页面(当然是针对上面那条来说了)Alt+En
js 笔记函数征客丶 JavaScript
一、函数的使用 1.1、定义函数变量 var vName = funcation(params){ } 1.2、函数的调用函数变量的调用： vName(params); 函数定义时自发调用：(function(params){})(params); 1.3、函数中变量赋值 var a = 'a'; var ff
【Scala四】分析Spark源代码总结的Scala语法二 bit1129 scala
1. Some操作在下面的代码中，使用了Some操作：if (self.partitioner == Some(partitioner))，那么Some(partitioner)表示什么含义？首先partitioner是方法combineByKey传入的变量， Some的文档说明： /** Class `Some[A]` represents existin
java 匿名内部类 BlueSkator java匿名内部类
组合优先于继承 Java的匿名类，就是提供了一个快捷方便的手段，令继承关系可以方便地变成组合关系继承只有一个时候才能用，当你要求子类的实例可以替代父类实例的位置时才可以用继承。在Java中内部类主要分为成员内部类、局部内部类、匿名内部类、静态内部类。内部类不是很好理解，但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成，而内部类相
盗版win装在MAC有害发热，苹果的东西不值得买，win应该不用 ljy325 游戏 apple windows XP OS
Mac mini 型号: MC270CH-A RMB:5,688 Apple 对windows的产品支持不好,有以下问题: 1.装完了xp,发现机身很热虽然没有运行任何程序！貌似显卡跑游戏发热一样，按照那样的发热量,那部机子损耗很大,使用寿命受到严重的影响! 2.反观安装了Mac os的展示机，发热量很小，运行了1天温度也没有那么高 &nbs
读《研磨设计模式》-代码笔记-生成器模式-Builder bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 生成器模式的意图在于将一个复杂的构建与其表示相分离，使得同样的构建过程可以创建不同的表示（GoF） * 个人理解： * 构建一个复杂的对象，对于创建者（Builder）来说，一是要有数据来源(rawData)，二是要返回构
JIRA与SVN插件安装 chenyu19891124 SVN jira
JIRA安装好后提交代码并要显示在JIRA上，这得需要用SVN的插件才能看见开发人员提交的代码。 1.下载svn与jira插件安装包，解压后在安装包(atlassian-jira-subversion-plugin-0.10.1) 2.解压出来的包里下的lib文件夹下的jar拷贝到(C:\Program Files\Atlassian\JIRA 4.3.4\atlassian-jira\WEB
常用数学思想方法 comsci 工作
对于搞工程和技术的朋友来讲，在工作中常常遇到一些实际问题，而采用常规的思维方式无法很好的解决这些问题，那么这个时候我们就需要用数学语言和数学工具，而使用数学工具的前提却是用数学思想的方法来描述问题。。下面转帖几种常用的数学思想方法，仅供学习和参考函数思想　　把某一数学问题用函数表示出来，并且利用函数探究这个问题的一般规律。这是最基本、最常用的数学方法
pl/sql集合类型 daizj oracle 集合 type pl/sql
--集合类型 /* 单行单列的数据，使用标量变量单行多列数据，使用记录单列多行数据，使用集合（。。。） *集合：类似于数组也就是。pl/sql集合类型包括索引表（pl/sql table）、嵌套表（Nested Table）、变长数组（VARRAY）等 */ /* --集合方法 &n
[Ofbiz]ofbiz初用 dinguangx 电商 ofbiz
从github下载最新的ofbiz（截止2015-7-13），从源码进行ofbiz的试用 1. 加载测试库 ofbiz内置derby，通过下面的命令初始化测试库 ./ant load-demo (与load-seed有一些区别) 2. 启动内置tomcat ./ant start 或 ./startofbiz.sh 或 java -jar ofbiz.jar &
结构体中最后一个元素是长度为0的数组 dcj3sjt126com c gcc
在Linux源代码中，有很多的结构体最后都定义了一个元素个数为0个的数组，如/usr/include/linux/if_pppox.h中有这样一个结构体： struct pppoe_tag { __u16 tag_type; __u16 tag_len; &n
Linux cp 实现强行覆盖 dcj3sjt126com linux
发现在Fedora 10 /ubutun 里面用cp -fr src dest，即使加了-f也是不能强行覆盖的，这时怎么回事的呢？一两个文件还好说，就输几个yes吧，但是要是n多文件怎么办，那还不输死人呢？下面提供三种解决办法。方法一我们输入alias命令，看看系统给cp起了一个什么别名。 [root@localhost ~]# aliasalias cp=’cp -i’a
Memcached(一)、HelloWorld frank1234 memcached
一、简介高性能的架构离不开缓存，分布式缓存中的佼佼者当属memcached，它通过客户端将不同的key hash到不同的memcached服务器中，而获取的时候也到相同的服务器中获取，由于不需要做集群同步，也就省去了集群间同步的开销和延迟，所以它相对于ehcache等缓存来说能更好的支持分布式应用，具有更强的横向伸缩能力。二、客户端选择一个memcached客户端，我这里用的是memc
Search in Rotated Sorted Array II hcx2013 search
Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed? Would this affect the run-time complexity? How and why? Write a function to determine if a given ta
Spring4新特性——更好的Java泛型操作API jinnianshilongnian spring4 generic type
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装JDK liuxingguome centos
1、行卸载原来的： [root@localhost opt]# rpm -qa | grep java tzdata-java-2014g-1.el6.noarch java-1.7.0-openjdk-1.7.0.65-2.5.1.2.el6_5.x86_64 java-1.6.0-openjdk-1.6.0.0-11.1.13.4.el6.x86_64 [root@localhost
二分搜索专题2-在有序二维数组中搜索一个元素 OpenMind 二维数组算法二分搜索
1,设二维数组p的每行每列都按照下标递增的顺序递增。用数学语言描述如下：p满足 (1),对任意的x1，x2，y，如果x1<x2,则p(x1,y)<p(x2,y); (2),对任意的x，y1,y2, 如果y1<y2,则p(x,y1)<p(x,y2); 2,问题：给定满足1的数组p和一个整数k，求是否存在x0,y0使得p(x0,y0)=k? 3,算法分析： (
java 随机数 Math与Random SaraWon java Math Random
今天需要在程序中产生随机数，知道有两种方法可以使用，但是使用Math和Random的区别还不是特别清楚，看到一篇文章是关于的，觉得写的还挺不错的，原文地址是 http://www.oschina.net/question/157182_45274?sort=default&p=1#answers 产生1到10之间的随机数的两种实现方式： //Math Math.roun
oracle创建表空间 tugn oracle
create temporary tablespace TXSJ_TEMP tempfile 'E:\Oracle\oradata\TXSJ_TEMP.dbf' size 32m autoextend on next 32m maxsize 2048m extent m
使用Java8实现自己的个性化搜索引擎 yangshangchuan java superword 搜索引擎 java8 全文检索
需要对249本软件著作实现句子级别全文检索，这些著作均为PDF文件，不使用现有的框架如lucene，自己实现的方法如下： 1、从PDF文件中提取文本，这里的重点是如何最大可能地还原文本。提取之后的文本，一个句子一行保存为文本文件。 2、将所有文本文件合并为一个单一的文本文件，这样，每一个句子就有一个唯一行号。 3、对每一行文本进行分词，建立倒排表，倒排表的格式为：词=包含该词的总行数N=行号