PaperWeekly

EMNLP 2022 | 预训练语言模型的时空效率优化

©PaperWeekly 原创 · 作者 | 申博文

单位 | 中国科学院信息工程研究所

研究方向 | 自然语言处理

论文标题：

COST-EFF: Collaborative Optimization of Spatial and Temporal Efficiency with Slenderized Multi-exit Language Models

收录会议：

EMNLP 2022

论文链接：

https://arxiv.org/abs/2210.15523

代码链接：

https://github.com/sbwww/cost-eff

动机

众多基于 Transformer 的预训练语言模型（Pre-trained Language Models，PLMs）不断刷新着各项任务的性能，却存在体积大、推断慢等效率问题。对于资源受限的设备和应用场景，需要一种在空间和时间上高效，且在任务推断上准确的模型。

为了得到这样的模型，现有一些研究对 PLM 进行静态压缩 [1]。然而，单纯地进行静态压缩难以得到一个合适的模型，因为压缩后的模型很可能对简单样本而言仍有冗余，对复杂样本而言能力不足。为了使模型意识到输入样本的复杂性差异，Xin et al [2]，Liu et al [3] 等将 PLM 修改为多出口模型（即模型的多个部位都具有输出分类器），并使用动态提前退出方法进行推断加速。

我们发现，使用动态提前退出方法来加速小容量的压缩模型推断会造成较大的性能损失，其原因在于，多出口模型的浅层与深层在目标上存在不一致性。具体来说，浅层模块需兼顾做出预测和提取更深层所需的信息两个目标，而深层更多关注做出预测。这种不一致性在多出口模型中普遍存在，大容量模型有较好的能力缓解该问题，但小容量的压缩模型难以做出权衡。

为了解决上述问题，我们提出了 COST-EFF 来整合静态模型压缩和动态推断加速，实现空间和时间上的协同优化。具体来说，我们

1. 将 PLM 的宽度细化，而深度保持不变，保留模型提取深层知识的能力 [4]。同时，使用逐层的动态提前退出来减小模型深度带来的推断开销，根据样本复杂性动态地控制模型计算量，加速推理。

2.提出了一种联合训练方法，能够校正 PLM 的细化过程和压缩后的恢复训练过程，缓解在压缩的多出口模型上，浅层和深层目标不一致带来的权衡问题，提升协同优化模型的性能。

▲ 图1 COST-EFF示意图，Emb为嵌入层，Tfm为Transformer层，Clf指输出分类器

方法

COST-EFF 主要针对 Transformer 结构的预训练语言模型进行效率优化，优化方法包括：

1. 静态模型细化

词嵌入（Word embedding）矩阵的分解
多头自注意力（Multi-Head Attention，MHA）和前馈网络（Feed-Forward Network，FFN）的结构化剪枝

2. 动态推断加速

多出口网络的推断
多出口网络的训练

3. 联合训练流程

具体的，COST-EFF 结构和流程如下图所示，接下来将逐步介绍其细节。

▲ 图2 COST-EFF 结构（上半部分）和各部分对应的优化方法（下半部分）

2.1 静态模型细化

2.1.1 词嵌入矩阵的分解

由于默认的词表较大，BERT 的词嵌入矩阵有高于 23M（百万）的参数，占据模型约 1/5 的参数量。对词嵌入矩阵的细化选用截断式奇异值分解（Truncated Singular Value Decomposition，TSVD），将分解为两个小矩阵和的乘积形式，分解的具体过程如下：

其中为词表大小（BERT 默认为 30522），为隐藏状态大小（BERT 默认为 768），为 TSVD 分解的中间维度，也即图 2 中和间的红色维度。

2.1.2 MHA 和 FFN 的结构化剪枝

Transformer 结构的主要参数量在 MHA 和 FFN 中，剪枝是对其进行压缩的有效方式。剪枝可以分为结构化剪枝和非结构化剪枝。非结构化的剪枝以变换矩阵中的单个参数为粒度，可以实现更高的压缩率，但暂时还不能直接应用在通用计算设备上。因此，我们选择结构化剪枝，对 MHA 和 FFN 的剪枝粒度分别是注意力头和 FFN 中间维度。反映在变换矩阵上，则是将某些行或列丢弃，从而实现参数量和浮点数运算次数的减少。

以 BERT 为例，MHA 的默认设置为 12 个注意力头，每个注意力头的大小是 64，因此总计大小与隐藏状态大小相同，为 768。FFN 的中间维度为 3072，即隐藏维度 768 的 4 倍。

在 COST-EFF 的剪枝过程中，每个注意力头的大小保持不变，仅减少注意力头的个数。因此，MHA 中的变换矩阵，，的输出维度和的输入维度被压缩为；FFN 中的变换矩阵的输出维度和的输入维度被压缩为。

在剪枝时，需要剪去的部分根据其重要性来确定。重要性可以定义为“剪去该部分后，模型的损失变化程度”，若损失变化不太大，则可以视为不甚重要。重要性的形式化表示如下：

其中，为剪去结构后损失函数的变化，为损失函数对参数的梯度，为对在处一阶泰勒展开的余项。

2.2 动态推断加速

2.2.1 多出口网络的推断

多出口网络允许模型在足够置信的情况下提前退出并输出结果，对于较简单的输入样本，无需完整地通过整个模型。目前，提前退出的判断主要有基于熵 [2]、基于耐心 [5] 和基于学习的方法。基于学习的方法较为复杂且会引入额外开销，本文暂不使用。

根据 Liu et al [3] 的实验结果，基于熵的方法在多数任务上优于基于耐心的方法。因此，COST-EFF 选择基于熵的方法。具体地，每一层的分类器可以计算出分类概率的熵值，若小于一给定阈值，即可视为置信度足够高，并提前退出模型计算。

2.2.2 多出口网络的训练

多出口网络与普通的单出口网络的区别在于，单出口网络的浅层部分只需提取更深层所需的信息，而多出口网络的浅层部分还具有做出预测的任务。因此，两者的训练方式也存在区别。

DeeBERT [2] 使用了两阶段的训练方法，即先单独训练模型主干，再训练各个出口分类器；PABEE [5] 将各个出口的损失按递增权重加权求和，并和模型主干一起训练；然而上述两种方法均不够理想，DeeBERT 冻结模型主干，仅对分类器单独训练很难达到理想性能，PABEE 为损失加权的方式对于浅层损失的重视程度不够。

Li et al [6] 提出一种梯度均衡方法，该方法于 2022 年应用在 ElasticBERT [3] 中，并被证实其在 PLM 上的正确性。梯度均衡不是对损失加权，而是在梯度反向传播时对梯度加权，其表示如下：

其中是模型的层数，是从第层传播到第层的原始梯度，均衡后的梯度。

2.3 联合训练流程

除上述方法之外，更为重要的是如何将其整合，实现协同优化。

小容量的压缩模型很难只通过常规的精调恢复性能。而知识蒸馏可被用作一种补充，将知识从未压缩的教师模型转移到压缩后的学生模型。同时，由于多出口模型的浅层与深层间存在不一致性，且小容量的压缩模型难以权衡，简单地使用真实标签来训练压缩的多出口模型会导致显著的性能下降。

鉴于此，我们首先将原始模型蒸馏为一个多出口的 BERT 模型作为助教（Teaching Assistant，TA）模型。然后，将 TA 每一层出口分类器的输出概率分布作为 COST-EFF 中相应层的软标签，即有预测蒸馏损失：

其中和分别是 TA 和 COST-EFF 在第层的概率分布输出。是温度系数，通常设置为 1。

为了有效地将 TA 学习到的语义表示转移到学生模型中，COST-EFF 还蒸馏模型的特征，即嵌入层和各层 Transformer 得到的隐藏状态。隐藏状态，包括嵌入输出和每个 Transformer 层的输出，有如下的特征蒸馏损失：

COST-EFF 首先蒸馏普通的单出口模型，得到一个具有相同层数的多出口 TA 模型。这样的蒸馏可以兼容不同 PLM 的具体实现，同时也可以用一个较大较稳健的模型初步缓解了层间不一致性。然后，TA 模型被用作细化的模型主干和进一步知识蒸馏的教师模型。

在细化过程中，我们将多出口损失纳入结构重要性计算。多出口损失能够权衡结构对每个后续出口的贡献，而不是仅针对最后一层的贡献，以此来校正细化，避免加剧小容量模型中的层间不一致性。在细化之后进行恢复训练，即一个从 TA 到 COST-EFF 的逐层知识蒸馏，目标是最小化和的总和，这就缓解了细化的多出口模型上的真实标签训练的矛盾。

实验

3.1 实验设置

数据集：我们在 GLUE [7] 数据集中选择 SST-2、MRPC、QNLI 和 MNLI 进行实验

▲ 表1 数据集详情

对比方法：

不同大小的精调 BERT：BERT，BERT 和 BERT，这些 BERT 模型初始化自 Turc et al. [8] 公开的预训练模型
静态压缩模型：DistilBERT [9] 和 TinyBERT [1]
动态加速模型：DeeBERT [2]，PABEE [5] 和 ElasticBERT [3]

模型设置：

由于参数量对性能有较大影响，我们设置了两个比较组，每组内的模型大小相似。

第一组中的模型参数较少，在 20M 以下，包括 BERT、TinyBERT、DeeBERT、PABEE 和 COST-EFF
第二组模型较大，参数在 50M 以上，包括 BERT、TinyBERT、DistilBERT、DeeBERT、PABEE和 COST-EFF。

模型的具体大小可参考下表，其中为模型层数，为隐藏状态大小，为 MHA 大小（注意力头数注意力头大小）、为 FFN 中间维度大小，EE 表示是否使用动态提前退出

▲ 表2 模型设置

3.2 实验结果

▲ 图3 实验结果。加粗部分为最优效果，下划线部分为次优效果

在第一组中，模型被高度压缩和加速，COST-EFF的性能保持在大约 96.5%，远高于预训练+精调 BERT 或在压缩模型 BERT 上使用已有的动态提前退出方法。与强基准 TinyBERT 对比时，COST-EFF 在所有四个任务中都优于 TinyBERT，这表明细而深的模型优于宽而浅的模型。COST-EFF 的细化结构更有可能为困难的输入样本提取层级特征，同时利用动态提前退出迅速处理简单的输入样本。

对于较大的模型，具有 General Distillation（GD）[1] 过程的 TinyBERT比 COST-EFF 性能相近。同时，没有 GD 过程的 TinyBERT 在效率和性能上都被 COST-EFF 所支配，说明要想获得优于 COST-EFF 的 TinyBERT，必须经过 GD。

然而，GD 需要在规模庞大的语料上进行类似于预训练的过程，并且技能得到一个固定大小和计算量的模型。在计算量需求发生变化的情况下，TinyBERT 必须重新进行 GD，造成巨大的训练代价。与 TinyBERT 相比，COST-EFF 在性能和灵活推理方面都有优势。

为了证明动态推断加速的效果，我们根据经验从开发集中选择长度较短（低于长度中位数）的简单样本。简单样本上的结果显示了动态推断加速带来的改进，这在静态模型中是很难得到的。需要注意的是，长度较短并不总能表明样本的简单性。对于像 QNLI 这样的蕴含任务，较短的输入意味着较少的信息，可能会加剧语言模型的困惑。

此外，我们还绘制了 GLUE 分数-FLOPs 的性能曲线，如图 4 和 5 所示。性能曲线是二维的，显示了不同方法的帕累托最优性。为了关注计算量和性能都较小的模型，我们在图中用蓝色虚线绘制了帕累托前沿。

▲ 图4 第一组模型的性能曲线。水平虚线为 BERT 模型 95% 的性能，竖直虚线为 BERT 模型 5% 的运算量

▲ 图5 第二组模型的性能曲线。水平虚线为 BERT 模型 97% 的性能，竖直虚线为 BERT 模型 25% 的运算量

如图 4 和 5，COST-EFF 和 COST-EFF 的表现都超过了 DistilBERT、DeeBERT、PABEE 和 BERT 基线。与 TinyBERT 和 ElasticBERT 相比时，COST-EFF 通常是最优的。我们发现，使用多出口网络会降低 NLI 任务性能的上限，即 COST-EFF 和 ElasticBERT 在 QNLI 和 MNLI 任务上的最优性能均不如 TinyBERT。

这个问题可能源于 NLI 任务中的复杂样本依赖于高层语义，浅层应更多地为深层服务，而不是试图自己解决任务。然而，这个问题并不影响全局最优性，如图 4 所示，COST-EFF 在 QNLI 和 MNLI 上对 TinyBERT 的性能是非劣的。

在图 6 中，我们绘制了第一组模型的层级性能。与 DeeBERT 和 PABEE 相比，COST-EFF 实现了最优的性能。与 TinyBERT 相比，COST-EFF 可以在深层（第 7 层到第 12 层）取得更好的性能，进一步验证了我们的主张，即细而深的模型优于宽而浅的模型。

▲ 图6 第一组模型的层级性能。水平虚线为 TinyBERT 最后一层分类器的性能

3.3 消融实验

3.3.1 知识蒸馏的影响

蒸馏策略的消融实验旨在评估预测和特征蒸馏的有效性。在这项消融研究中，比较方法是：

消融特征蒸馏，仅使用预测蒸馏，即
使用真实标签代替预测蒸馏，即

▲ 表3 蒸馏策略的消融实验结果

表 3 结果表明，这两个目标都很关键。由于对隐藏表征的模仿，COST-EFF 与没有特征蒸馏的训练相比，性能上有 1.6%的优势。如果没有预测蒸馏，性能下降超过 3.4%。先前的静态压缩工作，如 TinyBERT 和 CoFi，在 GLUE 任务中一般对预测蒸馏不敏感，因为单出口模型的输出分布一般与真实标签一致。然而，如果预测分布被消融，COST-EFF 的性能就会出现较大的下降。

这一结果表明，在浅层追求真实标签使深层的性能恶化。这种浅层和深层之间的不一致普遍存在于多出口模型中，在大容量模型中对性能影响较小，但尤其难以被小容量的压缩模型所权衡。因此，COST-EFF 引入了未压缩的 TA 模型来缓解浅层和深层的不一致，并通过预测蒸馏来转移 TA 模型学习到的权衡。

3.3.2 联合训练流程的影响

COST-EFF 中，我们提出了一种模型压缩和动态提前退出的联合训练方法，旨在校正浅层模块的细化，使其更能适应。为了验证训练流程的有效性，首先，我们像 DeeBERT 那样实现了两阶段的训练模式。此外，我们还在 COST-EFF 细化时消融了多出口损失。上述方法的逐层比较如图 7 所示。

▲ 图7 联合训练的消融实验结果。水平虚线为 TinyBERT 最后一层分类器的性能

直观地说，两阶段训练在最后一层比联合训练有优势，因为两阶段训练中没有将层间不一致性引入模型主干。然而，这种优势不存在于浅层中，使得两阶段训练的整体性能无法接受。与消融了多出口损失的细化方法相比，我们的方法有 1.1% 到 2.3% 的优势。

需要注意的是，消融了多出口损失的细化方法仍然可以达到与 COST-EFF 相似的浅层性能，这表明基于蒸馏的训练在恢复性能上是有效的。然而，消融了多出口损失的细化方法在深层表现出较差的性能，说明这种方法收到层间不一致性的影响，未能较好地做出权衡，证明了 COST-EFF 联合训练流程的有效性和必要性。

总结

本文提出了 COST-EFF，有效地结合了静态的模型细化和动态的推断加速，以实现高效地 PLM。特别地，我们提出了一种联合优化方法，使模型细化和推断加速互相增益。仅细化模型而不减少模型深度，使基于动态提前退出的推断加速能够更好地处理复杂输入，而不为简单输入引来额外开销。同时，动态提前退出引入的多出口损失也可以校正模型细化过程，进一步提高压缩模型的性能。GLUE 数据集上的实验证明了本文方法的有效性和高效性。

本文的方法还存在以下的优化方向。

1. 在动态提前退出模型的推断过程中，一般将批次大小设置为 1，以便根据单个输入样本调整计算。然而，较大的批次大小会减少实际运算时间，但一个批次内的输入样本复杂度可能会有很大的不同。可以考虑将具有相似期望复杂度的样本收集到一个批次中，同时控制具有不同复杂度的批次的优先级以实现并行性。

2. 遵循现有的基线方法 TinyBERT 和 ElasticBERT，我们选择自然语言理解任务来研究压缩和加速。然而，COST-EFF 的可扩展性还有待在自然语言生成、翻译等复杂任务上探索。目前，静态模型压缩已被证明在复杂的任务中是有效的 [10]，我们正在尝试在其他任务上，使用具有迭代过程的模型（如 Transformer 的多层迭代）进行动态推理加速。

参考文献

[1] [jiao2020tinybert]: Xiaoqi Jiao, Yichun Yin, Lifeng Shang, Xin Jiang, Xiao Chen, Linlin Li, Fang Wang, and Qun Liu. 2020. TinyBERT: Distilling BERT for natural language understanding. In Findings of the Association for Computational Linguistics: EMNLP 2020, pages 4163–4174, Online. Association for Computational Linguistics.

[2] [xin2020deebert]: Ji Xin, Raphael Tang, Jaejun Lee, Yaoliang Yu, and Jimmy Lin. 2020. DeeBERT: Dynamic early exiting for accelerating BERT inference. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics, pages 2246–2251, Online. Association for Computational Linguistics.

[3] [liu2022towards]: Xiangyang Liu, Tianxiang Sun, Junliang He, Jiawen Wu, Lingling Wu, Xinyu Zhang, Hao Jiang, Zhao Cao, Xuanjing Huang, and Xipeng Qiu. 2022. Towards efficient NLP: A standard evaluation and a strong baseline. In Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, pages 3288–3303, Seattle, United States. Association for Computational Linguistics.

[4] [bengio2007scaling]: Yoshua Bengio, Yann LeCun, et al. 2007. Scaling learning algorithms towards ai. Large-scale kernel machines, 34(5):1–41.

[5] [zhou2020bert]: Wangchunshu Zhou, Canwen Xu, Tao Ge, Julian McAuley, Ke Xu, and Furu Wei. 2020. Bert loses patience: Fast and robust inference with early exit. Advances in Neural Information Processing Systems, 33:18330–18341.

[6] [li2019improved]: Hao Li, Hong Zhang, Xiaojuan Qi, Ruigang Yang, and Gao Huang. 2019. Improved techniques for training adaptive deep networks. In 2019 IEEE/CVF International Conference on Computer Vision, ICCV 2019, Seoul, Korea (South), October 27 - November 2, 2019, pages 1891–1900. IEEE.

[7] [wang2018glue]: Alex Wang, Amanpreet Singh, Julian Michael, Felix Hill, Omer Levy, and Samuel R. Bowman. 2019. GLUE: A multi-task benchmark and analysis platform for natural language understanding. In 7th International Conference on Learning Representations, ICLR 2019, New Orleans, LA, USA, May 6-9, 2019. OpenReview.net.

[8] [turc2019well]: Iulia Turc, Ming-Wei Chang, Kenton Lee, and Kristina Toutanova. 2019. Well-read students learn better: The impact of student initialization on knowledge distillation. CoRR, abs/1908.08962.

[9] [sanh2019distilbert]: Victor Sanh, Lysandre Debut, Julien Chaumond, and Thomas Wolf. 2020. DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter. arXiv:1910.01108 [cs]. ArXiv: 1910.01108.

[10] [gupta2022compression]: Manish Gupta and Puneet Agrawal. 2022. Compression of deep learning models for text: A survey. ACM Transactions on Knowledge Discovery from Data (TKDD), 16(4):1–55.

更多阅读

#投稿通道#

让你的文字被更多人看到

如何才能让更多的优质内容以更短路径到达读者群体，缩短读者寻找优质内容的成本呢？答案就是：你不认识的人。

总有一些你不认识的人，知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁，促使不同背景、不同方向的学者和学术灵感相互碰撞，迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人，在我们的平台上分享各类优质内容，可以是最新论文解读，也可以是学术热点剖析、科研心得或竞赛经验讲解等。我们的目的只有一个，让知识真正流动起来。

稿件基本要求：

• 文章确系个人原创作品，未曾在公开渠道发表，如为其他平台已发表或待发表的文章，请明确标注

• 稿件建议以 markdown 格式撰写，文中配图以附件形式发送，要求图片清晰，无版权问题

• PaperWeekly 尊重原作者署名权，并将为每篇被采纳的原创首发稿件，提供业内具有竞争力稿酬，具体依据文章阅读量和文章质量阶梯制结算

投稿通道：

• 投稿邮箱：[email protected]

• 来稿请备注即时联系方式（微信），以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信（pwbot02）快速投稿，备注：姓名-投稿

△长按添加PaperWeekly小编

现在，在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

你可能感兴趣的:(EMNLP 2022 | 预训练语言模型的时空效率优化)

react中关于组件的一些概念(有无状态组件、组件封装与继承、高阶组件) 不能懒鸭 react基础面试 react.js javascript 前端
怎么理解“在react中，一切皆为组件”句话react采用组件化的思想，最小的组件单位就是原生HTML元素，采用JSX语法组件声明调用react的虚拟dom，就是一个大的组件树，从父组件层到子组件，在react-routerv4版开始，路由本身也是组件各个库提供的hoc返回也是组件，如withRouter、connectreact中的基础数据stateprops的传递也是以组件为基础1.什么是组件
Alibaba grpc Dubbo view 稚辉君.MCA_P8_Java 高可用Kubernetes集群在线全科家教 CentOS7.6 dubbo 大数据 java
什么是Dubbo？它的作用是什么？答：Dubbo是一款高性能的JavaRPC框架，是阿里巴巴公司开源的产品，用于提供高性能的分布式服务框架和面向服务的架构。Dubbo的主要作用是帮助分布式应用程序进行服务治理，如服务注册、服务发现、负载均衡、容错等。Dubbo的架构是怎样的？答：Dubbo的架构主要分为三层：服务接口层、服务实现层和服务注册层。服务接口层是提供给客户端的接口，服务实现层是具体的服务
小米笔试-懂二进制 li563868273 算法(第4版)面试笔试题二进制
题目：世界上有10种人，一种懂二进制，一种不懂。那么你知道两个int32整数m和n的二进制表达，有多少个位(bit)不同么？输入：19992299输出：7思路判断有多少位不同，我们可以使用异或，把两个数异或之后得到的数，不相同的位就是1。接下来我们只需要统计异或之后的数字有多少位具体代码实现：publicintcountBitDiff(intm,intn){intdif=m^n;//先将二者做异或
DBeaver连接MySQL提示Access denied for user ‘‘@‘ip‘ (using password: YES)的解决方法 lingllllove mysql tcp/ip adb
在使用DBeaver连接MySQL数据库时，如果遇到“Accessdeniedforuser''@'ip'(usingpassword:YES)”的错误提示，说明用户认证失败。此问题通常与数据库用户权限、配置错误或网络设置有关。本文将详细介绍解决此问题的步骤。一、检查用户名和密码首先，确保在DBeaver中输入的用户名和密码是正确的。验证步骤如下：打开DBeaver，选择对应的数据库连接。检查连接
React 高阶组件（HOC） web Rookie React react.js javascript 前端
文章目录一.高阶组件（HOC）的定义二.HOC的作用和优势三.HOC的使用方式四.HOC的注意事项和潜在问题五.应用场景1.权限控制与认证2.数据获取与预加载3.样式和主题管理4.性能优化-缓存数据或组件渲染结果5.日志记录与调试辅助六.总结一.高阶组件（HOC）的定义高阶组件（Higher-OrderComponent，简称HOC）是一种在React中用于复用组件逻辑的高级技术。它本质上是一个函
【教程4＞第5章＞第22节】基于FPGA的Gardner环实现——时偏误差检测模块 fpga和matlab #fpga开发 Gardner环时偏误差检测教程4
欢迎订阅FPGA/MATLAB/Simulink系列教程《★教程1:matlab入门100例》《★教程2:fpga入门100例》《★教程3:simulink入门60例》《★教程4:FPGA/MATLAB/Simulink联合开发入门与进阶X例》目录1.软件版本2.时偏误差检测模块的FPGA实现2.1原理回顾2.2verilog程序3.时偏误差检测模块的仿真测试
深入解析 Python 装饰器：高级用法、最佳实践与源码剖析赵大仁 Python 后端技术 python 开发语言人工智能
深入解析Python装饰器：高级用法、最佳实践与源码剖析Python装饰器（Decorator）是一种强大且灵活的特性，允许开发者在不修改原函数代码的情况下，为其动态地添加额外功能。装饰器广泛应用于日志记录、权限控制、性能优化、缓存机制等场景。本文将从装饰器的底层原理、高级用法、性能优化、常见陷阱及源码分析等多个角度，深度解析Python装饰器的强大之处。1.Python装饰器的底层原理装饰器本质
NotebookLM：Google 最新 AI 笔记助理解析与实战应用赵大仁人工智能技术大语言模型深度学习人工智能语言模型自然语言处理机器学习笔记
NotebookLM：Google最新AI笔记助理解析与实战应用在AI驱动的生产力工具不断进化的今天，Google推出的NotebookLM（NotebookLanguageModel）成为了一款备受关注的智能笔记助理。它结合了Google的大语言模型（LLM）能力，帮助用户更高效地整理、理解和生成知识内容。本文将全面解析NotebookLM的技术原理、核心功能、应用场景，并提供实际使用指南，帮助
青龙面板脚本开发指南：高效自动化任务的实现赵大仁运维 docker 虚拟化服务器运维运维开发自动化 python javascript 开源
青龙面板脚本开发指南：高效自动化任务的实现青龙面板（QinglongPanel）是一款强大的任务管理平台，支持多种语言的脚本开发和执行。通过在青龙面板中编写和管理脚本，用户可以轻松实现自动化任务，提高工作效率。本文将深入介绍青龙面板脚本开发的基本流程、最佳实践和常见应用场景，帮助开发者快速上手并提升任务管理能力。1.青龙面板脚本开发简介1.1脚本开发的意义在青龙面板中，脚本是实现自动化任务的核心。
wow-agent---task4 MetaGPT初体验 Allen20000 pygame python 人工智能
先说坑：1.使用gitclone模式安装metagpt2.模型尽量使用在线模型或本地高参数模型。这里使用python3.10.11调试成功一，安装安装|MetaGPT，参考这里的以开发模型进行安装gitclonehttps://github.com/geekan/MetaGPT.gitcd/your/path/to/MetaGPTpipinstall-e.在下载后的目录中有一个config文件夹，
腾讯笔试真题--二进制字符串（leetcode--930） Mr_Ystreet leetcode leetcode 编程笔试腾讯笔试
腾讯笔试真题二进制字符串一个字符串如果只包含字符’0’或者’1’，那么就称这个字符串为二进制字符串。一个字符串w的子串v是一个非空的字符串，并且它由从w的某个位置开始的一段连续的字符构成。比如字符串"010"有6个子串，“0”,“1”,“0”,“01”,“10”,“010”。如果两个子串出现的位置不相同，那么就考虑这两个子串是不同的。因此，如果某个子串在不同的位置出现了很多次，那么它们都是不相同的
蓝桥杯备赛指南分享小布先生~噫嘘唏蓝桥杯职场和发展算法
什么是蓝桥杯蓝桥杯是中国著名的计算机程序设计大赛，由教育部主管、全国高等学校计算机教育研究会、CCF（中国计算机学会）主办，自2002年起每年举办一次。蓝桥杯这个名字来源于江苏扬州的个园，因该园中有座名为“蓝桥”的小桥而得名。该比赛旨在提高大学生计算机程序设计能力，增强创新思维和团队协作精神，也是许多计算机相关专业学子非常看重的比赛之一。蓝桥杯举行的意义首先，蓝桥杯作为国内顶尖的计算机程序设计大赛
统计用户输入的数字（0到9）出现的次数，并输出每个数字出现的次数（超详细解析）人机yu 算法数据结构学习方法笔记
1.头文件#include#include：这行代码引入了标准输入输出库stdio.h，该库提供了输入输出函数，比如scanf()和printf()。2.主函数声明intmain()intmain()：这是C语言程序的入口函数，程序从这里开始执行。3.变量声明intx;intcount[10];inti;intx;：声明了一个整数变量x，用来存储用户输入的数字。intcount[10];：声明了一
matlab快速入门（2）-- 数据处理与可视化 kyle~ matlab matlab 人工智能算法
MATLAB的数据处理1.数据导入与导出(1)从文件读取数据Excel文件：data=readtable('data.xlsx');%读取为表格（Table）CSV文件：data=readtable('data.csv');%自动处理表头和分隔符文本文件：data=load('data.txt');%数值数据直接加载为矩阵(2)导出数据到文件保存为Excel：writetable(data,'ou
Java软件架构：2020年2月最佳实践与趋势王元祺
本文还有配套的精品资源，点击获取简介：本资源探讨了2020年2月软件架构领域的主要趋势，重点关注微服务、容器化、DevOps、云原生以及CI/CD等关键议题。特别强调了Java在现代软件架构中的应用，包括微服务架构的实现，容器化技术如Docker的使用，以及Kubernetes等容器编排工具。还涉及到了Java的新特性、性能优化、安全性、可扩展性以及设计和架构模式。资料包括实例代码、文档和教程，致
云计算部署模式全面解析 ivwdcwso 云计算
目录引言公有云私有云混合云三种部署模式的对比选择建议未来趋势结语1.引言随着云计算技术的快速发展,企业在选择云部署模式时面临着多种选择。本文将深入探讨云计算的三种主要部署模式:公有云、私有云和混合云,帮助读者全面了解它们的特点、优势及适用场景。©ivwdcwso(ID:u012172506)2.公有云2.1定义公有云是由第三方云服务提供商提供的云计算服务,通过互联网向公众开放。多个客户共享同一基础
笔试-二进制查士丁尼·绵算法与数据结构二进制
应用题将符合区间[l,r]内的十进制整数转换为二进制表示，请问不包含“101”的整数个数是多少？实现l=int(input("请输入下限l，其值大于等于1："))r=int(input("请输入上限r，其值大于等于l："))binary_list=[]#默认值为0，对应数值为1，未反转defdecimal_to_binary(number):ifnumber==0:#第一次要对空列表配置，否则后面
电子电气架构 --- 汽车电子电器设计概述车载诊断技术电子电器架构开发流程架构汽车自动驾驶人工智能安全机器学习
我是穿拖鞋的汉子，魔都中坚持长期主义的汽车电子工程师。老规矩，分享一段喜欢的文字，避免自己成为高知识低文化的工程师：所谓鸡汤，要么蛊惑你认命，要么怂恿你拼命，但都是回避问题的根源，以现象替代逻辑，以情绪代替思考，把消极接受现实的懦弱，伪装成乐观面对不幸的豁达，往不幸上面喷“香水”来掩盖问题。无人问津也好,技不如人也罢,你都要试着安静下来,去做自己该做的事.而不是让内心的烦躁、焦虑、毁掉你本就不多的
使用 Docker(Podman) 部署 MongoDB 数据库及使用详解特立独行的猫a Go语言实践笔记数据库 docker podman
在现代开发环境中，容器化技术（如Docker和Podman）已成为部署和管理应用程序的标准方式。本文将详细介绍如何使用Podman/Docker部署MongoDB数据库，并确保其他应用程序容器能够通过Docker网络成功连接到MongoDB。我们将逐步解决常见的问题，如权限配置和认证设置，应用容器如何连接和使用容器中的MongoDB数据库等。选择Podman而不是Docker为什么选择Podman
使用crontab 对docker下的mongoDB数据定时备份 YLIHMS crontab linux mongodb
定时备份MongoDB数据环境：我做备份的环境是linux4.1964位、docker19、Mongo:4.2.3crontab：crontab命令常见于Unix和类Unix的操作系统之中，用于设置周期性被执行的指令。该命令从标准输入设备读取指令，并将其存放于“crontab”文件中，以供之后读取和执行。该词来源于希腊语chronos(χρ?νο?)，原意是时间。通常，crontab储存的指令被守
docker-compose部署MongoDB&MySQL&RabbitMQ集群靖子甘 docker docker mysql rabbitmq mongodb 云服务
在三个节点：172.29.154.8、172.29.154.9、172.29.154.10部署MongoDB1主2从副本集、RabbitMQ主-主、MySQL主-从复制。这些节点是在同一个内网环境下的，节点间互通，各节点部署的服务器关系如下表，其中，MySQL的主节点是172.29.154.9，与其他的服务反过来了，目的是减轻单节点的压力。本文采用docker-compose同时启动多台服务，如果
Qt MDI和Ribbon界面集成实践教程 Pella732
本文还有配套的精品资源，点击获取简介：本文深入介绍了基于Qt的RibbonMDIDemo项目，该项目展示了一个具有MicrosoftOffice风格的RibbonBar的多文档界面应用程序。通过一个完整的示例工程，读者可以学习如何在Qt环境中构建Ribbon风格的用户界面以及多文档界面（MDI）的应用程序。教程覆盖了RibbonBar的设计、MDIArea的管理、菜单和工具栏的整合，以及文档和视图
100.3 AI量化面试题：解释配对交易(Pairs Trading)的原理，并说明如何选择配对股票以及设计交易信号 AI量金术师金融资产组合模型进化论人工智能金融机器学习 python 算法数学建模面试
目录0.承前1.配对交易基本原理1.1什么是配对交易1.2基本假设2.配对选择方法2.1相关性分析2.2协整性检验3.价差计算方法3.1简单价格比率3.2回归系数法4.交易信号设计4.1标准差方法4.2动态阈值方法5.风险管理5.1止损设计5.2仓位管理6.策略评估6.1回测框架6.2性能指标7.回答话术0.承前如果想更加全面清晰地了解金融资产组合模型进化论的体系架构，可参考：0.金融资产组合模型
99.24 金融难点通俗解释：MLF（中期借贷便利）vs LPR（贷款市场报价利率） AI量金术师金融资产组合模型进化论金融 python 机器学习人工智能数据可视化
目录0.承前1.什么是MLF？1.1专业解释1.2通俗解释1.3MLF的三个关键点：2.什么是LPR？2.1专业解释2.2通俗解释2.3LPR的三个关键点：3.MLF和LPR的关系4.传导机制4.1第一步：央行调整MLF4.2第二步：银行调整LPR4.3第三步：影响实际贷款5.实际案例6.为什么要关注？7.小贴士7.1关注渠道7.2实用建议8.总结9.LPR数据获取代码实现&数据可视化9.1数据获
音视频入门基础：RTP专题（5）——FFmpeg源码中，解析SDP的实现崔杰城 FFmpeg源码分析音视频技术音视频 ffmpeg
一、引言FFmpeg源码中通过ff_sdp_parse函数解析SDP。该函数定义在libavformat/rtsp.c中：intff_sdp_parse(AVFormatContext*s,constchar*content){constchar*p;intletter,i;charbuf[SDP_MAX_SIZE],*q;SDPParseStatesdp_parse_state={{0}},*s
如何使用SliverGrid组件 talk_8 一起Talk Flutter吧移动开发Flutter
文章目录1概念介绍2使用方法3示例代码我们在上一章回中介绍了SliverList组件相关的内容，本章回中将介绍SliverGrid组件.闲话休提，让我们一起TalkFlutter吧。1概念介绍我们在本章回中介绍的SliverGrid组件是一种网格类组件，主要用来创建网格类布局，它和GridView组件类似，它们的不同之处在于SliverGrid组件可以被当作一个整体来滑动。我们将在本章回中详细介绍
Node+puppeteer学习笔记（九）--使用-Python3 + Pyppeteer 温柔夏目 Puppeteer
因为我是Python流，自动化都是基于Python的，所以一直在关注Puppeteer这个包是否会被Python支持，然后我就在官网上找到了Pyppeteer这个包，因为修改了第二个字母，差点没认出来，这个包其实就是根据Puppeteer实现的地址如下：官方GitHub仓库：https://github.com/miyakogi/pyppeteer.官方API地址：https://miyakogi
基于Spring Boot的校园志愿者服务网站超级无敌暴龙战士塔塔开 Java课设与毕设资源 spring boot java 后端
文章目录项目介绍主要功能截图：登录个人中心志愿者管理活动类型管理活动报名管理活动心得部分代码展示设计总结项目获取方式作者主页：Java韩立简介：Java领域优质创作者、简历模板、学习资料、面试题库【关注我，都给你】文末获取源码联系项目介绍校园志愿者服务网站，java项目，springboot项目。eclipse和idea都能打开运行。推荐环境配置：eclipse/ideajdk1.8mavenmy
Java学习教程，从入门到精通，JDBC中WHERE子句的语法知识点及案例代码（107）知识分享小能手大数据 Java 编程语言如门 java 学习开发语言数据库大数据 JDBC intellij-idea
JDBC中WHERE子句的语法知识点及案例代码JDBCWHERE子句语法知识点WHERE子句用于在SQL查询中对数据进行筛选，它可以根据指定的条件过滤数据行。在JDBC中，WHERE子句通常用于SELECT、UPDATE和DELETE语句中。常见的WHERE子句条件比较运算符=：等于：大于=：大于等于18ANDscore>=80";try{//加载数据库驱动Class.forName("com.m
Mac M1 源码安装FFmpeg，开启enable-gpl 和 lib x264 福葫芦 macos ffmpeg
1、第一步：下载并安装minicodacurl-Ohttps://repo.anaconda.com/miniconda/Miniconda3-latest-MacOSX-arm64.shshMiniconda3-latest-MacOSX-arm64.sh2、第二步：安装必要的依赖condainstall-cconda-forgegccmakenasmyasm3、第三步：下载FFmpeg源代码（
eclipse maven IXHONG eclipse
eclipse中使用maven插件的时候，运行run as maven build的时候报错 -Dmaven.multiModuleProjectDirectory system propery is not set. Check $M2_HOME environment variable and mvn script match. 可以设一个环境变量M2_HOME指
timer cancel方法的一个小实例 alleni123 多线程 timer
package com.lj.timer; import java.util.Date; import java.util.Timer; import java.util.TimerTask; public class MyTimer extends TimerTask { private int a; private Timer timer; pub
MySQL数据库在Linux下的安装 ducklsl mysql
1.建好一个专门放置MySQL的目录 /mysql/db数据库目录 /mysql/data数据库数据文件目录 2.配置用户，添加专门的MySQL管理用户 >groupadd mysql ----添加用户组 >useradd -g mysql mysql ----在mysql用户组中添加一个mysql用户 3.配置，生成并安装MySQL >cmake -D
spring------>>cvc-elt.1: Cannot find the declaration of element Array_06 spring bean
将-------- <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3
maven发布第三方jar的一些问题 cugfy maven
maven中发布第三方jar到nexus仓库使用的是 deploy:deploy-file命令有许多参数，具体可查看 http://maven.apache.org/plugins/maven-deploy-plugin/deploy-file-mojo.html 以下是一个例子： mvn deploy:deploy-file -DgroupId=xpp3
MYSQL下载及安装 357029540 mysql
好久没有去安装过MYSQL，今天自己在安装完MYSQL过后用navicat for mysql去厕测试链接的时候出现了10061的问题，因为的的MYSQL是最新版本为5.6.24，所以下载的文件夹里没有my.ini文件，所以在网上找了很多方法还是没有找到怎么解决问题，最后看到了一篇百度经验里有这个的介绍，按照其步骤也完成了安装，在这里给大家分享下这个链接的地址
ios TableView cell的布局张亚雄 tableview
cell.imageView.image = [UIImage imageNamed:[imageArray objectAtIndex:[indexPath row]]]; CGSize itemSize = CGSizeMake(60, 50); &nbs
Java编码转义 adminjun java 编码转义
import java.io.UnsupportedEncodingException; /** * 转换字符串的编码 */ public class ChangeCharset { /** 7位ASCII字符，也叫作ISO646-US、Unicode字符集的基本拉丁块 */ public static final Strin
Tomcat 配置和spring aijuans spring
简介 Tomcat启动时，先找系统变量CATALINA_BASE，如果没有，则找CATALINA_HOME。然后找这个变量所指的目录下的conf文件夹，从中读取配置文件。最重要的配置文件：server.xml 。要配置tomcat，基本上了解server.xml，context.xml和web.xml。 Server.xml -- tomcat主
Java打印当前目录下的所有子目录和文件 ayaoxinchao 递归 File
其实这个没啥技术含量，大湿们不要操笑哦，只是做一个简单的记录，简单用了一下递归算法。 import java.io.File; /** * @author Perlin * @date 2014-6-30 */ public class PrintDirectory { public static void printDirectory(File f
linux安装mysql出现libs报冲突解决 BigBird2012 linux
linux安装mysql出现libs报冲突解决安装mysql出现 file /usr/share/mysql/ukrainian/errmsg.sys from install of MySQL-server-5.5.33-1.linux2.6.i386 conflicts with file from package mysql-libs-5.1.61-4.el6.i686
jedis连接池使用实例 bijian1013 redis jedis连接池 jedis
实例代码： package com.bijian.study; import java.util.ArrayList; import java.util.List; import redis.clients.jedis.Jedis; import redis.clients.jedis.JedisPool; import redis.clients.jedis.JedisPoo
关于朋友 bingyingao 朋友兴趣爱好维持
成为朋友的必要条件：志相同，道不合，可以成为朋友。譬如马云、周星驰一个是商人，一个是影星，可谓道不同，但都很有梦想，都要在各自领域里做到最好，当他们遇到一起，互相欣赏，可以畅谈两个小时。志不同，道相合，也可以成为朋友。譬如有时候看到两个一个成绩很好每次考试争做第一，一个成绩很差的同学是好朋友。他们志向不相同，但他
【Spark七十九】Spark RDD API一 bit1129 spark
aggregate package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} //测试RDD的aggregate方法 object AggregateTest { def main(args: Array[String]) { val conf = new Spar
ktap 0.1 released bookjovi kernel tracing
Dear, I'm pleased to announce that ktap release v0.1, this is the first official release of ktap project, it is expected that this release is not fully functional or very stable and we welcome bu
能保存Properties文件注释的Properties工具类 BrokenDreams properties
今天遇到一个小需求：由于java.util.Properties读取属性文件时会忽略注释，当写回去的时候，注释都没了。恰好一个项目中的配置文件会在部署后被某个Java程序修改一下，但修改了之后注释全没了，可能会给以后的参数调整带来困难。所以要解决这个问题。 &nb
读《研磨设计模式》-代码笔记-外观模式-Facade bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 百度百科的定义： * Facade（外观）模式为子系统中的各类（或结构与方法）提供一个简明一致的界面， * 隐藏子系统的复杂性，使子系统更加容易使用。他是为子系统中的一组接口所提供的一个一致的界面 * * 可简单地
After Effects教程收集 cherishLC After Effects
1、中文入门 http://study.163.com/course/courseMain.htm?courseId=730009 2、videocopilot英文入门教程（中文字幕） http://www.youku.com/playlist_show/id_17893193.html 英文原址： http://www.videocopilot.net/basic/ 素
Linux Apache 安装过程 crabdave apache
Linux Apache 安装过程下载新版本： apr-1.4.2.tar.gz（下载网站：http://apr.apache.org/download.cgi） apr-util-1.3.9.tar.gz（下载网站：http://apr.apache.org/download.cgi） httpd-2.2.15.tar.gz（下载网站：http://httpd.apac
Shell学习之变量赋值和引用 daizj shell 变量引用赋值
本文转自：http://www.cnblogs.com/papam/articles/1548679.html Shell编程中，使用变量无需事先声明，同时变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）中间不能有空格，可以使用下划线（_）不能使用标点符号不能使用bash里的关键字（可用help命令查看保留关键字）需要给变量赋值时，可以这么写：
Java SE 第一讲（Java SE入门、JDK的下载与安装、第一个Java程序、Java程序的编译与执行） dcj3sjt126com java jdk
Java SE 第一讲： Java SE：Java Standard Edition Java ME: Java Mobile Edition Java EE：Java Enterprise Edition Java是由Sun公司推出的（今年初被Oracle公司收购）。收购价格：74亿美金 J2SE、J2ME、J2EE JDK：Java Development
YII给用户登录加上验证码 dcj3sjt126com yii
1、在SiteController中添加如下代码： /** * Declares class-based actions. */ public function actions() { return array( // captcha action renders the CAPTCHA image displ
Lucene使用说明 dyy_gusi Lucene search 分词器
Lucene使用说明 1、lucene简介 1.1、什么是lucene Lucene是一个全文搜索框架，而不是应用产品。因此它并不像baidu或者googleDesktop那种拿来就能用，它只是提供了一种工具让你能实现这些产品和功能。 1.2、lucene能做什么要回答这个问题，先要了解lucene的本质。实际
学习编程并不难,做到以下几点即可! gcq511120594 数据结构编程算法
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
Java面试十问之三：Java与C++内存回收机制的差别 HNUlanwei java C++finalize()堆栈内存回收
大家知道， Java 除了那 8 种基本类型以外，其他都是对象类型（又称为引用类型）的数据。 JVM 会把程序创建的对象存放在堆空间中，那什么又是堆空间呢？其实，堆（ Heap）是一个运行时的数据存储区，从它可以分配大小各异的空间。一般，运行时的数据存储区有堆（ Heap）和堆栈（ Stack），所以要先看它们里面可以分配哪些类型的对象实体，然后才知道如何均衡使用这两种存储区。一般来说，栈中存放的
第二章 Nginx+Lua开发入门 jinnianshilongnian nginx lua
Nginx入门本文目的是学习Nginx+Lua开发，对于Nginx基本知识可以参考如下文章： nginx启动、关闭、重启 http://www.cnblogs.com/derekchen/archive/2011/02/17/1957209.html agentzh 的 Nginx 教程 http://openresty.org/download/agentzh-nginx-tutor
MongoDB windows安装基本命令 liyonghui160com
windows安装安装目录： D:\MongoDB\ 新建目录 D:\MongoDB\data\db 4.启动进城： cd D:\MongoDB\bin mongod -dbpath D:\MongoDB\data\db &n
Linux下通过源码编译安装程序 pda158 linux
一、程序的组成部分　　Linux下程序大都是由以下几部分组成：　　二进制文件：也就是可以运行的程序文件　　库文件：就是通常我们见到的lib目录下的文件　　配置文件：这个不必多说，都知道　　帮助文档：通常是我们在linux下用man命令查看的命令的文档　　二、linux下程序的存放目录　　linux程序的存放目录大致有三个地方：　　/etc, /b
WEB开发编程的职业生涯４个阶段 shw3588 编程 Web 工作生活
觉得自己什么都会 2007年从学校毕业，凭借自己原创的ASP毕业设计，以为自己很厉害似的，信心满满去东莞找工作，找面试成功率确实很高，只是工资不高，但依旧无法磨灭那过分的自信，那时候什么考勤系统、什么OA系统、什么ERP，什么都觉得有信心，这样的生涯大概持续了约一年。根本不是自己想的那样 2008年开始接触很多工作相关的东西，发现太多东西自己根本不会，都需要去学，不管是asp还是js，
遭遇jsonp同域下变作post请求的坑 vb2005xu jsonp 同域post
今天迁移一个站点时遇到一个坑爹问题,同一个jsonp接口在跨域时都能调用成功,但是在同域下调用虽然成功,但是数据却有问题. 此处贴出我的后端代码片段 $mi_id = htmlspecialchars(trim($_GET['mi_id '])); $mi_cv = htmlspecialchars(trim($_GET['mi_cv '])); 贴出我前端代码片段: $.aj