PaperWeekly

Prompt Pre-training：迈向更强大的Parameter-Efficient Prompt Tuning

©PaperWeekly 原创 · 作者 | 李国趸

单位 | 浙江大学硕士生

研究方向 | 少样本学习

前言

从 prompt learning 的发展来看，一开始关注的是将任务建模成和预训练相近的形式能够提高在少样本微调全部模型参数的表现，然后就是关注怎么去更好地设计 prompt，可以是离散，也可以是连续，或者是混合的 template。

连续型 prompt 的出现，让人们开始思考能否只微调 prompt 相关的参数，固定预训练模型的参数，从而避免传统 fine-tuning 的问题，即每一个下游任务，都要存储一份特定于该任务的微调后的模型拷贝，这种方式被叫做 Parameter-Efficient Prompt Tuning。

这样的设想，最大的挑战在于，仅微调 prompt 相关的参数，能否媲美甚至超过 fine-tuning 的表现。

于是提出下面几种疑问：

在全量数据情况下，仅微调 prompt 相关的参数，能否媲美甚至超过 fine-tuning 的表现？
在少量数据情况下，仅微调 prompt 相关的参数，能否媲美甚至超过 fine-tuning 的表现？
如果能做到上述表现，预训练模型的尺寸是否有影响？是否一定需要超大预训练模型？

本文通过详细解读三篇文章给大家展示了 Parameter-Efficient Prompt Tuning 的发展是如何解决上述疑问的。

从Parameter-Efficient Prompt Tuning说起

论文标题：

The Power of Scale for Parameter-Efficient Prompt Tuning

收录会议：

EMNLP 2021

论文链接：

https://arxiv.org/abs/2104.08691

代码链接：

https://github.com/kipgparker/soft-prompt-tuning

2.1 动机

尽管之前出现了一些全自动设计模板的技术，但是 prompt-based 的范式在下游任务上的表现和传统 fine-tuning 的范式仍然有较大的差距。但是传统 fine-tuning 范式也存在一些问题，比如针对每一个下游任务，都要存储一份特定于该任务的微调后的模型拷贝。

由此，作者提出一种 Parameter-Efficient 的 Prompt Tuning 方式，即固定预训练模型，每个下游任务仅添加若干个 tunable 的 token 作为前缀。后续实验证明了这种方式在大规模预训练模型的助力下，能够媲美传统的 fine-tuning 表现。

2.2 方法

作者以 T5 模型为 backbone，将所有任务重定义为 text-to-text 的生成任务，给定输入，生成的文本代表输出的标签。“prompt”部分则由若干 tunable 的 token 组成，作为输入文本的前缀。在 prompt tuning 过程中，只有 tunable 的 token embeddings 被训练，其他所有参数都被固定住。尽管方法听起来很简单，但是还有一些细节需要被考虑。

prompt 设计的相关问题。首先是 prompt tokens 的初始化。一种简单的方式是直接从零训练，另一种方法则是采用词表中的一些预训练的 token embeddings 去初始化。对于分类任务，还有一种则是用输出类别相关的词去初始化，作为一种 constraint 让模型的输出尽量是这些合法的类别。另外一个问题就是 prompt 的长度，直觉上看，prompt 越长，则可微调的参数越多，作者希望能够在引入最少的可微调参数下达到理想的表现。

Pre-trained 模型的相关问题。一个理想的 prompt 设计应该尽量接近预训练的任务，缩小预训练和下游之间的 gap。T5 模型的预训练任务是 Span Corruption，模型被要求去重构被打乱的句子。例如：Thank you for inviting me to your party last week。模型的输入被打乱为“Thank youme to your partyweek”，模型的输出则是“for invitinglast”。

可以看到输入和输出都被加上了一些特殊 token，也就是说在 Span Corruption 任务中，模型输入和输出的都是不自然的句子。尽管这种预训练和实际使用时候的差异能够通过全量参数的 fine-tuning 来克服，但是对于只微调 encoder 端的前缀参数的 prompt tuning 来说则很难解决，毕竟 decoder 是被固定的，导致生成的第一个 token 很可能是这种特殊 token。

由此，作者针对 T5 实验了这些设定：

Span Corruption：直接用 pre-trained T5 来测试下游任务上能否生成期望的文本。
Span Corruption+Sentinel：直接用 pre-trained T5 来测试，但是目标文本增加了这种特殊 token 前缀。
LM Adaption：采用 LM 的 objective 继续训练 T5 一些 steps，也就是输入符合自然语言的 prefix，要求模型继续生成符合自然语言的 output。

2.3 实验

实验设定如下：

预训练模型：T5 v1.1 from small to XXL。

默认设置：采用经过额外 100k steps 的 LM Adaption 以后的 T5 模型 + 100 tokens 的 prompt。

评测数据集：采用 SuperGLUE 基准的全量数据，将数据集重定义为 text-to-text 的形式（但是并不会加上 task name 的前缀），每一个 task 单独训练一个 prompt，训练步数为 30K，最后报告 SuperGLUE 的 dev set 的结果。

基线模型：1）Model Tuning：每个 task 分别微调一个 T5 模型；2） Model Tuning（Multi-Task）：多个 task 一起训练，为了区分每个 task，会加上 task name 的前缀。

实验结果如下：

‍‍

随着模型参数的增加，Prompt Tuning 的效果越来越好，当 T5 模型参数达到 XXL 时，Prompt Tuning 的效果追平了 Model Tuning 和 Model Tuning（Multi-Task）。同时，Prompt Tuning 的效果远远超过了与 T5 同参数级别的 GPT-3 in context learning 的效果。

prompt tokens 对 prompt tuning 的影响：在一般模型大小情况下，prompt tokens 越多，确实效果越好，但是当 token 超过 20 以后，增益就越来越小，对于超大模型的情况，即使是单个 prompt token，也能达到和 20 个 token 以上的 prompt 相近的效果。

prompt token 的初始化：1. 随机初始化；2. 从 T5 词表中 5000 个常见单词中采样；3. 用类标签来初始化，标签是多个 token 时，则取均值，当类标签都用完后，剩下的 prompt token 用方法 2 初始化。类标签初始化在各种尺寸的模型上都表现最好，但是不同初始化策略在各种尺寸模型上表现差异很大，当尺寸变 XXL 后，这种差异就会消失。

预训练任务对 prompt tuning 的影响：Span Corruption 任务导致了 prompt tuning 表现很差，即使加了 Sentinel 也没法缓解，而 LM Adaptation 设定下随着模型尺寸增大则 prompt tuning 表现越来越好。当然，当尺寸变为 XXL 后，这种影响也会消失。

LM Adaptation steps 对 prompt tuning 的影响：LM Adaptation steps 越多，效果越好，这也说明 T5 需要进一步预训练才行。当然，当尺寸变为 XXL 后，这种影响也会消失。

与 P-tuning 的区别：P-tuning 的 soft tokens 需要考虑插入位置，同时采取的策略是 LM+Prompt Tuning，而 Prompt Tuning 则是直接插入在 prefix 位置，同时固定了 LM。同时 Prompt Tuning 相比 Model Tuning 的好处在于不会太过拟合在目标任务上，拥有更好的泛化性。

Prompt 集成：prompt tuning 的另一个好处在于可以在保存一份 LM 模型拷贝情况下，同时训练多个 prompt，并实现集成。作者在 SuperGLUE 上训练了 5 个 prompt，并用多数投票法进行集成，表现优于单一 prompt。

2.4 总结

Prompt Tuning 的做法是添加可训练的 prefix，同时固定 LM，只训练 prefix，采用 Prompt Tuning 的方式可以在 T5 超大模型和全量数据的情况下，追平 fine-tuning 的效果。

实验发现采用 prompt tuning 的方式在小模型的情况容易受到 prompt 长度，初始化策略，预训练任务等影响，并不稳定，也没法超过 fine-tuning 的效果。

作者没有探索少量数据 + 超大模型情况下和 fine-tuning 的效果比较。

Prompt预训练：让大模型在少样本情况下媲美Fine-Tuning

论文标题：

PPT: Pre-trained Prompt Tuning for Few-shot Learning

论文链接：

https://arxiv.org/abs/2109.04332

3.1 动机

作者做了一些预实验发现在少样本+超大模型情况下，prompt tuning 的表现比 model tuning（fine tuning）的表现差得多，并认为其原因在于 prompt 的初始化。由此，作者为 prompt tuning 设计一些预训练任务，期望给 prompt 一个更好的初始化，从而使 prompt tuning 在下游少样本情况下，也能媲美 fine tuning 的效果。

3.2 预实验

少样本设置：T5-XXL + 100 tunable prompt tokens；dev set 和 train set 各 16 个 sample。

template 的影响：从不使用 hard prompt 到 soft prefix prompt 和 hard prompt 进行各种混合的各种情况显示，混合 prompt 能较大提升效果，但是语义相似但形式不同的各种 hard prompt 对模型的效果影响各有不同。也就是说在小样本情况下，template 的选择对模型效果很敏感。

verbalizer 的影响：在小样本情况下，label words 的选择对模型效果也很敏感，一般选更加 common 的词会效果好些。

prompt token 的初始化：作者测试了很多在小模型上能 work well 的初始化策略，但是实验发现并不适用于大模型，甚至比随机初始化还差。

综上看到，在少样本场景下，大模型的 prompt tuning 效果受很多因素影响，无法媲美 Fine-Tuning。

3.3 方法

目的：希望通过 prompt 预训练，为 prompt tokens 提供一个更好的初始化。

具体做法：把下游任务分成若干种形式，为每种形式的 task 预训练一个 prompt，并用这个 prompt 去初始化下游 task 的 prompt，然后继续训练。

句子对分类任务的预训练：

预训练任务是一个 3 分类任务，输入是【P】【句子1】【mask】【句子2】，输出是 {no, maybe, yes}。P 代表 prompt tokens，mask 就是需要预测的部分。
自监督训练：从大规模文档中构造样本：来自相同文档中的邻近句子对的 label 为 yes，非邻近句子对的 label 为 maybe，来自不同文档的句子对为 no。

多项选择任务的预训练：

预训练任务是一个 6 个选项的分类任务，输入是【P】【query句子】？A.【选项句子】... F.【选项句子】. Answer is 【MASK】，输出是{A,B,C,D,E,F,}。
自监督训练：从大规模文档中构造样本：来自相同文档中的与 query 邻近的句子作为正确答案，不邻近或者来自其他文档的句子为错误答案。

单句分类任务的预训练：

以情感分类为例，预训练任务是一个 5 分类任务，输入是【P】【句子】【mask】，输出是 {terrible, bad, maybe, good, great}。
自监督训练：用一个额外的情感分类模型去为无标注的文档句子打标，从而形成训练数据。
单句分类的任务有一个问题，即候选 label 和任务是相关的，比如情感分类，其 label 是 terrible, bad, maybe, good, great 这些，但是其他分类任务的 label 就不是这些。解决方案就是：统一任务形式的预训练。

统一任务形式的预训练：

用多项选择任务来统一所有任务形式，类似 unifiedQA 这种做法。区别在于 unifiedQA 主要用 QA 的监督数据集做的 QA 任务的预训练，而这里是用无监督数据仅微调 prompt。
根据不同任务，选项数目也不同，最后的 template 长度也不同。

3.4 实验

少样本设置：T5-XXL + 100 tunable prompt tokens；dev set 和 train set 各 16 个 sample。

基线：PPT：prompt 预训练；Vanilla PT：普通的 prompt tuning；LM Adaptation：普通的 prompt tuning+LM Adaptation T5；hybrid PPT：prompt 预训+hard prompt；unified PPT：用统一任务形式预训练的prompt。

结论1：在少样本设置下，模型尺寸越大，模型效果也会越好；

结论2：在少样本设置的大部分数据集上，PPT 明显优于 Vanilla PT 和 LM Adaptation 后的效果，结合了 hard prompt 以后能进一步提升效果；

结论3：在少样本设置的大部分数据集上，PPT 能够超过 fine-tuning 的效果，这也说明了 pre-training 和 fine-tuning 存在较大的差距，而 PPT 能够一定程度上缩短两者的 gap；

结论4：prompt tuning 的预训练能够减小少样本情况下模型效果的方差；

结论5：当训练样本从 32 逐渐增长到 256 时，PPT 和 Vanilla PT 以及 fine-tuning 的效果变得接近。

3.5 总结

在少样本情况下，大模型的 prompt tuning（仅微调 prompt 参数）并不能媲美 fine-tuning 的效果，原因可能在于打模型在少样本情况下对 prompt 的初始化特别敏感，需要通过预训练来为 prompt 提供一个很好的初始化。

至于如何预训练，这里根据不同任务设计了不同的无监督预训练方式，也提供了一种统一的预训练任务形式。

通过 prompt 的预训练，在少样本情况下，大模型的 prompt tuning 同样能媲美 fine-tuning 的效果。

SPoT：让小模型也能媲美Fine-Tuning的Prompt预训练

论文标题：

SPoT: Better Frozen Model Adaptation through Soft Prompt Transfer

论文链接：

https://arxiv.org/abs/2110.07904

‍‍

4.1 动机

之前的工作证明了一件事：prompt 的初始化很重要，预训练能够给 prompt 提供一个很好的初始化，但是有没有其他预训练的方式，比如不用设计预训练任务的。

之前的工作主要集中在大模型的 prompt tuning 上，小模型是否也能够有机会媲美 fine-tuning 还没有被很好研究过。

SPoT 提出一种 prompt transfer 的方式，即学习一个或者多个源任务的 prompt 来初始化目标任务的 prompt，这种方式能够使得 prompt tuning 在不同模型尺寸（包括小模型）上都能媲美甚至优于 fine-tuning（注意，没法超过 multi-task fine-tuning 的效果）。

4.2 方法

prompt transfer 主要有两个关键问题要解决：a）在 source task 上学习的 prompt，迁移到 target task 上是否能起作用；b）如果能起作用，对于给定的 target task，应该寻找哪些 source task。

具体做法：在 LM pre-training 和 target prompt tuning 之间，在一个或者多个 source task 上训练相应的 prompt，然后用这些 prompt 去初始化 target task 的 prompt，然后继续 prompt tuning。

4.3 针对问题(a)的实验

模型：进行了 LM Adaptation 的 T5 small 到 5 XXL，每个 prompt 均使用 100 个 tokens，并从 T5 词表中 5000 个常见单词中采样来初始化 source task 的prompt，然后选择 source task 的 dev set 上表现最好的 prompt 去初始化 target task 的 prompt。

基线：Model Tuning；Multi-task Tuning；Vanilla Prompt Tuning：传统的 prompt tuning，采用类标签来初始化。

各种设置：

单一 source task 的无监督预训练：在 C4 数据集上预训练 prompt；
单一 source task 的有监督预训练：用 MNLI 或者 SQuAD 预训练对应的 prompt，MNLI 上的 prompt 能够泛化到许多句子级的任务上，SQuAD 上的 prompt 能够泛化到许多 QA 任务上；
多个 source task 的混合训练：每个 task 的数据集采样若干 example，组成一个新的数据集来训练一个 prompt （注意是 T5 这种 text-to-text 的训练）；
更长的 tuning steps：普通的 prompt tuning 中 tuning steps 只有 30k，这里测试了更多的 step 是否对提升效果有帮助。

实验结论：

SPoT 显着提高了 prompt tuning 的性能和稳定性（缩小方差），更长的 tuning steps 对提升效果也有很大帮助；
不同的 source task 的混合训练能够给 target task 带来不同的收益；
SPoT 能够在多个模型尺寸下媲美和优于 model tuning 的效果，并能在使用超大模型情况下媲美强基线 Multi-task Tuning。

4.4 针对问题(b)的实验

设计了 16 个 source task（dataset）和 10 个 target task（dataset），测试了 160 个 source 到 target 的组合来探索对于给定的 target task，应该寻找哪些 source task。

一种直观的想法是更相似的任务能够在 transfer 中起到更重要的作用，作者提出了用 prompt tokens 的 average embeddings 作为task的表示（task embedding），然后计算 cosine 相似度来度量任务的相似度。实验中，通过计算 source task 和 target task 的相似度，然后取 top-k 相似度的 source tasks 来初始化 target task 的 prompt。

实验结论：

prompt 的 transfer 确实能提高 target task 的性能：结果显示在许多 source 到 target 的 transfer 上，都显示了正向的迁移效果，尤其是在 task 比较相似的情况下。有趣的是，在 task 不太一样的情况下（比如输入输出不一样，任务类型不一样），也能起到一定的迁移效果；
task embedding 确实能够捕捉任务之间的相似性：可视化显示，相似的 task 确实能够聚在一起，这种相似更多是任务类型的相似而不是领域的相似。

4.5 总结

这篇文章提出了一种很简单的预训练方式，即直接在多个 source task 上训练一个 prompt，然后用这个 prompt 去初始化 target task 的 prompt 就能取得很好的效果。在全量数据 + 仅微调 prompt 的情况下，SPoT 能够在多个模型尺寸（包括小模型）下媲美和优于 model tuning 的效果，并能在使用超大模型情况下媲美强基线 Multi-task Tuning。

尾声

从目前的发展看，Prompt Learning 主要应用在何处可以从两个角度考虑，一个是数据角度：prompt learning 的出发点就是用一些提示去激发预训练模型的知识，减少对大量监督数据的依赖，所以 prompt 可以应用在 few-shot 场景中。

另一个角度是模型角度：prompt learning 如何去高效地激发超大模型的知识，减少对大量参数的微调成本，所以 prompt 可以应用在 Parameter-Efficient 的 model tuning 上面。从 Parameter-Efficient Prompt Tuning 上看，主要有几个问题：一是仅微调少量参数，能否媲美传统 fine-tuning 的效果，二是普通尺寸的模型，甚至是小模型能否使用这种方式。

从本文介绍的三篇论文看，我们不难得出一些结论。一是即使是普通尺寸的模型也有机会在 Parameter-Efficient tuning 的设置下媲美 fine-tuning 的效果；二是媲美 fine-tuning 的关键可能在于学习一个好的 prompt 初始化，prompt 预训练就是达成这一条件的手段之一。

特别鸣谢

感谢 TCCI 天桥脑科学研究院对于 PaperWeekly 的支持。TCCI 关注大脑探知、大脑功能和大脑健康。

更多阅读

#投稿通道#

让你的文字被更多人看到

如何才能让更多的优质内容以更短路径到达读者群体，缩短读者寻找优质内容的成本呢？答案就是：你不认识的人。

总有一些你不认识的人，知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁，促使不同背景、不同方向的学者和学术灵感相互碰撞，迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人，在我们的平台上分享各类优质内容，可以是最新论文解读，也可以是学术热点剖析、科研心得或竞赛经验讲解等。我们的目的只有一个，让知识真正流动起来。

稿件基本要求：

• 文章确系个人原创作品，未曾在公开渠道发表，如为其他平台已发表或待发表的文章，请明确标注

• 稿件建议以 markdown 格式撰写，文中配图以附件形式发送，要求图片清晰，无版权问题

• PaperWeekly 尊重原作者署名权，并将为每篇被采纳的原创首发稿件，提供业内具有竞争力稿酬，具体依据文章阅读量和文章质量阶梯制结算

投稿通道：

• 投稿邮箱：[email protected]

• 来稿请备注即时联系方式（微信），以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信（pwbot02）快速投稿，备注：姓名-投稿

△长按添加PaperWeekly小编

现在，在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

你可能感兴趣的:(大数据,python,机器学习,人工智能,深度学习)

力扣25.7.15每日一题——有效单词一个OI蒟蒻 LeetCode leetcode 算法职场和发展
Description应该都能看懂吧……Solution一道简单的模拟题。按照题意枚举字符串，判断元/辅音；判断合法即可。也不知道今天的题为什么怎么淼Code（C++、Python3）C++classSolution{public:boolisValid(stringword){if(word.size()bool:iflen(word)<3:returnFalsee=f=Falseforcinw
OpenCV 入门指南 —— 从环境搭建到图像处理 m0_74751715 opencv 图像处理人工智能 python
文章目录前言一、什么是OpenCV？二、环境准备与安装1.Python虚拟环境2.安装OpenCV3.验证安装三、读取与显示图像四、常见图像处理操作1.色彩空间转换2.图像平滑（模糊）3.边缘检测（Canny算法）4.在图像上绘制图形与文字五、视频与摄像头操作六、推荐学习路线七、参考资料前言在计算机视觉领域，OpenCV（OpenSourceComputerVisionLibrary）凭借其开源、
智能体架构设计的五大核心原则：构建下一代AI系统的工程基石一休哥助手人工智能
引言：智能体架构的范式演进人工智能领域正经历从孤立模型向自主智能体的范式转变。2025年，全球AI智能体市场规模突破200亿美元，在金融、医疗、制造等领域的渗透率超40%。然而，智能体开发仍面临协作效率低（多智能体任务重叠率达30%）、安全风险高（工具调用错误率18%）和系统僵化（需求变更迭代周期超2周）三大痛点。本文基于产业实践提炼五大核心设计原则，为构建下一代智能体系统提供架构指南。传统LLM
Python机器学习教程
Python机器学习教程(MachineLearningwithPythonTutorial)PDFVersionQuickGuideResourcesJobSearchDiscussionPDF版本快速指南资源资源求职讨论区MachineLearning(ML)isbasicallythatfieldofcomputersciencewiththehelpofwhichcomputersyste
Python PyV8: 在Python中运行JavaScript的利器莱财一哥
本文还有配套的精品资源，点击获取简介：PythonPyV8是一个在Python环境中执行JavaScript代码的库，基于Google的V8JavaScript引擎，实现Python与JavaScript之间的互操作性。本文将详细讨论PyV8的安装方法，包括通过pip安装和自行编译安装特定版本的步骤，以及如何在Python程序中使用PyV8执行JavaScript代码。1.PythonPyV8库介
Pycharm开发Djnago项目部署详细教程（2021更新） af9f873c915c
项目部署：这里用的是非常干净的ubuntu16.04系统环境，没有使用任何云服务器，原因是因为不同的云服务器环境都不一样。我们就从零开始来完成部署。在开发机上的准备工作：确认项目没有bug。用pipfreeze>requirements.txt将当前环境的包导出到requirements.txt文件中，方便部署的时候安装。把dysms_python文件准备好。因为短信验证码的这个包必须通过将项目上
医疗AI与融合数据库的整合：挑战、架构与未来展望（上） Loving_enjoy 计算机学科论文创新点机器学习 facebook 课程设计经验分享
在医疗AI爆发式增长的今天，单一数据库已无法满足多模态医疗数据的处理需求。本文将揭秘医疗融合数据库的核心架构，通过真实代码示例展示如何破解医疗数据整合的世纪难题。###一、医疗数据的"四维挑战"####1.多模态数据洪流```python#典型患者数据组成patient_data={"时序数据":"ECG/EEG波形(1000Hz采样)","影像数据":"CT/MRI(单次扫描2GB+)","文本
PyQt5学习笔记，带例子源码
一、很程序员，都喜欢开发windows桌面应用系统，基于python3开发，效率高二、PyQt5开发的桌面应用系统是可以跨平台的，可以在Mac上、Window上、Linux桌面系统上运行，以下为学习笔记及总级三、源码下载登录后复制1、QDateTimeEdit日期输入框setCalendarPopup弹出日期选择框setDisplayFormat("yyyy-MM-ddHH:mm:ss")设置展示
DataWhale 二月组队学习-深入浅出pytorch-Task04 －273.15K DataWhale组队学习学习 pytorch 人工智能
一、自定义损失函数1.损失函数的作用与自定义意义在深度学习中，损失函数（LossFunction）用于衡量模型预测结果与真实标签之间的差异，是模型优化的目标。PyTorch内置了多种常用损失函数（如交叉熵损失nn.CrossEntropyLoss、均方误差nn.MSELoss等）。但在实际任务中，可能需要针对特定问题设计自定义损失函数，例如：处理类别不平衡问题（如加权交叉熵）实现特殊业务需求（如对
昇思MindSpore创新训练营·长三角站开始报名！昇思MindSpore 人工智能自然语言处理深度学习
一、介绍为充分发挥长三角研究型大学联盟教学实践基地共建共享功能，加强华东高校优秀青年学子的交流与互动，提供学生与产业界接触的机会，上海交通大学与华为技术有限公司共同发起，面向长三角研究型大学学生开设昇思MindSpore创新训练营。本次训练营以实践项目和业界需求为牵引，以学生实践为主线，让学生在实践的过程中学习和实践人工智能相关知识，掌握相关技术和工具，紧跟业界最新趋势，加深对人工智能行业的认识，
OPPO未来科技大会，科技感满满！你最爱哪些黑科技呢？冬天不冷了
#OPPO未来科技大会#OPPO携手IHSMarkit发布《智能互融：借助5G、人工智能和云技术，释放机遇》白皮书，表明人工智能、云技术和边缘设备、互联和物联网的协同努力，将为企业和消费者带来价值。看了一下早上的，是说明年绿厂要发不少好玩的产品，比如智能手表AR眼镜之类的，有些可能跟Reno3一块发，对外是说构建生态万物互联，其实就是多卖几样多赚钱，然后用这钱砸了搞技术赚更大的钱，毕竟现场说了未来
Python爬虫实战：高效提取与解析JSON格式数据 Python爬虫项目 python 爬虫宽度优先数据库 json 深度优先开发语言
1.JSON数据爬取概述在当今互联网时代，JSON(JavaScriptObjectNotation)已成为最流行的数据交换格式之一。相比传统的HTML页面，JSON格式数据具有结构清晰、体积小、解析方便等优势，使得它成为API接口的首选数据格式。1.1为什么选择JSON数据爬取数据结构化：JSON数据本身就是结构化的，不需要像HTML那样进行复杂的解析传输高效：JSON通常比HTML体积小，传输
sgg大数据全套技术链接[plus] 原来是大华啊~ 资源大数据
写在开头：感谢尚硅谷，尚硅谷万岁，我爱尚硅谷111个技术栈+43个项目，兄弟们，冲！最近小米又又又火了一把，致敬所有造福人民的企业和伟大的企业家，致敬雷军，小米，致敬马云，致敬尚硅谷，致敬所有为人民谋福的英雄人物和企业，再次献上我诚挚的敬意，致敬！尚硅谷大数据全套111个技术1.Java从入门到精通JDK版链接：https://pan.baidu.com/s/1GAc610SYSMmZBuOX4D
手绘电路图的节点和端点检测一个简化版的算法实现框架 zhangfeng1133 算法
于论文描述，我将提供一个简化版的算法实现框架，用于手绘电路图的节点和端点检测，并整合生成电路原理图。以下代码结合了YOLOv5目标检测和传统图像处理技术，符合论文中提到的98.2%mAP和92%节点识别准确率的关键指标。核心算法实现（Python+OpenCV+YOLOv5）importcv2importnumpyasnpimporttorchfromyolov5importYOLOv5#需要安装
大模型核心概念 | 嵌入模型（Embedding）、向量模型（Vector Model）
一、核心概念解析1.1嵌入模型（Embedding）作为AI领域的核心基础技术，嵌入模型通过将非结构化数据映射为低维稠密向量，实现语义特征的深度捕捉：文本嵌入：如将语句转换为1536维向量，使"机器学习"与"深度学习"的向量余弦相似度达0.92跨模态嵌入：支持图像与文本的联合向量空间映射，如CLIP模型实现文图互搜1.2向量模型（VectorModel）作为嵌入技术的下游应用体系，主要包含两大方向
Python实现神经网络算法指南代码编织匠人 python 神经网络算法
Python实现神经网络算法指南神经网络是一种模拟人脑神经元结构进行信息处理的机器学习算法。在深度学习领域中，神经网络是最为强大的算法之一。Python作为一门简单易学的编程语言，也成为了许多人选择实现神经网络算法的首选语言。在本篇文章中，我们将通过Python代码来实现神经网络算法。导入必要的库为了实现神经网络算法，我们需要导入一些必要的Python库，包括numpy和matplotlib。其中
使用LangChain构建多代理系统实现复杂任务自动化 LCG元工具 langchain 自动化运维
目录一、系统架构设计模块说明：二、核心工作流程（双流程图对比）横向对比：单代理vs多代理纵向核心流程三、企业级实现方案1.Python核心代码（LangChain0.1.8+）2.TypeScript前端集成代码四、性能对比测试五、生产级部署方案安全审计要点：高可用部署拓扑：六、技术前瞻性分析附录：完整技术图谱摘要：本文深度解析如何基于LangChain框架构建企业级多代理系统，通过模块化架构设计
时序数据库选型避坑全攻略：IoTDB性能与成本双杀的秘密！ LCG元数据库时序数据库 iotdb java
文章目录一、架构设计深度解析1.1IoTDB架构图谱1.2核心流程对比二、企业级实战代码2.1Python数据写入示例2.2TypeScript客户端实现2.3集群配置YAML三、性能对比分析四、生产部署方案4.1安全加固配置4.2安全策略实施五、技术前瞻分析5.1云原生演进路径5.2新型存储引擎预测六、技术图谱附录一、架构设计深度解析1.1IoTDB架构图谱数据写入协议适配层内存表管理持久化引擎
大规模图计算引擎的分区与通信优化：负载均衡与网络延迟的解决方案 LCG元系统服务架构负载均衡网络运维
目录一、系统架构设计与核心流程1.1原创架构图解析1.2双流程对比分析二、分区策略优化实践2.1动态权重分区算法实现（Python）三、通信优化机制实现3.1基于RDMA的通信层实现（TypeScript）四、性能对比与调优4.1分区策略基准测试五、生产级部署方案5.1Kubernetes部署配置（YAML）5.2安全审计配置六、技术前瞻与演进附录：完整技术图谱一、系统架构设计与核心流程1.1原创
2025年最流行跑分最高的图片理解大模型调研报告
2025年最流行跑分最高的图片理解大模型调研报告引言当前，图片理解大模型正处于快速演进阶段，其技术发展呈现多维度深化与融合的特征。从技术演进方向来看，多模态融合已成为核心趋势之一，文本、图像、视频等不同模态的交互与协同能力显著提升。大型视觉-语言模型（LVLMs）作为人工智能领域的重要突破，标志着多模态理解与交互进入变革性发展阶段，尽管当前模型在各类任务中表现出色，但在细粒度视觉任务等基础能力层面
用Python实现神经网络(四)
使用多层神经网络我们展示如何用TensorFlow构建多层神经网络###低出生率数据LowBirthratedata:#Columns Variable Abbreviation#---------------------------------------------------------------------#Lo
基于DTLC-AEC与DTLN的轻量级实时语音增强系统设计与实现神经网络15044 仿真模型神经网络机器学习图像处理 cnn 人工智能机器人
基于DTLC-AEC与DTLN的轻量级实时语音增强系统设计与实现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。1.引言在当今的互联网通信时代，实时语音通信已成为人们日常生活中不可或缺的一部分。然而，语音通信质量常常受到回声、背景噪声等因素的严重影响。为了解决这些问题，我们需要高效的语音增强技术。本文将详细介绍如何将DTLC-AEC（深度学习回声消
自平衡摩托车控制系统设计：Python实现方案神经网络15044 仿真模型算法机器学习 python 开发语言
自平衡摩托车控制系统设计：Python实现方案摘要本文针对5CCE2MCT机电一体化补考项目要求，提出了一种基于Python的自平衡摩托车控制系统完整实现方案。该系统结合PID控制、状态空间方法和数字信号处理技术，实现了稳定的平衡与运动控制。我们从数学模型建立到硬件测试进行了完整展示，提供了可替代MATLAB/Simulink方案的可行解决方案。该实现方案在保持与参考Arduino工程套件相当性能
Java云原生安全矩阵：从代码到运行时的量子级防御墨夶 Java学习资料6 java 云原生安全
核心架构：SpringSecurity与Envoy的“量子态防御”基于声明式安全的“波函数坍缩”API网关的“暗物质过滤”代码示例：SpringSecurity的量子态权限控制威胁检测的“超弦理论”基于行为分析的“量子隧穿”异常检测实时日志的“引力波监测”代码示例：机器学习驱动的异常行为检测加密与密钥管理的“暗能量引擎”敏感数据的“量子态加密”密钥的“黑洞事件视界”保护代码示例：BCrypt与JW
python基础语法9，用os库实现系统操作并用sys库实现文件操作（简单易上手的python语法教学） AI 嗯啦 python 开发语言
一、os库os.system()是Pythonos库中用于执行操作系统命令的重要方法，它允许在Python程序中直接调用系统shell命令（如Linux的bash命令或Windows的cmd命令）。基本语法importosos.system(command)command：要执行的系统命令字符串（与在终端/命令提示符中输入的命令格式一致）返回值：命令执行的退出状态码（0表示成功，非0表示执行出错）
Python教程：你一定要知道的26个Python魔术方法（快记下来）旦莫 Python进阶 python 开发语言
Python中的魔术方法是指以双下划线__开头和结尾的特殊方法，也被称为特殊方法或魔术方法。这些方法在类中具有特殊的用途，它们可以让你自定义类的行为，使得你的对象可以像内置类型一样工作。这些方法由解释器调用，而不是你直接调用它们。例如，当你使用+运算符时，实际上是调用了对象的__add__方法。这些方法允许你重载运算符、改变对象的构造和初始化行为、自定义属性访问等等。使用魔术方法可以使你的代码更具
快捷删除python中pip安装的所有外部库 m0_74366096 python pip 开发语言
windows环境首先，列出所有安装的第三方库并导出到一个文件：pipfreeze>requirements.txt然后，批量卸载这些库：pipuninstall-y-rrequirements.txt最后，用del命令删除requirements.txt文件：delrequirements.txt这样就能在Windows系统上完成卸载并清理文件的操作。
Python与Java互操作性的桌面应用开发 master_chenchengg python python Python python开发 IT
Python与Java互操作性的桌面应用开发跨语言协作的魅力：Python遇上Java为什么选择Python和Java进行桌面应用开发？两种语言的优势互补：Python的简洁与Java的强大实际案例分享：当Python遇见Java，会发生什么奇妙的化学反应？搭建桥梁：Jython与JPype介绍Jython：用Python编写Java程序安装与配置：轻松几步让你上手调用Java类库：如何在Pyth
入门勤学奋进小郎君
了解机器学习标签需要通过机器学习模型判断出的结果特征机器学习模型进行判断的条件（可以是很多的变量）模型机器学习判断的工具降低损失线性回归y=mx+b其中：y指的是温度（以摄氏度表示），即我们试图预测的值。m指的是直线的斜率。x指的是每分钟的鸣叫声次数，即输入特征的值。b指的是y轴截距。2018-10-31_155803.png但是这样会对一些样本有误差，而我们的目的就是得到将误差降到最低的模型降低
Python常见的魔术方法和魔术属性景天科技苑 python轻松入门基础语法到高阶实战教学 python 开发语言魔术方法魔术属性
文章目录魔术方法1、`__new__`魔术方法(1)基本使用(2)`__new__`触发时机要快于`__init__`(3)`__new__`的参数要和`__init__`参数一一对应。参数个数一致就行(4)`__new__`和`__init__`之间的注意点2、单态模式:同一个类,无论实例化多少次,都有且只有一个对象3、`__del__`魔术方法(析构方法)(1)基本语法(2)模拟文件操作4、`
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本