Cc不爱吃洋葱

大模型微调技术（Adapter-Tuning、Prefix-Tuning、Prompt-Tuning(P-Tuning)、P-Tuning v2、LoRA）_adapter微调 p tuning

2022年11月30日，ChatGPT发布至今，国内外不断涌现出了不少大模型，呈现“百模大战”的景象，比如ChatGLM-6B、LLAMA、Alpaca等模型及在此模型基础上进一步开发的特定领域的大模型。今年3月15日，GPT-4发布后，也出现了一些多模态的大模型，比如百度的文心一言、讯飞星火认知大模型等等。

要想训练一个针对特定领域的大模型，如果采用全量参数微调（Full Parameter
Futuing）的方法，一方面需要大量的高质量数据集、另一方需要较高的算力，比如8块A100 80G
GPU，甚至需要成百上千的GPU。一般的小企业或者高校研究所对此望而却步。

那么，有没有不需要大量算力就能在特定领域数据上对大模型进行微调的方法呢？

下面，给大家介绍几种常见的大模型微调方法：Adapter-Tuning、Prefix-Tuning、Prompt-
Tuning(P-Tuning)、P-Tuning v2、LoRA。并介绍各种方法之间的效果对比。

【一一AGI大模型学习所有资源获取处一一】

①人工智能/大模型学习路线

②AI产品经理入门指南

③大模型方向必读书籍PDF版

④超详细海量大模型实战项目

⑤LLM大模型系统学习教程

⑥640套-AI大模型报告合集

⑦从0-1入门大模型教程视频

⑧AGI大模型技术公开课名额

1. Adapter-Tuning

该方法出自2019年的论文“Parameter-Efficient Transfer Learning for NLP ”

论文链接：https://arxiv.org/pdf/1902.00751.pdf

github链接：[GitHub - google-research/adapter-bert](https://github.com/google-
research/adapter-bert “GitHub - google-research/adapter-bert”)

模型结构如上图左侧所示，
微调时冻结预训练模型的主体，由Adapter模块学习特定下游任务的知识。其中，Adapter模块结构如上图右侧所示，包含两个前馈层和一个中间层，第一个前馈层和中间层起到一个降维的作用，后一个前馈层和中间层起到升维的作用。

Adapter调优的参数量大约为LM参数的3.6%。

2. Prefix-Tuning

该方法出自2021年的论文“Prefix-Tuning: Optimizing Continuous Prompts for Generation”

论文链接：https://arxiv.org/pdf/2101.00190.pdf

github链接：GitHub - XiangLi1999/PrefixTuning: Prefix-Tuning: Optimizing
Continuous Prompts for Generation

上图展示了Full Parameter Finetuning与Prefix Tuning之间的区别，其中，红色部分是需要微调的参数，可以发现，Prefix
Tuning只是在每个任务前有少量的prefix的参数，比如翻译任务，可以在每句话的前面加上“翻译：”来引导模型进行翻译功能。

实验结果表明：

（1）在完整的数据集上，Prefix-Tunning和Fine-Tuning在table-to-
text上的结果是comparable的，而在summarization任务上，prefix-tuning的效果略有下降。但在low-data
settings和unseen topics的情况下，Prefix-Tuning的效果更佳。

（2）与Adapter-Tuning相比，Trefix-Tuning在相同的表现下只需调节更少的参数量。

（3）不同的前缀长度有不一样的性能表现，在一定程度上长度越长，prefix的效果越明显，但也可能出现降低的问题。实验表明，prefix长度对推理速度影响不大，因为prefix上的attention是并行计算的。

Prefix Tuning参数规模约为LM模型整体规模的0.1%。

3. Prompt-Tuning(P-Tuning)

该方法出自论文2021年的论文“GPT Understands, Too”

论文链接：https://arxiv.org/pdf/2103.10385.pdf

github链接：https://github.com/THUDM/P-tuning

上图展示了P-Tuning和Discrete Prompt Search之间的区别，也引出了P-
Tuning提出的目的。因为离线的Prompt对于连续的神经网络只是次优解，prompt的词之间是彼此关联的，需要将其关联起来。于是，P-Tuning将一些伪prompt输入至LSTM中，然后利用LSTM的输出向量来替代原始的prompt
token，然后一起输入至预训练语言模型中。而且，LSTM和随着预训练语言模型一起训练。

论文中的实验结果表明：

（1）基于bert-base模型，在5/7的数据集上，P-tuning的效果比finetune等更好。
（2）基于gpt模型，在全部的数据集上，P-tuning的效果都比finetune等更好。
（3）对比gpt-base和bert-base，在6/7的数据集上，基于P-tuning，gpt-base的效果都更好。
（4）在自然语言理解任务上，双向模型比单向模型更好。

4. P-Tuning v2

该方法出自于2022年的论文“P-Tuning v2: Prompt Tuning Can Be Comparable to Fine-tuning
Universally Across Scales and Tasks”

论文链接：https://arxiv.org/pdf/2110.07602.pdf

github链接：GitHub - THUDM/P-tuning-v2: An optimized deep prompt tuning strategy
comparable to fine-tuning across scales and
tasks

上图中，左侧为P-Tuning，右侧为P-Tuning v2。P-Tuning v2与P-Tuning的不同之处在于：将只在第一层插入continuous
prompt修改为在许多层都插入continuous prompt，层与层之间的continuous prompt是相互独立的。

P-Tuning v2与Prefix-Tuning的改进之处在于，除了输入的embedding外，其它的Transformer层也加了前置的prompt。

做出这种改进的原因：

（1）先前的工作显示，Prompt tuning在normal-sized的预训练模型上效果一般。

（2）现有的Prompt tuning方法在较难的文本序列问题上效果不好。

经过这样的改进，模型可训练参数的量从0.01%增加到了0.1%~3%。

实验结果表明：

（1）P-tuning V2可以与传统Fine-tuning有差不多的效果。

（2）Multi-task P-tuning V2效果更好，分析认为可能是变相的数据增强带来的影响。

（3）在不同的任务上的表现和prompt的长度有关系。

（4）对LSTM/MLP层的重新参数化不一定有效，取决于任务和数据集。

5. LoRA

LoRA(Low-Rank Adaptation)出自2021年的论文“LoRA: Low-Rank Adaptation of Large
Language Models”

论文链接：https://arxiv.org/abs/2106.09685

github链接：https://github.com/microsoft/LoRA

LoRA技术冻结预训练模型的权重，并在每个Transformer块中注入可训练层（称为秩分解矩阵），即在模型的Linear层的旁边增加一个“旁支”A和B。其中，A将数据从d维降到r维，这个r是LoRA的秩，是一个重要的超参数；B将数据从r维升到d维，B部分的参数初始为0。模型训练结束后，需要将A+B部分的参数与原大模型的参数合并在一起使用。

LoRA微调的优点包括：

（1）训练速度更快。

（2）计算需求更低。

（3）训练权重更小。

6. 微信群里某大佬总结的各方法优缺点对比（仅供参考）：

（1） Fine-Tuning（标准微调）
优点：

简单易用：直接在预训练模型上进行微调。
适应性强：可以针对特定任务调整整个模型的参数。
效果显著：通常能显著提高模型在特定任务上的表现。
缺点：

计算成本高：需要调整模型的大量参数。
数据需求较高：为了有效微调，通常需要较多的标注数据。
适用场景：当有足够的标注数据和计算资源时，适用于大多数NLP任务。

（2）Parameter-Efficient Fine-Tuning（PEFT）
优点：

参数高效：只修改或优化模型的一小部分参数。
节省计算资源：比完全微调需要的资源少。
缺点：

可能效果有限：对于某些复杂任务，仅优化少量参数可能不足以达到最佳效果。
适用场景：资源受限的情况，或者需要快速适应新任务时。

（3） Prompt-Tuning
优点：

无需改变模型架构：通过设计任务相关的提示（prompt），引导模型生成所需的输出。
资源消耗少：不需要改变模型参数。
缺点：

需要精心设计prompt：有效的prompt设计可能需要丰富的经验和实验。
适用场景：快速适应新任务，尤其适用于资源有限的场景。

（4） LoRA（Low-Rank Adaptation）
优点：

参数高效：通过引入低秩矩阵来调整模型，减少需要优化的参数数量。
节省内存和计算资源。
缺点：

效果可能有限：对于某些复杂任务可能无法达到完全微调的效果。
需要一定的技术知识来实现和调试。
适用场景：需要参数高效调整的场景，特别是在资源有限的情况下。

（5） P-Tuning
优点：

可解释性强：通过可训练的prompt向量进行微调。
资源消耗相对较少。
缺点：

需要适当的调整和实验来找到最佳配置。
可能不适用于所有类型的任务。
适用场景：适用于需要提高模型解释性的任务，以及资源有限的情况。

如何系统的去学习大模型LLM ？

作为一名热心肠的互联网老兵，我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的 AI大模型资料 包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

有需要的小伙伴，可以V扫描下方二维码免费领取

一、全套AGI大模型学习路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

四、AI大模型商业化落地方案

阶段1：AI大模型时代的基础理解

目标：了解AI大模型的基本概念、发展历程和核心原理。
内容：
- L1.1 人工智能简述与大模型起源
- L1.2 大模型与通用人工智能
- L1.3 GPT模型的发展历程
- L1.4 模型工程
  - L1.4.1 知识大模型
  - L1.4.2 生产大模型
  - L1.4.3 模型工程方法论
  - L1.4.4 模型工程实践
- L1.5 GPT应用案例

阶段2：AI大模型API应用开发工程

目标：掌握AI大模型API的使用和开发，以及相关的编程技能。
内容：
- L2.1 API接口
  - L2.1.1 OpenAI API接口
  - L2.1.2 Python接口接入
  - L2.1.3 BOT工具类框架
  - L2.1.4 代码示例
- L2.2 Prompt框架
  - L2.2.1 什么是Prompt
  - L2.2.2 Prompt框架应用现状
  - L2.2.3 基于GPTAS的Prompt框架
  - L2.2.4 Prompt框架与Thought
  - L2.2.5 Prompt框架与提示词
- L2.3 流水线工程
  - L2.3.1 流水线工程的概念
  - L2.3.2 流水线工程的优点
  - L2.3.3 流水线工程的应用
- L2.4 总结与展望

阶段3：AI大模型应用架构实践

目标：深入理解AI大模型的应用架构，并能够进行私有化部署。
内容：
- L3.1 Agent模型框架
  - L3.1.1 Agent模型框架的设计理念
  - L3.1.2 Agent模型框架的核心组件
  - L3.1.3 Agent模型框架的实现细节
- L3.2 MetaGPT
  - L3.2.1 MetaGPT的基本概念
  - L3.2.2 MetaGPT的工作原理
  - L3.2.3 MetaGPT的应用场景
- L3.3 ChatGLM
  - L3.3.1 ChatGLM的特点
  - L3.3.2 ChatGLM的开发环境
  - L3.3.3 ChatGLM的使用示例
- L3.4 LLAMA
  - L3.4.1 LLAMA的特点
  - L3.4.2 LLAMA的开发环境
  - L3.4.3 LLAMA的使用示例
- L3.5 其他大模型介绍

阶段4：AI大模型私有化部署

目标：掌握多种AI大模型的私有化部署，包括多模态和特定领域模型。
内容：
- L4.1 模型私有化部署概述
- L4.2 模型私有化部署的关键技术
- L4.3 模型私有化部署的实施步骤
- L4.4 模型私有化部署的应用场景

学习计划：

阶段1：1-2个月，建立AI大模型的基础知识体系。
阶段2：2-3个月，专注于API应用开发能力的提升。
阶段3：3-4个月，深入实践AI大模型的应用架构和私有化部署。
阶段4：4-5个月，专注于高级模型的应用和部署。

这份完整版的大模型 LLM 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

有需要的小伙伴，可以Vx扫描下方二维码免费领取

jupyter无法打开，卸载并重新安装jupyter 多一点灵性 jupyter ide python
目录1、卸载：2、安装3、重启1、卸载：进入AnacondaPrompt模式（管理员身份打开）：法一：输入命令：condaunistallnotebook一段时间运行后卸载成功。法二：使用下面命令卸载，可以卸载jupyter安装时的依赖包：pipinstallpip-autoremovepip-autoremovejupyter-y如果报错出现：ModuleNotFoundError:Nomodu
yolov5/v7/v8/v9/v10环境详细配置教程（Windows+conda+pycharm）视觉算法er 深度学习环境配置 YOLO 目标检测人工智能深度学习 conda pycharm
一、所需环境配置1.1.虚拟环境创建首先，打开AnacondaPrompt命令窗口，创建一个新的虚拟环境，后面的包都在这个环境中安装。创建命令是：我的习惯是使用3.8版本的python，你也可以换成更高版本；condacreate-nyolopython=3.8输入命令后，运行结果如下：输入y即可；1.2.激活虚拟环境安装完成后，即可激活虚拟环境，输入以下命令即可；condaactivateyol
提示技术系列（六）——链式提示 AIGC包拥它提示技术人工智能 prompt python langchain
什么是提示技术？提示技术是实现提示工程目标的具体技术手段，是提示工程中的“工具库”。什么又是提示工程？提示工程是指通过设计、优化和迭代输入到大语言模型（LLM）的提示（Prompt），系统性提升模型输出质量（如相关性、准确性、可控性）的实践领域。它是一个覆盖全流程的方法论，包括：明确目标任务（如生成教学内容、问答、翻译）；设计提示结构（如指令、上下文、示例）；选择模型与参数（如温度、top_p）；
如何成为一名合格的 Prompt 工程师？ csdn_tom_168 AI 人工智能 ai prompt
以下为基于行业实践与最新趋势的Prompt工程师成长体系，结合技术能力、实战经验与职业发展三个维度构建的完整路径：一、核心能力模型构建1.基础认知能力领域知识融合掌握垂直领域知识图谱（如医疗术语、法律条文），通过RAG技术实现专业语料注入案例：设计医疗诊断Prompt时需理解ICD-11疾病分类标准模型原理理解熟悉主流模型特性（如GPT-4长文本处理优势、Claude3的逻辑推理强项），针对性设计
【2025CVPR】SEC-Prompt：少样本增量学习中的语义互补提示模型详解清风AI 生成对抗网络人工智能神经网络 pcm 目标跟踪深度学习计算机视觉
目录一、研究背景：少样本增量学习的挑战二、SEC-Prompt核心原理1.自适应层次化查询（AdaptiveHierarchicalQuery）2.语义互补提示机制（1）判别性提示（D-Prompt）（2）非判别性提示（ND-Prompt）3.训练策略创新（1）判别性提示聚类损失（2）ND-Prompt数据增强三、模型架构图解四、关键创新点五、实验结果对比1.ImageNet-R结果2.CUB20
国产大模型在出版行业的智能选题与内容优化实践观熵国产大模型部署实战全流程指南服务器 java 数据库人工智能国产大模型
国产大模型在出版行业的智能选题与内容优化实践关键词：出版行业数字化转型、选题语义建模、稿件结构优化、长文本协同生成、大模型编辑协作、内容风格控制、出版流程AI集成、Qwen、DeepSeek、Baichuan、Prompt链路设计摘要在出版行业迈入智能化与语义驱动时代背景下，传统内容策划与编辑生产方式正面临变革窗口。国产大模型如Qwen、DeepSeek、Baichuan已逐步具备长文本生成、结构
AI原生应用开发必看：自然语言生成的5个最佳工程实践 AI原生应用开发 AI-native 网络 ai
AI原生应用开发必看：自然语言生成的5个最佳工程实践关键词：AI原生应用、自然语言生成、工程实践、Prompt工程、模型微调、评估指标、安全防护摘要：本文深入探讨了开发高质量自然语言生成(NLG)应用的5个核心工程实践。从Prompt设计技巧到模型微调策略，从评估体系建立到安全防护机制，我们将通过生动的类比和实际代码示例，帮助开发者掌握构建可靠AI应用的关键技术。文章特别强调"以终为始"的开发理念
AI里的Prompt到底是什么？——提示词不知名产品露 AIGC
AIGC爆火以后，应运而生的Prompt到底是什么？为什么会有这个产物呢？拿大语言模型举例来说，自身的能力很强大，但也存在一定的弊端，比如输出的内容太空太泛、不是用户想要的答案、输出的内容格式不符合预期……正因为这些弊端的存在，进而催生了Prompt（提示词ArtificialIntelligencePrompt）。应用场景也比较多如：智能客服、数字人主播、智能写作助手、PPT制作等。一、定义Pr
Prompt 精通之路（一）- AI 时代的新语言：到底什么是 Prompt？为什么它如此重要？程序员阿超的博客 Prompt 精通之路：从零基础到 AI 高效玩家人工智能 prompt Prompt新手指南提示词入门 AI指令 ChatGPT deepseek
AI时代的新语言：到底什么是Prompt？为什么它如此重要？标签：#Prompt新手指南#提示词入门#AI指令#人工智能#ChatGPTPrompt精通之路：系列文章导航第一篇：AI时代的新语言：到底什么是Prompt？为什么它如此重要？第二篇：告别废话！掌握这4个黄金法则，让你的Prompt精准有效第三篇：像专业人士一样思考：Zero-Shot,Few-Shot和思维链（CoT）技巧详解第四篇：
【AI大模型面试八股文】大模型训练中如何应对灾难性遗忘问题？一叶千舟 AI大模型应用【八股文】人工智能深度学习
目录✅面试回答模板：一、什么是灾难性遗忘？举个通俗的例子：二、灾难性遗忘是怎么发生的？常见触发情境：三、我们为什么要关注灾难性遗忘？四、主流解决方案汇总✅1.固定部分参数（FeatureExtraction）✅2.正则化策略（Regularization）✅3.回放机制（Rehearsal/Replay）✅4.参数隔离（ParameterIsolation）✅5.使用提示学习（PromptLear
LangChain是为了解决哪些问题？为了解决这些问题，LangChain采用哪些方法？LangChain适用于什么场景？LangChain有什么局限性？杰瑞学AI AI/AGI NLP/LLMs langchain 人工智能自然语言处理深度学习神经网络 AI-native
LangChain旨在解决的问题LangChain的核心目的是解决在使用大型语言模型（LLM）开发应用程序时面临的复杂性和挑战。具体来说，它致力于解决以下问题：LLM应用开发的复杂性：直接使用LLM开发应用程序通常涉及大量的底层代码编写，例如管理提示（prompts）、处理输出、串联多个模型调用以及与外部数据源或工具集成。这使得开发过程繁琐且容易出错。LLM能力的限制：单个LLM往往无法完成所有任
创建Django项目小叶萝 Openlayers开发 django sqlite 数据库
我这里利用conda+Pycharm创建Django项目1、打开condaPrompt激活python的conda环境（创建了多个环境可以考虑切换一下python环境）condaactivatebase2、安装DjangocondainstallDjango查看安装成功了没有？django-admin--help出现常用的命令：checkcompilemessagescreatecachetabl
【大模型面试】大模型Prompt Engineer面试题及参考答案大模型知识 prompt 人工智能开发语言 python chatgpt 深度学习大模型
一、基础概念类1.什么是大模型？大模型通常指具有庞大参数规模的机器学习模型，尤其是在自然语言处理（NLP）和计算机视觉等领域。这些模型能够学习到大量数据中的复杂模式和特征，具备强大的泛化能力，可在多种任务上表现出色，如GPT系列、BERT等。2.大模型与传统机器学习模型的区别是什么？传统机器学习模型参数规模相对较小，往往针对特定任务进行设计和训练，需要较多人工特征工程。而大模型参数数量庞大，通过在
第三：提示词工程-十个技巧高效优化prompt 卢卡平头哥 AIGC prompt android
一.明确目标1.在编写prompt之前，需要先明确想要生成什么样的文本2.比如，假设要写一篇关于健康饮食的文章，目标是提供一些有关健康饮食的建议和指导3.那么，可以明确以下目标主题关键词：健康饮食、饮食建议、营养均衡、食物选择风格：科学性、易懂性格式：段落式、逻辑结构清晰长度：约500-800字4.基于这些目标可以编写合适的prompt提示词："请提供一篇关于健康饮食的文章，内容应涵盖健康饮食的重
大语言模型应用提示工程Prompt Engineering 全栈你个大西瓜人工智能大模型自然语言处理 prompt 人工智能提示工程
提示工程（PromptEngineering）是指通过精心设计和优化输入提示（prompt），以引导人工智能模型（如大型语言模型）生成更符合预期的输出。一、提示工程的核心任务明确任务目标确定模型需要完成的具体任务（如文本生成、翻译、分类、问答等）。示例：需要模型生成一篇产品评测vs.需要模型总结文章要点。设计提示结构包含必要的上下文、示例、格式要求和约束条件。示例：请根据以下产品参数生成一段吸引人
探索提示词工程的魅力：提升你的AI应用到新高度杭律沛Meris
探索提示词工程的魅力：提升你的AI应用到新高度Prompt-Engineering-Guide-zh项目地址:https://gitcode.com/gh_mirrors/pr/Prompt-Engineering-Guide-zh在人工智能的快速发展前沿，提示词工程指南-中文版犹如一盏明灯，照亮了语言模型应用的新路径。本项目是由PartnerDAO精心翻译并维护，旨在构建一个全面的知识库，帮助开
从6个维度学会提示词（prompt）编写 Ai小丸+ prompt AIGC 人工智能 ai 语言模型 AI编程自然语言处理
这份提示词编写指南从6个维度、5000字详解，手把手教你搭好智能体提示词。最后附上Markdown格式小贴士，帮你轻松上手！若本文章对您有帮助，点个赞支持下，关注我持续了解更多AI内容！一、提示词编写内容指南1、角色设定1.1、为什么需要精准角色定位？认知锚定：明确的角色设定让AI快速理解“该以什么身份说话”，避免输出风格混乱（如：让医生用rapper语气写科普文）专业背书：通过职业年限、领域成就
60个顶级DeepSeek学术提示词，2小时完成毕业论文，建议收藏爱学习的懒洋洋论文笔记 AIGC
朋友们，写论文的苦，你懂我也懂。好消息是：有了DeepSeek等AI大模型，你只需要掌握正确的提示词（Prompt），论文就能1小时出大纲，1小时出正文，连答辩都能帮你安排上！下面这份60个顶级学术Prompt清单，涵盖选题+大纲+写作+润色+降重+答辩+引用全流程，建议点赞收藏+转发给你身边写论文的人一、论文选题与方向建议（10个）帮我根据“[专业/方向]”推荐10个有研究价值的毕业论文选题根据
Prompt Engineering Guide — 提示工程全方位指南司南锤 GitHub prompt
项目概述PromptEngineeringGuide是一个由DAIRAILab维护的开源项目，致力于系统性地总结和分享提示工程（PromptEngineering）的理论与实践方法。随着大语言模型（如GPT系列、Claude、Gemini等）的广泛应用，如何设计有效提示以发挥模型最大能力，成为当前人工智能领域的重要研究和应用方向。该项目以教程、案例和最佳实践为核心，帮助开发者和研究者快速掌握提示设
AutoMedPrompt的技术，自动优化提示词 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python mvc
AutoMedPrompt的技术，自动优化提示词让大语言模型在医学答题方面的表现大幅提升，甚至能让开源模型在某些医学数据集上超过GPT-4等商业模型。AutoMedPrompt原理深度解析与实例说明一、核心原理：文本梯度驱动的提示词优化1.传统提示工程的痛点手动设计提示词依赖专家经验，难以覆盖医学领域的复杂性（如不同专科考点、病例变异）。固定提示词（如CoT思维链）无法动态适应具体问题，可能引入无
如何训练一个 Reward Model：RLHF 的核心组件详解茫茫人海一粒沙深度学习人工智能强化学习
RewardModel（奖励模型）是RLHF的核心，决定了模型“觉得人类偏好什么”的依据。本文将系统介绍如何从零开始训练一个rewardmodel，包括数据准备、模型结构、损失函数、训练方法与注意事项。什么是RewardModel？RewardModel（RM）是一个评分器：它输入一个文本（通常是prompt+模型回答），输出一个实数分值（reward），表示这个回答的“人类偏好程度”。它不是分类
原生html页面弹窗_html 页面弹窗 weixin_39609483 原生html页面弹窗
第一种：alertalert("hello!")第二种：window.confirm()A:弹出窗口returntrue;}else{//alert("取消");returnfalse;}第三种：promptprompt方法也将显示一个模式消息框。用户在继续操作之前必须先关闭该消息框vartheResponse=window.prompt("欢迎？","请在此输入您的姓名。");页面代码测试fun
在设计提示词（Prompt）时，关于信息位置的安排z怎么结合模型特性和任务目标 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python prompt 人工智能自然语言处理均值算法语言模型
在设计提示词（Prompt）时，关于信息位置的安排z怎么结合模型特性和任务目标在设计提示词（Prompt）时，关于信息位置的安排确实需要结合模型特性和任务目标。从自注意力机制的原理及应用场景来看，关键信息的位置选择需遵循以下启示，并结合具体场景灵活调整：一、核心启示：提示词的“信息权重”与“位置效应”1.最后位置的信息更易被模型“重点处理”原理：生成任务中（如文本续写、回答问题），模型生成最后一个
Midjourney提示词(Prompt)编写秘籍：让AI画出你想要的作品 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 midjourney prompt 人工智能 ai
Midjourney提示词(Prompt)编写秘籍：让AI画出你想要的作品关键词：Midjourney、提示词(Prompt)、AI绘画、关键词权重、图像生成摘要：想让AI画出你脑海中完美的画面？关键就藏在“提示词(Prompt)”里！本文将用“给小学生讲故事”的方式，从基础到进阶，拆解Midjourney提示词的编写逻辑。你将学会如何用“主体+风格+细节”的黄金公式，像给画家写“绘画说明书”一样
提示词工程推荐阅读论文司南锤 LLM prompt 人工智能自然语言处理
论文目录提示工程少样本提示思维链提示自洽性生成知识提示自动提示工程多模态提示提示技巧对抗提示提示工程PromptEngineeringforText-BasedGenerativeModels论文链接:https://arxiv.org/abs/2107.13586简介:本文概述了提示工程，并讨论了它在各种基于文本的生成模型中的应用。少样本提示Few-shotLearningwithRetriev
【深度学习-Day 33】从零到一：亲手构建你的第一个卷积神经网络（CNN）吴师兄大模型深度学习入门到精通深度学习 cnn 人工智能 python 大模型卷积神经网络（CNN）机器学习
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
52-【JavaScript-Day 52】告别“野路子”代码：ESLint、Prettier与Web安全入门吴师兄大模型 javascript 开发语言 ecmascript java 人工智能大模型 ESLint
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
探秘AI的秘密：leaked-system-prompts 人工智能我来了人工智能 AI 人工智能
揭秘：揭秘系统提示合集背后的秘密在当今这个人工智能技术迅速发展的时代，了解和使用大型语言模型（LLM）已成为技术爱好者、开发者和研究人员的共同目标。而作为核心组成部分，系统提示（systemprompts）的设计和应用直接影响了LLM的表现和功能。今天，我们将为大家揭示一个神秘而又充满吸引力的项目——“leaked-system-prompts”。这个项目为我们打开了一扇窥探这些大型语言模型系统提
引导语言的魔法：从简单指令到智能对话的艺术步子哥智能涌现 AGI通用人工智能人工智能 python 机器学习
大型语言模型（LLMs）就像一台精密的预测机器，依靠输入的提示（prompt）生成令人惊叹的输出。然而，撰写一个高效的提示并非易事——它需要科学与艺术的结合。无论是要求模型生成代码、回答问题，还是创作故事，提示的设计决定了输出的质量。本文将深入探讨提示工程（PromptEngineering）的奥秘，带你从基础配置到高级技巧，揭示如何通过精心设计的提示，引导LLMs生成准确、有趣且实用的结果。准备
第10课：《ChatGPT提示工程》—— Guidelines（入门） Soyoger chatgpt Prompt 提示性工程大模型
前面关于Prompt介绍了那么多理论的知识点，从本节内容开始进入代码实战，提供一些提示的指南，帮助你获得想要的结果。特别地，介绍了两个关键原则，即如何编写提示来有效地促使工程师，鼓励你随时运行代码自己查看输出是什么样子的，并改变确切的提示，尝试几种不同的变化，以获得有关提示的输入和输出的经验。在开始实战之前，假设我们已经申请了ChatGPT的账号，并获取到了APIkey，如果没有账号的，建议先注册
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f