Kwan的解忧杂货铺@新空间代码工作室

【大模型系列】SFT（Supervised Fine-Tuning，监督微调）

欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。

推荐:kwan 的首页,持续学习,不断总结,共同进步,活到老学到老

导航

檀越剑指大厂系列:全面总结 java 核心技术,jvm,并发编程 redis,kafka,Spring,微服务等

常用开发工具系列:常用的开发工具,IDEA,Mac,Alfred,Git,typora 等

数据库系列:详细总结了常用数据库 mysql 技术点,以及工作中遇到的 mysql 问题等

新空间代码工作室:提供各种软件服务,承接各种毕业设计,毕业论文等

懒人运维系列:总结好用的命令,解放双手不香吗?能用一个命令完成绝不用两个操作

数据结构与算法系列:总结数据结构和算法,不同类型针对性训练,提升编程思维,剑指大厂

非常期待和您一起在这个小小的网络世界里共同探索、学习和成长。 ✨✨ 欢迎订阅本专栏 ✨✨

博客目录

- 引言
- 一、SFT 的基本概念
- - 1.1 什么是 SFT？
  - 1.2 SFT 的作用
- 二、SFT 的理论基础
- - 2.1 迁移学习
  - 2.2 预训练与微调
  - 2.3 损失函数与优化
- 三、SFT 的技术细节
- - 3.1 数据准备
  - 3.2 模型选择
  - 3.3 微调策略
  - 3.4 正则化与早停
- 四、SFT 的实际应用
- - 4.1 自然语言处理
  - 4.2 计算机视觉
  - 4.3 语音识别
- 五、SFT 的挑战与未来发展方向
- - 5.1 数据稀缺性
  - 5.2 模型泛化能力
  - 5.3 计算资源需求
- 结论

引言

随着人工智能技术的飞速发展，大模型（Large Models）逐渐成为研究和应用的热点。大模型，尤其是基于深度学习的模型，已经在自然语言处理、计算机视觉、语音识别等多个领域取得了显著的成果。其中，SFT（Supervised Fine-Tuning，监督微调）作为一种重要的模型优化方法，被广泛应用于大模型的训练和调优过程中。

一、SFT 的基本概念

1.1 什么是 SFT？

SFT，即监督微调（Supervised Fine-Tuning），是指在预训练模型的基础上，通过有监督的学习方式对模型进行进一步的微调，以适应特定的任务或数据集。预训练模型通常是在大规模无标签数据上进行训练的，具有强大的泛化能力。然而，预训练模型并不一定能够直接应用于特定的下游任务，因此需要通过 SFT 对其进行微调，以提高其在特定任务上的表现。

1.2 SFT 的作用

SFT 的主要作用是将预训练模型的通用知识迁移到特定任务中。通过在有标签数据上进行微调，模型可以学习到与任务相关的特定特征，从而提高其在任务中的表现。SFT 不仅可以提高模型的准确性，还可以减少训练时间和计算资源的消耗，因为预训练模型已经具备了较强的初始能力。

二、SFT 的理论基础

2.1 迁移学习

SFT 的理论基础之一是迁移学习（Transfer Learning）。迁移学习是指将一个领域（源领域）中学到的知识应用到另一个领域（目标领域）中。在 SFT 中，预训练模型在源领域（通常是大规模无标签数据）上进行了训练，而微调过程则是在目标领域（特定任务的有标签数据）上进行的。通过迁移学习，模型可以将源领域的知识迁移到目标领域，从而提高目标任务的性能。

2.2 预训练与微调

SFT 的核心思想是“预训练+微调”。预训练阶段，模型在大规模无标签数据上进行训练，学习到通用的特征表示。微调阶段，模型在特定任务的有标签数据上进行训练，调整模型参数以适应任务需求。预训练模型通常具有较好的初始参数，微调过程可以看作是对这些参数的进一步优化。

2.3 损失函数与优化

在 SFT 过程中，损失函数的选择和优化算法的使用对模型的性能有着重要影响。常用的损失函数包括交叉熵损失、均方误差损失等，具体选择取决于任务类型。优化算法则通常采用随机梯度下降（SGD）或其变种（如 Adam、RMSprop 等），通过迭代更新模型参数，最小化损失函数。

三、SFT 的技术细节

3.1 数据准备

SFT 的成功在很大程度上依赖于高质量的有标签数据。数据准备阶段包括数据收集、数据清洗、数据标注等步骤。数据的质量和数量直接影响微调的效果，因此需要确保数据的准确性和多样性。

3.2 模型选择

选择合适的预训练模型是 SFT 的关键步骤之一。常用的预训练模型包括 BERT、GPT、ResNet 等，具体选择取决于任务类型。例如，在自然语言处理任务中，BERT 和 GPT 是常用的预训练模型；在计算机视觉任务中，ResNet 和 EfficientNet 则是常用的选择。

3.3 微调策略

微调策略包括学习率设置、批量大小选择、训练轮数等。学习率是微调过程中最重要的超参数之一，过高的学习率可能导致模型无法收敛，过低的学习率则可能导致训练速度过慢。批量大小和训练轮数的选择也需要根据具体任务进行调整，以达到最佳的训练效果。

3.4 正则化与早停

为了防止模型过拟合，SFT 过程中通常采用正则化技术，如 L2 正则化、Dropout 等。此外，早停（Early Stopping）也是一种常用的防止过拟合的方法，通过在验证集上监控模型性能，当性能不再提升时提前停止训练。

四、SFT 的实际应用

4.1 自然语言处理

在自然语言处理领域，SFT 被广泛应用于文本分类、机器翻译、问答系统等任务。例如，在文本分类任务中，可以通过 SFT 对预训练的 BERT 模型进行微调，使其能够准确分类不同类别的文本。在机器翻译任务中，SFT 可以帮助模型学习到特定语言对的翻译规则，从而提高翻译质量。

4.2 计算机视觉

在计算机视觉领域，SFT 被用于图像分类、目标检测、图像分割等任务。例如，在图像分类任务中，可以通过 SFT 对预训练的 ResNet 模型进行微调，使其能够准确识别不同类别的图像。在目标检测任务中，SFT 可以帮助模型学习到特定目标的特征，从而提高检测精度。

4.3 语音识别

在语音识别领域，SFT 被用于语音转文本、语音合成等任务。例如，在语音转文本任务中，可以通过 SFT 对预训练的 Wav2Vec 模型进行微调，使其能够准确识别不同语言的语音。在语音合成任务中，SFT 可以帮助模型学习到特定语音的特征，从而提高合成语音的自然度。

五、SFT 的挑战与未来发展方向

5.1 数据稀缺性

尽管 SFT 在许多任务中取得了显著的成功，但在数据稀缺的情况下，SFT 的效果可能会大打折扣。如何在小样本或零样本情况下进行有效的微调，是当前研究的热点之一。未来，可能需要开发更加高效的迁移学习和数据增强技术，以应对数据稀缺的挑战。

5.2 模型泛化能力

SFT 虽然在特定任务上表现出色，但模型的泛化能力仍然是一个重要问题。如何使模型在多个任务上都具有良好的表现，是未来研究的一个重要方向。多任务学习和元学习等技术可能会在这一领域发挥重要作用。

5.3 计算资源需求

SFT 通常需要大量的计算资源，尤其是在大规模数据集上进行微调时。如何降低 SFT 的计算成本，提高训练效率，是未来研究的一个重要课题。分布式训练、模型压缩等技术可能会在这一领域发挥重要作用。

结论

SFT 作为一种重要的模型优化方法，已经在多个领域取得了显著的成功。通过在大规模预训练模型的基础上进行有监督的微调，SFT 能够有效提高模型在特定任务上的表现。然而，SFT 仍然面临着数据稀缺、模型泛化能力不足、计算资源需求高等挑战。未来，随着技术的不断进步，SFT 有望在更多领域发挥更大的作用，推动人工智能技术的进一步发展。

觉得有用的话点个赞呗。
❤️❤️❤️本人水平有限，如有纰漏，欢迎各位大佬评论批评指正！

如果觉得这篇文对你有帮助的话，也请给个点赞、收藏下吧，非常感谢!

Stay Hungry Stay Foolish 道阻且长,行则将至,让我们一起加油吧！

你可能感兴趣的:(s2,AIGC,大模型)

脏读、不可重复读、幻读？一文扫盲数据库三大“读“问题
想象一下：你在银行查看账户余额时，数字在你眼前变来变去；或者明明没有记录的操作，却突然冒出新数据。这不是系统故障，而是数据库事务隔离的三大经典问题！今天我们就来揭开这些神秘现象的面纱。一、事务隔离的"三座大山"️在数据库世界中，多个事务同时操作数据时会产生三种典型问题：问题类型出现场景危害程度类比场景脏读读取未提交的数据⚠️⚠️⚠️高危看到别人未提交的草稿不可重复读同一事务内读取结果不一致⚠️⚠️
Agent架构解析及分布式Agent协作方案
来源：AI大模型应用实践AIAgent（智能体）系统发展迅猛，且关注点已经不再局限在Agent的规划推理等基本能力，智能体系统在扩展性、互操作、安全性等工程化方面的挑战也越来越引起重视，比如最近的MCP和A2A。上一篇我们介绍了A2A，今天接着再聊聊分布式Agent系统的话题。Agent模式架构解析Agent有效减少人类工作总量，人与AI协作才是最终形态。人类与AI交互可大致分为三种模式。Embe
奇妙的动物世界吴卓逸
奇妙的动物世界里有聪明的猴子，可爱的小兔子，会唱歌的小鸟……但是我最喜欢的是我们老家的一条小狗。它是一只小母狗，它叫豆豆，这个名字是爷爷给它取的，它又贪吃又调皮，但它总也长不高。每次我们回老家，我都能发现它又长肥了。有一次，我们回老家踢足球，踢足球的队伍里有我、哥哥、爸爸还有爷爷。爷爷把球踢给我的时候，力气有点大，豆豆当时正在旁边观看，它正好跑到球移动的位置那，它看到求向他飞了过来。它吓得躲到了一
如何增强LLM（大语言模型）的“置信度”和“自信心” ：LLM的“自信”不是“什么都能答”，而是“该答的答得准，不该答的敢说不”。 ZhangJiQun&MXP 教学 2021 AI python 2024大模型以及算力语言模型人工智能自然语言处理深度学习 transformer 机器学习
如何增强LLM（大语言模型）的“置信度”和“自信心”Pleaseprovideafirmanswer,andforthosewhodon’tknow,pleasereply‘unknown’LLM（大语言模型）的“置信度”（对输出内容的准确性判断）和“自信心”（稳定输出可靠信息的能力），核心逻辑与传统模型相通——让模型在“已知且可靠的知识范围内输出”，同时避免“强行回答陌生问题”。但LLM因生成式
Redis 深度解析：从核心原理到生产实践 Pasregret 缓存 redis 数据库缓存
Redis深度解析：从核心原理到生产实践一、Redis核心定位与数据结构1.核心能力矩阵深度解析Redis作为高性能内存数据库，核心能力覆盖缓存、数据存储、消息中间件等场景，其设计哲学围绕速度优先、内存高效、功能丰富展开：内存存储特性纯内存操作：基于内存寻址的O(1)复杂度数据操作，单节点QPS可达10万+持久化方案：RDB（快照）与AOF（日志）双模式，支持数据持久化与故障恢复单线程模型：基于事
vLLM快速入门：开启高效推理与部署之旅
在如今这个人工智能飞速发展的时代，语言模型的应用已经深入到我们生活的方方面面，从智能聊天机器人到文本生成工具，都离不开强大的语言模型技术支持。而vLLM作为一个专注于高效推理和部署的开源项目，正在为研究人员和开发人员提供一种全新的解决方案，让语言模型的使用变得更加便捷、高效。初识vLLM：背景与意义vLLM（VeryLargeLanguageModelInference）是一个专注于大型语言模型推
深入解析 vLLM 分布式推理与部署策略
在当今人工智能快速发展的时代，大型语言模型（LLM）的推理和部署面临着诸多挑战，尤其是当模型规模日益庞大时，如何高效地利用硬件资源成为关键问题。vLLM作为一种强大的工具，为分布式推理和部署提供了多种策略，本文将详细探讨其相关技术和应用场景，希望能对您提供有价值的参考。分布式推理策略的选择在开始分布式推理和部署之前，明确何时采用分布式推理以及可选的策略至关重要。1.单GPU推理：如果模型能够在单个
周记 giao岩
我盼望已久的中秋节就要到啦！中秋节是团圆节，更重要的是有月饼吃，我最喜欢吃月饼。当然了我最喜欢吃的就是豆沙馅的月饼我觉得这个馅的是最好吃的。第二天是中秋节。晚上我们一家人团圆在一起，我们一边赏月，一边吃月饼。当然了家里的亲戚也来的非常多什么七大姑八大姨的。总之非常的热闹氛围十分好。我拿起一个豆沙馅的月饼咬了一大口感觉好极了一大口感觉十分满足，妈妈自己也做了冰皮月饼非常好吃薄薄的皮厚厚的紫薯非常好吃
硬笔手抄：《小窗幽记》传世警句——人心好胜，我以胜应必败；人情好谦，我以谦处反胜清泉_9313
《小窗幽记》——朝市山林俱有事，今人忙处古人闲。《小窗幽记》——富贵之家，常有穷亲戚来往，便是忠厚。《小窗幽记》——人心好胜，我以胜应必败；人情好谦，我以谦处反胜。《小窗幽记》——富时不俭贫时悔，潜时不学用时悔，醉后狂言醒时悔,安不将息病时悔。《小窗幽记》——草色花香,游人赏其真趣;桃开梅谢,达士悟其无常。《小窗幽记》——真放肆不在饮酒高歌,假矜持偏于大庭卖弄。看明世事透,自然不重功名;认得当下真
我要当小仙女一手王
以后我再也不要抱怨啦，因为一抱怨灵气就没有啦。我要成为小仙女天天快快乐乐的成长。我要好好学习，天天向上。我觉得出去玩儿比在家里待着好玩。我觉得我老公并不完全属于我。不属于就不属于呗，自己也可以成就精彩的人生！再说世界上人这么多，又不是只有他一个人。对，就是这样的。我要交志同道合的朋友。一起唱歌跳舞。拍抖音。写小说，参加运动会。一起跳绳，一起玩儿植物大战僵尸现实版的。心胸开阔。正所谓心大了，烦恼就小
新手怎么做自媒体运营？新手做自媒体运营的4个重要方法优惠券高省
作为一个优秀的自媒体运营者，需要具备很多能力，现在的自媒体运营者越来越多。一个自媒体运营者需要具备哪些能力？下面给大家分享一下自媒体运营者必备的四大基本能力。大家好，我是高省APP联合创始人蓓蓓导师，高省APP是2021年推出的电商导购平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个可省钱佣金高，能赚钱有收益的平台，百度有几百万篇报道，也期待你的加入。高省邀请码1
84、【情商】轻松快乐生活的秘密（三）简单15513012298
生命是由思想组成的。要想改变结果得先改变行动，要改变行为先改变思想。轻松快乐生活的秘诀我们昨天说了一个人感到累或者疲劳，最主要的原因是情绪或者精神上的那种倦怠感。你说人的情绪能对身体产生那么大的影响吗？我们举一个例子：比如有个小伙子工作一整天非常的忙碌，回家的路上就昏昏欲睡，自己感觉精疲力尽，疲惫不堪……也真的觉得头也疼，背也疼，不想吃饭，只想上床睡觉，而且疲劳的觉得自己得拽着猫尾巴才能上去床。这
妖爷的三点儿三月暖阳2017
此处没有小黄文，更没小黄图，只是我分享完毕，我们洞主发自内心的高文彩的感慨。拷贝如下：图片发自App1.一直以来，我们有那么多探索性格、分析特质的书籍，比如性格色彩、九型人格、disc性格分析模型，在不断探索自我，认识自我，最根本的目的，是为了达到幸福。这个角度的分析，恰恰说明一个真理：我是一切的根源。当我们归因和找出路从自己出发的时候，就开始接近正确答案了。今天对这个问题再次感受很深，是因为下午
政委马湖之边的故乡小米安子
马湖是四川省级风景名胜区、省级地质公园，位于雷波县东北部，东与宜宾市屏山县相邻，南与云南省永善县隔金沙江相望。它是全国第三大高山深水湖泊，也是四川四大天然湖泊之一，湖面海拔1100米，南北长5.5公里，东西宽2.5公里，面积7.33平方公里，平均水深66米，最深处134米，据最新探测最深处可能超过200米，蓄水4.81亿立方米。马湖周围有：金龟戏水、母猪卧岩、鹅公飞渡、五马归槽、大湾如月、坳口峰回
IoC容器深度解析：架构、原理与实现 liulilittle Markdown Extension C#架构网络 c#IoC DI 依赖倒置依赖注入
IoC容器深度解析：架构、原理与实现引用：.NETIoC容器原理与实现等巫山的雲彩都消散撒下的碧色如何看淡一、引言：从服务定位器到IoC的演进类签名修改集中式管理依赖反转+动态注入强耦合直接依赖全量代码重构服务定位器模式圈复杂度指数级增长IoC容器方案低耦合+高扩展性历史痛点在早期软件开发中（如2000年代JavaEE体系），开发者面临两大核心问题：强耦合依赖链：上层模块直接实例化下层对象（new
夸克网盘1TB存储空间,获取全攻略! 遇见火星面试职场和发展
近年来，夸克网盘凭借大容量和免费增值模式迅速崛起。作为老用户，如何永久锁定1TB存储空间成为核心问题？最新方法是转存这个文件实现免费扩容到1T：未用手机号注册过夸克账号、仅安装APP但未注册、曾用QQ、微信等非手机号注册的老用户以及24小时内新注册的账号皆可参与。已有账号用户需更换未注册过的手机号和新设备参与。1TB空间领取步骤：打开手机浏览器，私信获取活动专属链接，电脑端无法参与。1TB容量领取
AI产品经理面试宝典第30天：AI+教育个性化学习与知识图谱相关面试题的解答指导 TGITCIC AI产品经理一线大厂面试题人工智能产品经理 AI产品经理面试大模型产品经理面试 AI面试大模型面试
自适应学习系统如何实现千人千面？面试官：请用产品视角解释AI自适应学习系统的核心逻辑你的回答：自适应学习系统本质是构建"数据-模型-决策"的闭环。以沪江Hitalk为例，其通过12级能力评估体系采集学员的听、说、读、写数据，利用知识图谱建立知识点关联网络。当学员完成"实景演练-诊断反馈-学习包推送"的完整链路时，系统会动态调整知识图谱权重，形成个性化学习路径。面试官追问：如何验证个性化效果？回答：
国内第一梯队终端安全产品解析：技术与场景实践粤海科技君安全腾讯iOA 零信任终端安全
国内终端安全市场的第一梯队产品，通常具备技术领先性、场景覆盖度和规模化落地能力。结合2025年最新行业动态与实战案例，以下从技术架构、核心能力和典型应用三个维度，解析当前市场的头部产品及其差异化价值。一、技术架构与市场格局国内终端安全市场呈现"平台化、智能化、场景化"三大趋势。根据赛迪顾问2023年数据，奇安信以18.7%的终端安全市场份额位居首位，其天擎系统通过"终端检测与响应（EDR）+主动防
英伟达Triton 推理服务详解 leo0308 基础知识机器人 Triton 人工智能
1.TritonInferenceServer简介TritonInferenceServer（简称Triton，原名NVIDIATensorRTInferenceServer）是英伟达推出的一个开源、高性能的推理服务器，专为AI模型的部署和推理服务而设计。它支持多种深度学习框架和硬件平台，能够帮助开发者和企业高效地将AI模型部署到生产环境中。Triton主要用于模型推理服务化，即将训练好的模型通过
阻塞非阻塞和同步异步大金叶子
本文转自该处，由于这篇文章写的非常好就没有再单独总结。感谢作者！！！作者：凉拌姨妈好吃链接：https://www.jianshu.com/p/6a6845464770来源：著作权归作者所有，任何形式的转载都请联系作者获得授权并注明出处。首先引用levin的回答让我们理清楚五种IO模型1.阻塞I/O模型(同步阻塞)老李去火车站买票，排队三天买到一张退票。耗费：在车站吃喝拉撒睡3天，其他事一件没干。
2022-03-10 有关焦虑与消费观随风飘过的思绪
3月10日，星期四，晴。12-26度，1级南风这是要过夏天的节奏，一大清晨，又搬了一堆被子到天台上去晒。做了一下卫生，好想坐下来追下剧，现在好像只能看余光剧了。今天摸了一下琴，忘光了，这得每天那怕只摸十分钟也是好的，不然大半年的用功白废了。今天跟小祖宗掰扯了半天，感觉现在的人焦虑是自找的，一年赚了三十万还要焦虑，还要让我赞助。我也不懂这日子是怎么过的，居然说钱都不知道用哪去了，一年要买十万的包包，
状态机（State Machine）是什么？ Yashar Qian 计算机体系结构的那些事儿计算机体系结构设计模式数学模型
状态机（StateMachine）是什么？状态机（StateMachine）详解状态机是一种描述系统行为的数学模型，用于表示一个对象或程序在有限状态之间的转换逻辑。它通过状态（State）、**事件（Event）和动作（Action）**的交互，清晰地定义系统如何响应外部输入或内部条件变化。以下是其核心解析：状态机的核心组成组件说明示例（红绿灯）状态（State）系统所处的稳定模式，包含特定属性或
初次见面很重要，用好这些技巧，给别人留下好印象！ 80后的满
大家好，我是80后的大满！相信每一个走上管理岗位的人都会紧张，怎么和同事搞好关系、怎么给新同事留下好的印象、怎么能无缝开展工作等等。为此还会专门请教别人，得到一些指导，有的有效果，有的则起到不好的效果。在这里就会涉及到心理方面的一个课题；“你认为的不一定是别认为的”。为什么大部分人在初次见到陌生人会不手足无措，不敢表现自己，怕出现失误给别人留下不好的印象，而再和熟悉的朋友时候就会口若悬河，尽情的释
购物返佣平台那个好？购物返佣平台真的赚钱嘛？购物返佣平台如何加入？古楼
大屏幕手机的普及和数据流量越来越便宜，使得分享经济成为当下较为流行的经济发展模式。朋友圈、微博、聊天群等各大社交平台，长时间被购物链接、产品图片、产品好评等占据。这其中的一大模式就是分享购物返佣金。意思就是你分享产品的购物链接，其他人购买之后，你就会得到一部分佣金。由于不需要库存，不需要投入资金，于是分享购物赚佣金的模式很快就火了起来。于是乎，朋友圈里每天最多的就是各种产品广告，大到家用电器，小到
SUSE让AI可观测，助企业摆脱盲马夜行
当今时代，企业运营和发展越来越依赖于数字化技术。要说技术里的“当红炸子鸡”，非AI莫属。无数企业寄希望于借助AI转型，但同时又焦虑于如何用好AI。有句话是这么说的：“焦虑来源于恐惧，恐惧来源于未知。”“未知”出人意料地成为目前困扰众多企业迈出AI创新的最大迷雾——相关调查报告指出，至2025年1月份，仅有44%的AIPoC进入生产环节；同时由于模型及工具应用的不一致性、扩展及信任等各种原因，预计在
《出去玩》屹_DY
周六，我和弟弟妈妈姑姑出去玩。妈妈拿着两个自行车，两个跳绳，一个皮球。我们走了一会儿，就在一片空地玩了起来。我和奶奶比跳绳，我和奶奶比了四场，我全赢啦，第1、2、3，场比的是正着跳，第四场是倒着跳。我有两个弟弟，第一个弟弟大，第二个弟弟下。那弟弟骑一会儿自行车，我还一会儿皮球。小弟弟却要自行车和皮球一块儿玩，而且两个自行车，两个弟弟，只要同一个，最后小弟弟和大弟弟打了一战。最后小弟弟拿着皮球，大弟
Java 大视界 -- Java 大数据机器学习模型在金融市场情绪指数构建与投资决策支持中的应用（339）青云交大数据新视界 Java 大视界 java 大数据机器学习金融情绪指数投资决策量化策略情绪分析
Java大视界--Java大数据机器学习模型在金融市场情绪指数构建与投资决策支持中的应用（339）引言：正文：一、Java构建的金融市场情绪数据采集与预处理体系1.1多源异构数据接入引擎1.2数据采集延迟测试报告1.3情绪数据预处理管道二、Java驱动的金融市场情绪指数构建模型2.1多维度情绪指数计算框架2.2情绪指数与投资决策的映射模型三、Java在金融投资决策支持中的实战应用3.1量化私募情绪
AI应用服务 SUPER5266 人工智能
AI大模型--AI应用，该如何和前端交互，呈现llm模型答复内容呢？向LLM大模型提问后，系统得先识别问题，再从数据网络找信息，接着推理出正确结果，还得防止模型“胡编乱造”（控制模型幻想）。有时多个智能体（agent）要一起处理，结果还得融合。这些步骤都是异步进行的，没法像传统应用接口那样实时出结果。为减少大模型结果延迟、提升用户体验，我们提供以下方案。方案1、轮询后端pedding结果到db或其
手撕Spring底层系列之：后置处理器“PostProcessor” Xxtaoaooo Spring底层系列 java 开发语言后端 Spring底层源码剖析
人们眼中的天才之所以卓越非凡，并非天资超人一等而是付出了持续不断的努力。1万小时的锤炼是任何人从平凡变成超凡的必要条件。————马尔科姆·格拉德威目录一、后置处理器的概念1.1核心定义1.2两大核心对比1.3设计价值二、Bean生命周期扩展时机2.1执行步骤与实例化体现三、内置后置处理器解析3.1五大核心处理器职责3.2AOP代理创建流程四、总结嗨，我是Xxtaoaooo！本系列将用源码解剖+拆分
AI Agent从零到精通：深度解析Workflow、Prompt、Multi-Agent Systems和RL Training 爱看烟花的码农 AIGC NLP 人工智能 prompt
1.AI智能体简介：从概念到应用1.1什么是AI智能体？AI智能体是一种自主智能体，能够根据用户输入的目标，自主规划、执行和优化任务，最终生成结果。它不同于传统聊天模型（如ChatGPT）的单次回答能力，而是能处理多步骤、工具依赖、动态调整的复杂任务。例如：任务：用户要求“撰写一篇关于AI伦理的文章”。智能体行为：搜索资料、整理信息、撰写草稿、校对优化，全程无需用户干预。制造业场景（ManuS）：
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他