微调GPT3.5 第5页

DeepSeek-R1-0528-Qwen3-8B为底座微调领域大模型准备:制作领域专用数据集

前言想要微调领域大模型，数据的准备是必不可少的。然而微调大模型需要的数据极多，这样花费很多人力和准备。有没有方便又高效的方法？一下子就可以准备大量的领域专用数据集呢？

Ven%·2025-06-05 17:33

以人类演示视频为提示，学习可泛化的机器人策略

当面对新任务时，此类方法通常需要收集一组新的遥操作数据并微调策略。此外，遥操作数据收集流程也很繁琐且

三谷秋水·2025-06-05 15:21

AlphaCode：人工智能编程的突破性进展

1.AlphaCode技术原理AlphaCode基于Transformer架构，采用了大规模无监督预训练和有监督微调相结合的方法。其核心创新点包括：大规模代码

亿只小灿灿·2025-06-05 09:45

【大模型入门指南 10】大模型推理部署：vLLM和llama.cpp

大模型入门指南03】提示词工程【大模型入门指南04】Transformer结构【大模型入门指南05】LLM技术选型【大模型入门指南06】LLM数据预处理【大模型入门指南07】量化技术解析【大模型入门指南08】微调和分布式训练

青松ᵃⁱ·2025-06-05 06:18

RAG优化知识库检索（3）：向量化模型选择与优化

本文将深入探讨嵌入模型的发展历程、不同类型的嵌入模型比较、微调技术、多语言挑战以及嵌入维度与性能的权衡等关键

程序员查理·2025-06-05 06:16

(LLaMa Factory)大模型训练方法--准备模型（Qwen2-0.5B）

1、准备训练框架LLaMAFactory是一款开源低代码大模型微调框架，集成了业界最广泛使用的微调技术，支持通过WebUI界面零代码微调大模型，目前已经成为开源社区内最受欢迎的微调框架。

风起晨曦·2025-06-04 23:21

4. 如何减少大模型幻觉？⸺大模型外挂向量数据库的分析（知识延伸版）

（转载需经授权）目录1.大模型幻觉1.1大模型幻觉的含义1.2大模型幻觉产生的原因2.缓解大模型幻觉方案的比较与选择2.1Prompt优化2.2微调大模型2.3外挂知识库3.向量数据库3.1向量3.

姚瑞南Raynan·2025-06-04 20:27

【论文阅读】VideoChat-R1: Enhancing Spatio-Temporal Perception via Reinforcement Fine-Tuning

研究目标：方法：采用强化微调（RFT）结合GRPO，专门针对视频MLLMs进行优化。目标：增强模型对视频时空感知的能力。保持模型的通用能力。实验与发现RFT在小样本数据下即可显著提

s1ckrain·2025-06-04 17:41

自动驾驶转具身智能的切入点有哪些？

从算法维度上看，具身智能领域基本延续了机器人和自驾的一些算法，比如SLAM、规划控制、模型训练与微调方式、数据生成方式、大模型。当然也有很多具体的任务不太一样，比如数据采集方式、重执行硬件与结构。

自动驾驶之心·2025-06-04 16:59

聊天记录秒变数字分身，探索科技新边界！

WeClone：开创个性化数字分身之路WeClone通过微信聊天记录来微调大语言模型，为每个

人工智能我来了·2025-06-04 14:12

WeClone项目v0.1.2版本发布：声音克隆与聊天机器人集成

使用微信聊天记录微调大语言模型，并绑定到微信机器人，实现自己的数字克隆。

单盼晔·2025-06-04 13:07

Flink运行架构及并行度设置 —— 深入源码行级解析

（以Flink1.16为例，部分包名和类名在不同版本会有微调，但主线逻辑不变）Flink运行架构及并行度设置——深入源码行级解析一、Flink运行时架构源码细节1.JobManager启动入口：org.a

北漂老男人·2025-06-04 13:36

WeClone：用微信聊天记录克隆数字分身

Stars数12888Forks数961主要特点聊天记录微调：基于聊天记录对大语言模型进行微调，生成个性化数字分身。

开源项目精选·2025-06-04 13:36

AI配色神器：一键生成专业色彩方案

✨核心优势智能生成：通过情感、主题、概念等提示词生成配色灵活编辑：支持手动调整HEX值微调配色社区共享：浏览和学习其他用户的配色方案实时预览：在移动应用、网页、仪表板中预览效果一键导出：快速导出配色方案用于项目快速上手

当归1024·2025-06-04 02:42

Pytorch的梯度控制

在之前的实验中遇到一些问题，因为之前计算资源有限，我就想着微调其中一部分参数做，于是我误打误撞使用了withtorch.no_grad，可是发现梯度传递不了，于是写下此文来记录梯度控制的两个方法与区别。

白雾街·2025-06-03 20:02

微调embedding模型_jhgan-ko-sroberta-multitask

模型地址：https://huggingface.co/jhgan/ko-sroberta-multitask目录数据准备阶段特殊韩语处理技巧模型加载与配置损失函数选择指南进阶训练配置评估与优化策略数据准备阶段推荐数据格式：#句子对格式（语义相似度任务）samples=[("문장1","문장2",0.8),#相似度得分("한국어문장","다른한국어문장",0.3)]#三元组格式（信息检索任务）tr

激进小猪1002·2025-06-03 19:51

本地部署FreeGPT+内网穿透公网远程访问，搞定ChatGPT外网访问难题

‌FreeGPT‌是一个基于GPT3.5/4的ChatGPT聊天网页用户界面，提供了一个开放的聊天界面，开箱即用‌。ChatGPT是非常热门的，但访问体验一直不太理想。

搬码临时工·2025-06-03 15:25

EMNLP 2017 北京论文报告会笔记

第一部分写我最喜欢的论文，第二部分总结一些以模型融合为主要方法的论文，第三部分总结一些对模型组件进行微调的论文，第四部分是类似旧瓶装

ljtyxl·2025-06-03 12:05

强化学习-深度学习和强化学习领域

GRPO（可能指Gradient-basedPolicyOptimization或ReinforcementLearningwithPolicyOptimization）是两种不同的训练范式，常用于模型微调或策略优化

高效匠人·2025-06-03 04:38

大语言模型生成式AI学习笔记——2. 1.4LLM指令微调——多任务指令微调

Multi-taskinstructionfine-tuning（多任务指令微调）Multitaskfine-tuningisanextensionofsingletaskfine-tuning,wherethetrainingdatasetiscomprisedofexampleinputsandoutputsformultipletasks.Here

预见未来to50·2025-06-02 23:57

AIGC领域Stable Diffusion的模型微调方法与实践

AIGC领域StableDiffusion的模型微调方法与实践关键词：StableDiffusion、模型微调、AIGC、深度学习、生成对抗网络、文本到图像生成、迁移学习摘要：本文系统解析StableDiffusion

AI大模型应用工坊·2025-06-01 10:02

Prompt Tuning与自然语言微调对比解析

PromptTuning与输入提示词自然语言微调的区别和联系一、核心定义与区别维度PromptTuning（提示微调）输入提示词自然语言微调本质优化连续向量空间中的提示嵌入（不可直接阅读）优化离散自然语言文本

ZhangJiQun&MXP·2025-05-31 18:39

《重新定义高效微调：QLoRA 4位量化的颠覆式创新解析》

在深入了解QLoRA之前，我们先回顾一下传统大模型微调面临的严峻挑战。传统的大模型微调，随着模型规模的不断扩大，参数量呈指数级增长，这使得模型在内存需求和计算资源上的消耗变得极为庞大。

程序猿阿伟·2025-05-31 17:34

【大模型】情绪对话模型项目研发

一、使用框架：Qwen大模型后端+Open-webui前端实现使用LLamaFactory的STF微调数据集，vllm后端部署，二、框架安装下载千问大模型安装魔塔社区库文件pipinstall modelscopeDownload.py

SSH_5523·2025-05-31 14:16

【论文阅读】Federated Large Language Model : A Position Paper

联邦大模型的两种学习方式两种非常直观的方法：一种是从头训练，一种是利用私有数据集进行微调。优劣也非常直观：第一种方法允许特定任务的模型

只说人话绝不装逼·2025-05-31 07:55

17、Swift框架微调实战（2）-QWQ-32B LORA微调cot数据集

相比于传统的指令微调（instruction-tuned）模型，QwQ具备思考与推理（thinkingandreasoning）的能力，因此在各种下游任务（特别是复杂问题）上，能实现显著的性能提升。

Andy_shenzl·2025-05-31 02:14

23、Swift框架微调实战（3）-Qwen2.5-VL-7B LORA微调OCR数据集

一、模型介绍Qwen2.5-VL是阿里通义千问团队开源的视觉语言模型，具有3B、7B和72B三种不同规模，能够识别常见物体、分析图像中的文本、图表等元素，并具备作为视觉Agent的能力。Qwen2.5-VL具备作为视觉Agent的能力，可以推理并动态使用工具，初步操作电脑和手机。在视频处理上，Qwen2.5-VL能够理解超过1小时的长视频，精准定位相关片段捕捉事件。模型还支持发票、表单等数据的结构

Andy_shenzl·2025-05-31 02:43

【自然语言处理与大模型】大模型（LLM）基础知识⑤

技术层面：技术手段描述强化学习与指令微调通过强化学习（如RLHF）或指令微调，让模型更倾向于生成合规、

小oo呆·2025-05-31 01:42

一文读懂Vision Transformer图像分类原理与实现

本文将详细探讨Transformer架构在图像分类中的微调，即VisionTransformer（ViT）的工作原理、重要细节以及具体实现。

t0_54program·2025-05-31 01:40

中科院提出ConRFT：让机器人灵活穿针，强化学习微调！

从数据层面来看，基于监督学习的微调方式高度依赖演示数据的数量与质量。但在现实场景里，这些数据往往存在局限，数据量有限且一致性差，难以涵盖机器人可能遭遇的各种复杂状态。

xwz小王子·2025-05-30 21:39

大模型现象级发现-2025年上半年资料收集

大模型微调会思考的大模型更不听话，我的豆包失控了…WhenThinkingFails:ThePitfallsofReasoningforInstruction-

CSPhD-winston-杨帆·2025-05-30 15:51

vmware安装win10

win10系统有生物识别技术、Cortana搜索功能、平板模式、桌面应用、多桌面、开始菜单进化、任务切换器、任务栏的微调、贴靠辅助、通知中心、命令提示符窗口升级、文件资源管理器升级、新的Edge浏览器、

2501_92223294·2025-05-30 13:41

DPO（Direct Preference Optimization）详解

应用背景：替代PPO实现RLHF微调流程不需要训练Reward

要努力啊啊啊·2025-05-30 10:18

分享全国数字人才技能提升师资培训班第五期邀请函

线下（广州班）：大模型与AIGC多模态技术应用实战线下（青岛班）：Deepseek教学应用与智能体开发实战线上班（十二大专题）：DeepSeek大模型教学应用实战大模型与AIGC技术应用实战大模型部署与微调实战

泰迪智能科技01·2025-05-29 18:46

【大模型基础_毛玉仁】4.5 实践与应用--参数高效微调PEFT

目录4.5实践与应用4.5.1PEFT实践1）PEFT主流框架2）HF-PEFT框架使用3）PEFT相关技巧4.5.2PEFT应用1）表格数据查询2）表格数据分析4.5实践与应用实践部分介绍流行HuggingFace开发的开源库HF-PEFT框架及其使用方法和技巧。应用部分展示PEFT在表格数据处理和金融领域Text-to-SQL生成任务中的案例，证明其在提升大模型特定任务性能方面的有效性，为未来

XiaoJ1234567·2025-05-29 16:05

用Python玩转人工智能——手搓图像分类模型

state_dict）（三）模型保存与加载示例二、加载ImageNet预训练模型三、数据准备与可视化（一）加载数据集（二）使用Matplotlib可视化数据四、模型训练五、使用torchvision进行模型微调六

波涛浪子·2025-05-28 21:23

小样本分类新突破：QPT技术详解

图1：全模型微调、掩码语言模型（MLM）和提示学习范例图示内容(a)通用微调模型（fine-tuning）输入文本直接通过预训练模

ZhangJiQun&MXP·2025-05-28 21:21

大模型应用开发第四讲：两大方向：增加上下文信息（知识） vs 提升行动力（微调或Agent技术）

大模型应用开发第四讲：两大方向：增加上下文信息（知识）vs提升行动力（微调或Agent技术）资料取自《大模型应用开发：动手做AIAgent》。

·2025-05-28 16:42

最强开源模型 Llama 3.1 部署推理微调实战大全

目录引言一、Llama3.1简介二、Llama3.1性能评估三、Llama3.1模型推理实战1、环境准备2、安装依赖3、模型下载4、模型推理四、Llama3.1模型微调实战1、数据集准备2、导入依赖包3

寻道AI小兵·2025-05-28 15:08

多模态大模型研究综述

叶梓老师带您深入了解LlamaFactory——一款革命性的大模型微调工具。1小时实战课程，您将学习到如何轻松上手并有效利用LlamaFactory来微调您的模型，以发挥其最大潜力。

人工智能培训咨询叶梓·2025-05-28 11:06

常见本地大模型个人知识库工具部署、微调及对比选型

文章目录常见本地大模型个人知识库工具部署、微调及对比选型知识库侧AnythingLLMMaxKBRAGFlowFastGPTDifyOpenWebUI小结大模型侧OllamaLMStudioXinference

猫猫姐·2025-05-27 23:07

LVGL（lv_spinbox微调框控件）

文章目录一、什么是`lv_spinbox`⚙️二、常用API简介1️⃣创建`lv_spinbox`对象2️⃣设置参数3️⃣增加/减少当前数字4️⃣光标控制三、简单示例代码四、显示效果五、注意事项六、适合场景lv_spinbox是LVGL（LightandVersatileGraphicsLibrary）中的一个用于数值输入的组件，外观上类似一个可以上下调整数字的小输入框，常用于需要手动设定数值的场

花落已飘·2025-05-27 17:32

从0到1搭建AI绘画模型：Stable Diffusion微调全流程避坑指南

从0到1搭建AI绘画模型：StableDiffusion微调全流程避坑指南系统化学习人工智能网站（收藏）：https://www.captainbed.cn/flu文章目录从0到1搭建AI绘画模型：StableDiffusion

layneyao·2025-05-27 13:38

进阶篇09ChatGLM一键微调微调过程

阿里云ChatGLM模型微调实战教程一、环境初始化与模型部署1.1环境加载流程正常异常开始环境初始化加载基础镜像检查GPU状态下载ChatGLM-6B提交工单排查安装Python依赖加载测试数据集1.2

monday_CN·2025-05-27 13:07

分享全国数字人才技能提升师资培训班第五期