微调GPT3.5

三体融合实战：Django+讯飞星火+Colossal-AI的企业级AI系统架构

⚡核心架构设计️一、Django深度集成讯飞星火API（免费版）1.获取API凭证2.流式通信改造（解决高并发阻塞）3.Django视图层集成⚡二、Colossal-AI加速多模型适配策略1.私有模型微调方案

IT莫染·2025-07-05 19:24

day 45 python打卡

对resnet18在cifar10上采用微调策略下，用tensorboard监控训练过程。

·2025-07-05 14:12

AI原生应用开发必看：自然语言生成的5个最佳工程实践

AI原生应用开发必看：自然语言生成的5个最佳工程实践关键词：AI原生应用、自然语言生成、工程实践、Prompt工程、模型微调、评估指标、安全防护摘要：本文深入探讨了开发高质量自然语言生成(NLG)应用的

AI原生应用开发·2025-07-05 08:33

Mamba-YOLOv8深度解析：基于状态空间模型的下一代目标检测架构（含完整代码与实战部署）文末含资料链接！

传统架构的局限性1.2Mamba的创新优势二、Mamba-YOLOv8架构详解2.1整体架构设计2.2核心模块：VSSblock2.3SS2D模块工作原理三、完整实现流程3.1环境配置3.2代码集成步骤3.3训练与微调四

博导ai君·2025-07-05 06:18

NVIDIA Isaac GR00T N1.5 人形机器人强化学习入门教程（五）

系列文章目录目录系列文章目录前言一、更深入的理解1.1实体化动作头微调1.1.1实体标签1.1.2工作原理1.1.3支持的实现1.2高级调优参数1.2.1模型组件1.2.1.1视觉编码器（tune_visual

强化学习与机器人控制仿真·2025-07-05 00:15

AI大模型探索之路-训练篇15：大语言模型预训练之全量参数微调

系列篇章AI大模型探索之路-训练篇1：大语言模型微调基础认知AI大模型探索之路-训练篇2：大语言模型预训练基础认知AI大模型探索之路-训练篇3：大语言模型全景解读AI大模型探索之路-训练篇4：大语言模型训练数据集概览

寻道AI小兵·2025-07-04 22:03

Day44

1.预训练概念：在大规模数据上训练模型学习通用知识，再迁移到下游任务微调2.常见模型：图像有AlexNet、ResNet、ViT；NLP有BERT、GPT3.图像模型发展：从手工特征到深度学习，从CNN

·2025-07-04 12:19

大规模预训练语言模型的参数高效微调

人工智能咨询培训老师叶梓转载标明出处大规模预训练语言模型（PLMs）在特定下游任务上的微调和存储成本极高，这限制了它们在实际应用中的可行性。

·2025-07-04 10:37

大模型微调到底有没有技术含量？

今天给大家带来知乎好友@ybq的一篇回答-大模型微调到底有没有技术含量，或者说技术含量到底有多大？

DeepSeek-大模型系统教程·2025-07-04 05:02

LoRA微调详解：如何为AIGC模型节省90%显存

LoRA微调详解：如何为AIGC模型节省90%显存关键词：LoRA、低秩适应、AIGC模型、参数高效微调、显存优化摘要：在AIGC（人工智能生成内容）领域，大模型（如GPT-3、LLaMA、StableDiffusion

SuperAGI2025·2025-07-03 19:00

深入剖析AI大模型：关于模型训练

一、使用开源预训练模型1、如何利用开源模型（如BERT、GPT）进行微调开源预训练模型就像是已经搭建好框架的摩天大楼，BERT、GPT等模型便是其中声名赫赫的标志性建筑。它们经过海量数据的“

chilavert318·2025-07-03 08:06

微调 || RAG，项目落地怎么选？LLM应用选型指南，适用场景全解析

基本定义微调：是指利用更小、更具针对性的数据集对经过预先训练的大语言模型进一步训练的过程。在这个过程中，模型基于新数据集修改权重和参数，学习特定于任务的模式，同时保留来自最初预训练模型的知识。

认知超载·2025-07-03 08:36

Python Day44

图像预训练模型的发展史4.预训练的策略5.预训练代码实战：resnet181.预训练的概念预训练（Pre-training）是指在大规模数据集上，先训练模型以学习通用的特征表示，然后将其用于特定任务的微调

别勉.·2025-07-03 07:57

零基础起步：基于GpuGeek的文本生成模型实战

目录一、GpuGeek平台使用流程详解1.注册与登录2.数据上传3.创建训练实例4.启动与使用实例5.关闭实例（手动&自动）二、文本生成实战任务：微调GPT-21.

昊昊该干饭了·2025-07-03 06:54

(论文总结)思维链激发LLM推理能力

动机:从之前的应用和研究中得知，可以用生成自然语言解释、使用神经符号等形式语言的方法来提高大模型的算术推理能力，当时采用了从头预训练和微调模型的方法，耗费的成本较多；而且大模型具有根据少量文本提示进行上下文少样本学习的能力

靈镌sama·2025-07-03 03:58

DAY 45 Tensorboard使用介绍

DAY45Tensorboard使用介绍1.tensorboard的发展历史和原理2.tensorboard的常见操作3.tensorboard在cifar上的实战：MLP和CNN模型作业：对resnet18在cifar10上采用微调策略下

HINOTOR_·2025-07-03 01:10

【T2I】R&B: REGION AND BOUNDARY AWARE ZERO-SHOT GROUNDED TEXT-TO-IMAGE GENERATION

在这项工作中，我们探索了使用扩散模型进行零样本接地T2I生成，即无需训练辅助模块或微调扩散模型就能生成与输入布局信息相对应的图像。我们提出了一种区域与边

Akttt·2025-07-02 17:13

GitHub已破4.5w star，从“零样本”到“少样本”TTS，5秒克隆声音，冲击传统录音棚！

GPT‑SoVITS应运而生，它让“5秒语音克隆”“1分钟微调自定义说话人”“多语言切换”变得轻而易举。让无论是主播、配音师，还是科技爱好者，都能轻松拥有定制化声音输出。痛点场景配

小华同学ai·2025-07-02 15:28

【机器学习&深度学习】适合微调的模型选型指南

目录一、不同规模模型微调适用性二、微调技术类型对显存的影响三、选择建议（根据你的硬件）四、实际模型推荐五、不同模型适合人群六、推荐几个“非常适合微调”的模型七、推荐使用的微调技术八、场景选择示例场景1：

一叶千舟·2025-07-02 05:12

LoRA 实战指南：NLP 与 CV 场景的高效微调方法全解析

LoRA（Low-RankAdaptation）作为一种轻量级微调方案，正成为NLP与CV场景中低成本定制的利器。

fairymt·2025-07-02 00:11

AI:微调框架 LLaMA-Factory（Large Language Model Factory）

LLaMA-Factory（LargeLanguageModelFactory）是由北航团队开源的高效大语言模型（LLM）微调框架，旨在简化大型语言模型的定制化训练流程，支持超过100种主流模型和多种先进微调技术

xyzroundo·2025-07-02 00:40

【机器学习&深度学习】模型微调的基本概念与流程

目录前言一、什么是模型微调（Fine-tuning）？二、预训练vs微调：什么关系？

一叶千舟·2025-07-01 23:34

linux深度学习问题汇总

Illegalinstruction(coredumped)3.死锁4.掉卡二、通用方法1.查看重启记录2.系统性能监控3.后台执行命令4.异常日志三、深度学习技术1.普通网络改DDP训练，单机多卡，pytorch四、专业内容方法1.微调

不想改代码·2025-07-01 22:24

考取华为HCIE-AI有什么用？

主要是为了培养和认证掌握人工智能解决方案架构、设计与应用知识，具备大模型业务场景分析、大模型训练与微调、模型推理部署能力的专家级人才。一、HCIE-AI：专家级能力的权威认证HC

博睿谷IT99_·2025-07-01 18:59

设计模式 | 原型模式

当遇到以下场景时，传统构造方法面临挑战：创建成本高：对象初始化需访问数据库/读取文件（如游戏角色加载资源）状态复杂：对象包含多层嵌套结构（如DOM树节点）动态配置：运行时需基于现有对象微调生成新对象原型模式优势

@hdd·2025-07-01 17:16

从零开始大模型开发与微调：PyTorch中的卷积函数实现详解

从零开始大模型开发与微调：PyTorch中的卷积函数实现详解1.背景介绍1.1大模型开发的意义1.2卷积神经网络在大模型中的应用1.3PyTorch框架简介2.核心概念与联系2.1卷积的数学定义2.2卷积神经网络的组成

AI天才研究院·2025-07-01 13:50

【LLaMA 3实战】6、LLaMA 3上下文学习指南：从少样本提示到企业级应用实战

一、上下文学习（ICL）的技术本质与LLaMA3突破（一）ICL的核心原理与模型机制上下文学习（In-ContextLearning）的本质是通过提示词激活预训练模型的元学习能力，使模型无需微调即可适应新任务

无心水·2025-06-30 12:03

什么是 A/B 测试？

A组：使用旧版本（或基线方案）B组：使用新版本（或新模型）然后对比它们的表现，例如：点击率（CTR）转化率（ConversionRate）用户停留时长任务完成率微调后模型的自动应答准确率、满意度等二，为什么叫

茫茫人海一粒沙·2025-06-30 11:30

微调大语言模型后，如何评估效果？一文讲清

在做大语言模型（LLM）微调时，“怎么判断模型调得好不好”是必须回答的问题。无论是在研究、项目落地，还是面试中，评估方法都不能停留在“训练loss降了”这么简单。

茫茫人海一粒沙·2025-06-30 11:28

解密大模型全栈开发：从搭建环境到实战案例，一站式攻略

大模型的发展历程大模型的类型大模型全栈开发环境搭建硬件需求软件环境配置云服务选择大模型应用开发流程模型选择策略提示工程（PromptEngineering）模型微调（Fine-tuning）参数高效微调

海棠AI实验室·2025-06-29 09:39

微调大语言模型(生成任务)，怎么评估它到底“变好”了？

随着大语言模型（如GPT、LLaMA）的广泛应用，越来越多团队开始基于它们做微调，定制符合自己业务需求的模型。微调虽能让模型更贴合任务，但评估是否真的“变好”却不是简单的事。

茫茫人海一粒沙·2025-06-29 09:38

NL2SQL进阶系列(1)：DB-GPT-Hub、SQLcoder、Text2SQL开源应用实践详解

开源应用实践详解NL2SQL基础系列(1)：业界顶尖排行榜、权威测评数据集及LLM大模型（SpidervsBIRD）全面对比优劣分析[Text2SQL、Text2DSL]NL2SQL基础系列(2)：主流大模型与微调方法精选集

汀、人工智能·2025-06-28 19:21

LLaMA Factory 微调后，迁移模型

方法1：使用HuggingFaceHub（最推荐）fromtransformersimportAutoModelForCausalLM,AutoTokenizer#在源服务器上保存模型到Hubmodel.push_to_hub("your-username/your-model-name")tokenizer.push_to_hub("your-username/your-model-name")

激进小猪1002·2025-06-28 18:17

企业级知识库私有化部署：腾讯混元+云容器服务TKE实战

本文以某证券机构智能投研系统为原型，演示如何基于腾讯混元大模型与TKE容器服务实现：千亿级参数模型的私有化部署金融领域垂直场景微调高并发低延迟推理服务全链路安全合规方案1.1典型技术挑战#性能基准测试数据

大熊计算机·2025-06-28 14:45

大模型笔记10：LoRA微调

LoRA微调的原理矩阵的秩矩阵的秩代表一个矩阵中所含信息的大小。行秩：矩阵中互相不重复、不依赖（即线性无关）的行的最大数目。列秩：矩阵中互相不重复、不依赖的列的最大数目。

errorwarn·2025-06-28 09:41

【大模型学习 | LORA 原理及实现】

GitHub-microsoft/LoRA:Codeforloralib,animplementationof“LoRA:Low-RankAdaptationofLargeLanguageModels”GPT-3：175B微调模型变得十分的贵

九年义务漏网鲨鱼·2025-06-27 23:13

大语言模型(LLM)量化基础知识(一)

-派神-·2025-06-27 23:42

【人工智能】微调的秘密武器：释放大模型的无限潜能

答案是微调（Fine-tuning）。本文深入探讨微调的理论基础、技术细节与实践方法，揭示其作为解锁大模型隐藏潜力

蒙娜丽宁·2025-06-27 20:18

DeepSeek 部署中的常见问题及解决方案：从环境配置到性能优化的全流程指南

个人主页：慌ZHANG-CSDN博客期待您的关注一、引言：大模型部署的现实挑战随着大模型技术的发展，以DeepSeek为代表的开源中文大模型，逐渐成为企业与开发者探索私有化部署、垂直微调、模型服务化的重要选择

慌ZHANG·2025-06-27 16:49

【面试宝典】【大模型入门】【模型微调】

面试热点科普：监督微调vs无监督微调，有啥不一样？在大模型时代（比如BERT、GPT）里，我们经常听到“预训练+微调”的范式。但你可能会疑惑——监督微调、无监督微调，到底有啥区别？用的场景一样吗？

曾小文·2025-06-27 04:00

中文工单分类模型选择

采用基于预训练模型的微调（Fine-tuning）方案来做中文工单分类，这是非常明智的选择，因为预训练模型已经在大量中文语料上学习了丰富的语言知识，能大幅提升分类效果。

SugarPPig·2025-06-27 04:26

⼤模型（LLMs）基础⾯

GPT模型通过在⼤规模⽆标签⽂本上进⾏预训练，然后在特定任务上进⾏微调，具有很强的⽣成能⼒和语⾔理解能⼒。2.BERT（B

cv2016_DL·2025-06-27 01:04

大模型加载多个LoRA并灵活切换

然而，这些模型在微调时往往需要大量的计算资源。为了解决这个问题，LoRA通过低秩矩阵来适应新的任务，从而减少了模型的内存占用和计算需求。

Kaydeon·2025-06-26 19:20

ArcMap常用1：地理配准（一张地图图片和gis地图的匹配）

7、在添加点后，如有不准确的点，可点击配准按钮旁边的列表按钮进行删减和微调：8、调整完成后，在左

肆意飞扬·2025-06-26 03:37

大模型应用10种架构模式全解析：从理论到实战的技术指南

一、架构模式全景图在深入细节前，先通过一张表格快速了解各模式的核心价值：架构模式核心目标典型场景开源工具案例端到端微调最大化任务性

ai大模型雪糕·2025-06-25 20:47

MLX LM - 在Apple芯片上运行大语言模型的Python工具包

量化模型，上传HF4、流式生成采样5、命令行6、长提示词与生成四、支持模型大模型一、关于MLXLM1、项目概览MLXLM是一个Python工具包，支持在Apple芯片上使用MLX进行文本生成和大语言模型微调

富婆E·2025-06-25 08:26

15.2 LLaMA 3面试模拟神器：动态难度调节+实时反馈，大厂通过率提升90%

LLaMA3面试模拟神器：动态难度调节+实时反馈，大厂通过率提升90%关键词：对话系统设计、场景化提示工程、LLaMA3微调、多轮对话管理、面试模拟Agent技术面试场景Agent设计核心逻辑通过多阶段对话流程控制和动态难度调节实现真实面试模拟

少林码僧·2025-06-25 06:06

从7B到671B：DeepSeek R1大模型微调的GPU选型终极指南

当DeepSeekR1系列以7B到671B的参数跨度构建起完整技术栈时，微调场景的硬件选择已演变为一场精密的数学游戏。

卓普云·2025-06-24 17:54

大模型强化微调GRPO——DeepSeekMath: Pushing the Limits of MathematicalReasoning in Open Language Models

1.概述大型语言模型（LLM）革新了人工智能领域的数学推理方法，在定量推理基准测试（Hendrycks等，2021年）和几何推理基准测试（Trinh等，2024年）方面取得了重大进展。此外，这些模型在帮助人类解决复杂的数学问题方面也发挥了重要作用（Yao，2023年）。然而，像GPT-4（OpenAI，2023年）和Gemini-Ultra（Anil等，2023年）这样的尖端模型并未公开，目前可获

樱花的浪漫·2025-06-24 15:43

字节内部热捧“7种大模型微调的方法笔记”，简直太全了！！

背景随着ChatGPT的爆火，很多机构都开源了自己的大模型，比如清华的ChatGLM-6B/ChatGLM-10B/ChatGLM-130B，HuggingFace的BLOOM-176B。当然还有很多没有开源的，比如OpenAI的ChatGPT/GPT-4，百度的文心一言，谷歌的PLAM-540B，华为的盘古大模型，阿里的通义千问，等等。这些大公司或者研究机构，都是有足够资源的来开发大模型，但是对

大模型教程.·2025-06-24 11:47

推荐频道