E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
微调GPT3.5
字节内部热捧“7种大模型
微调
的方法笔记”,简直太全了!!
背景随着ChatGPT的爆火,很多机构都开源了自己的大模型,比如清华的ChatGLM-6B/ChatGLM-10B/ChatGLM-130B,HuggingFace的BLOOM-176B。当然还有很多没有开源的,比如OpenAI的ChatGPT/GPT-4,百度的文心一言,谷歌的PLAM-540B,华为的盘古大模型,阿里的通义千问,等等。这些大公司或者研究机构,都是有足够资源的来开发大模型,但是对
大模型教程.
·
2025-06-24 11:47
笔记
人工智能
语言模型
自然语言处理
大模型
微调
Hugging Face 一键部署代码模型
这意味着,开发者现在只需在平台上进行几次点击,即可将托管在HuggingFaceHub上的任何AI编程模型(如CodeGemma,StarCoder,或自己
微调
的模型)快速部署为一个安全、可扩展的生产级
儿女初养
·
2025-06-24 07:20
编程资讯新闻
人工智能
基于通义大模型的智能客服系统构建实战:从模型
微调
到API部署
1引言本文将深入探讨基于通义大模型的智能客服系统构建全流程,从数据准备、模型
微调
、性能优化到API部署和系统集成。
大熊计算机
·
2025-06-24 04:35
开发实战
语言模型
人工智能
教师-学生协同知识蒸馏机制在私有化系统中的融合路径:架构集成、训练范式与部署实践
教师-学生协同知识蒸馏机制在私有化系统中的融合路径:架构集成、训练范式与部署实践关键词:私有化部署、知识蒸馏、教师模型、学生模型、协同蒸馏、蒸馏训练、边缘部署、模型压缩、国产大模型、自监督
微调
摘要:随着国产大模型在企业私有化环境中的广泛部署
观熵
·
2025-06-24 03:25
人工智能
DeepSeek
私有化部署
15.3 LLaMA 3+LangChain实战:智能点餐Agent多轮对话设计落地,订单准确率提升90%!
关键词:多轮对话设计、场景化提示工程、LLaMA3
微调
、LangChainAgent、饭店点餐场景建模饭店点餐场景的Agent方案设计通过分层架构实现复杂场景对话控制,系统设计包含5个核心模块:点餐咨询订单修改支付咨询用户输入意图识别菜品推荐订单管理支付流程多轮对话管理外部系统集成响应生成
少林码僧
·
2025-06-23 23:05
llama
langchain
windows
人工智能
语言模型
机器学习
使用 ABAP 弹出 Windows 操作系统的通知消息
我们在Windows操作系统的设置面板里,能够对系统的通知行为进行各种
微调
:然后使用快捷键Win+N,能查看操作系统曾经收到的通知消息的历史记录:笔者虽然不知道
汪子熙
·
2025-06-23 19:05
零基础快速学习
ABAP
windows
ABAP
编程语言
NetWeaver
SAP
思爱普
NL2SQL实践系列(1):深入解析Prompt工程在text2sql中的应用技巧
中的应用技巧NL2SQL基础系列(1):业界顶尖排行榜、权威测评数据集及LLM大模型(SpidervsBIRD)全面对比优劣分析[Text2SQL、Text2DSL]NL2SQL基础系列(2):主流大模型与
微调
方法精选集
汀、人工智能
·
2025-06-23 13:20
LLM工业级落地实践
prompt
NL2DSL
NL2SQL
大模型
自然语言处理
人工智能
Text2SQL
2025-
微调
Qwen3 实战教程
一、概述unsloth
微调
Qwen3模型提供显著优势:训练速度提高2倍,VRAM使用减少70%,支持8倍长的上下文。Qwen3–30B-A3B仅需17.5GBVRAM即可运行。
·
2025-06-23 12:17
二、【LLaMA-Factory实战】数据工程全流程:从格式规范到高质量数据集构建
一、引言在大模型
微调
中,数据质量直接决定模型性能。LLaMA-Factory提供了完整的数据工程工具链,支持从数据格式规范到清洗增强、注册验证的全流程管理。
陈奕昆
·
2025-06-23 11:40
大模型微调教程
llama
python
前端
人工智能
大模型微调
BERT模型
微调
全攻略:从数据准备到模型部署
BERT模型
微调
全攻略:从数据准备到模型部署关键词:BERT模型、模型
微调
、数据准备、模型训练、模型部署摘要:本文全面介绍了BERT模型
微调
的整个流程,从数据准备开始,逐步讲解了数据预处理、模型训练以及最终的模型部署等关键步骤
AI智能探索者
·
2025-06-23 09:28
bert
人工智能
深度学习
ai
利用ms-swift
微调
LLaVA-OneVision
利用ms-swift
微调
LLaVA-OneVision资料合集环境安装目录详情训练模型下载模型准备训练(train)数据和验证集(validation)数据提前改一些小bug脚本Merged-LoRA脚本
moTcream
·
2025-06-23 07:16
人工智能
AIGC
Python str.format() 函数在 LLM prompt 生成中的使用(
微调
、刷库等)
str.format()函数介绍:Pythonformat格式化函数,用于增强字符串格式化。在LLM中批量生成prompt的简单示例:template="我现在有一个用户问题和系统的答案,帮我把答案中和用户问题最直接的关键词提取出来。\n问题:“{query}”\n答案:“{answer}”"examples={'query':"秒换装教学",'answer':"在王者荣耀游戏中,秒换装的技巧主要
ctrl A_ctrl C_ctrl V
·
2025-06-23 05:29
#
大模型llm
python
prompt
开发语言
自然语言处理
DB-GPT-HUB Text-to-SQL
微调
DB-GPT-HUBText-to-SQL
微调
项目介绍DB-GPT-Hub是一个利用LLMs实现Text-to-SQL解析的实验项目,主要包含数据集收集、数据预处理、模型选择与构建和
微调
权重等步骤,通过这一系列的处理可以在提高
__如风__
·
2025-06-23 04:56
数据库
gpt
sql
大模型学习路线:这会是你见过最全最新的大模型学习路线【2025最新】
大模型学习路线建议先从主流的Llama开始,然后选用中文的Qwen/Baichuan/ChatGLM,先快速上手体验prompt工程,然后再学习其架构,跑
微调
脚本如果要深入学习,建议再按以下步骤,从更基础的
大模型入门学习
·
2025-06-23 00:56
学习
人工智能
产品经理
大模型
AI产品经理
程序员
大模型学习
pythonday50
作业:1.好好理解下resnet18的模型结构2.尝试对vgg16+cbam进行
微调
策略importtorchimporttorch.nnasnnimporttorch.optimasoptimimporttorchvisionimporttorchvision.transformsastransformsfromtorchvisionimportmodelsfromtorch.utils.dat
我爱音乐yyy
·
2025-06-23 00:51
python打卡训练营
深度学习
pytorch
python
ChatMusician:用大模型理解并创造音乐
ChatMusician由SkyworkAIPTE.LTD.和香港科技大学的研究团队共同开发,它基于持续预训练和
微调
的LLaMA2模型,并通过一种文本兼容的音乐表示法——ABC符号,将音乐作为第二语言来处理
人工智能大模型讲师培训咨询叶梓
·
2025-06-22 19:19
人工智能讲师
人工智能
音视频
计算机视觉
深度学习
大模型
多模态
音乐
RAG 和
微调
如何抉择
要选择RAG(Retrieval-AugmentedGeneration)还是
微调
(Fine-tuning),或者两者结合,主要取决于如下数据特性应用场景资源限制模型行为的控制需求RAGvs.
微调
:如何选择
成都犀牛
·
2025-06-22 14:20
深度学习
人工智能
机器学习
pytorch
llamafactory
微调
模型出现TypeError: argument of type ‘NoneType‘ is not iterable
问题介绍本文作者碰到的问题是File“/root/miniconda3/lib/python3.12/site-packages/transformers/modeling_utils.py”,line1969,inpost_initifvnotinALL_PARALLEL_STYLES:^^^^^^^^^^^^^^^^^^^^^^^^^^^^TypeError:argumentoftype‘No
成都犀牛
·
2025-06-22 14:19
python
开发语言
人工智能
深度学习
神经网络
LoRA
LLama
Factory
LinkedIn求职神器[特殊字符]AI驱动搜索让你轻松找到心仪工作!
这一功能通过利用提炼和
微调
的大型语言模型,在提升求职者求职体验上迈出了重要的一步。这项新功能让LinkedIn用户可以通过自然语言来进行职位搜索。例如,以往用户在输入
人工智能我来了
·
2025-06-22 07:36
人工智能
AI
人工智能
Llama 4模型卡片及提示词模板
Llama4模型卡片及提示词模板Llama4模型卡及提示格式介绍Llama4模型概述Llama4是一系列预训练和指令
微调
的混合专家(Mixture-of-Experts,MoE)大语言模型,包含两种规模
大模型与Agent智能体
·
2025-06-21 23:44
A2A
MCP
Llama
4
【大模型开发】Hugging Face的Transformers库详解介绍与案例
深入解析HuggingFaceTransformers及开源大模型
微调
实践HuggingFaceTransformers已成为自然语言处理(NLP)乃至多模态(跨语言、图像、音频等)应用中最为流行、功能最完备的开源框架之一
云博士的AI课堂
·
2025-06-21 11:01
大模型技术开发与实践
哈佛博后带你玩转机器学习
深度学习
transformer
huggingface
大模型技术
大模型开发
deepseek
机器学习
深度学习
生成本地
微调
+强化学习 qwen3-4b 研究搭建流程步骤
在本地
微调
并应用强化学习(RL)对Qwen-3-4B模型进行研究和搭建,是一个复杂但可行的过程。以下是一个详细的流程步骤,涵盖从环境准备、数据准备、模型
微调
到强化学习应用的各个阶段。
行云流水AI笔记
·
2025-06-21 11:54
人工智能
【无标题】
在本地对Qwen-3-4B模型进行
微调
,并结合强化学习(RL)以提高其从自然语言(TXT)到结构化查询语言(SQL)的转换能力(即TXT2SQL),是一个复杂但非常有价值的任务。
行云流水AI笔记
·
2025-06-21 11:54
人工智能
什么是 QLoRA(Quantized Low-Rank Adaptation,量化低秩适配)
QLoRA(QuantizedLow-RankAdaptation,量化低秩适配)是LoRA(Low-RankAdaptation)的一种优化扩展,旨在进一步降低大语言模型
微调
的计算和内存需求。
彬彬侠
·
2025-06-21 06:23
大模型
QLoRA
量化低秩适配
PEFT
参数高效微调
transformers
bitsandbytes
python
三十年河东,三十年河西
你需要拼命学习你需要补不足,补短板最怕自己能力不足,还在自我安慰重新出发了,后端->大模型
微调
->AIGC顶峰相见了,以后没得摸了
·
2025-06-20 23:44
LoRA、QLoRA是什么
一:LoRA(Low-RankAdaptation,低秩适应)是一种高效的大模型参数
微调
技术,由Meta在2021年提出。
爱吃土豆的马铃薯ㅤㅤㅤㅤㅤㅤㅤㅤㅤ
·
2025-06-20 17:58
人工智能
机器学习
深度学习
AI模型
微调
完整学习方案:从入门到精通
引言随着大语言模型(LLM)技术的快速发展,
微调
模型以适应特定任务或领域的需求变得越来越重要。
微调
是一种技术,通过对预训练模型进行进一步训练,使其能够更好地解决特定问题或在特定领域表现更佳。
奔四的程序猿
·
2025-06-20 05:34
大模型微调
人工智能
学习
llama_index chromadb实现RAG的简单应用
毕竟大模型本地化有利于
微调
,RAG使内容更有依据。为什么要用RAG?
victorwjw
·
2025-06-19 21:07
llama
数据库
RAG
Qwen2.5:模型训练和推理核心参数介绍
原因:如果不去掉,在进行
微调
时,模型就会将数据集原始字段和新加的字段一起输入到模型,导致格式与期望的不一致。
艾墨舟启航
·
2025-06-18 04:51
大模型实战
大模型
Trainer
参数介绍
YOLO进化史:从v1到v12的注意力革命 —— 实时检测的“快”与“准”如何兼得?
YOLOv2(2017):引入锚框(AnchorBoxes),通过k-means聚类确定先验框尺寸新增高分辨率
微调
(448×448输入)使用Darknet-19主干,速度达67FPSYOLOv
摘取一颗天上星️
·
2025-06-17 23:49
YOLO
LLM指令
微调
Prompt的最佳实践(二):Prompt迭代优化
Prompt定义3.迭代优化——以产品说明书举例3.1产品说明书3.2初始Prompt3.3优化1:添加长度限制3.4优化2:细节纠错3.5优化3:添加表格4.总结5.参考1.前言前情提要:《LLM指令
微调
SmallerFL
·
2025-06-17 22:11
NLP&机器学习
prompt
llm
chatgpt
python
nlp
sft
Embedding
微调
就是你的救星!
在AI时代,Embedding是NLP任务的基石,直接决定了你的模型是「聪明绝顶」还是「笨拙不堪」。你是否遇到过这些让人头疼的问题:做智能问答时,模型总是答非所问,用户一脸懵圈?做推荐系统时,用户翻遍推荐内容,还是觉得「没一个对味」?做语义搜索时,搜索结果五花八门,相关性差到让人抓狂?这些问题的罪魁祸首,往往就是你的Embedding不够精准!通用Embedding在特定领域常常「水土不服」:在电
大模型玩家
·
2025-06-17 13:41
embedding
ai
自然语言处理
人工智能
语言模型
学习
程序员
大模型
微调
(Fine-tuning)概览
大模型
微调
(Fine-Tuning)是将预训练大模型(如GPT、LLaMA)适配到特定任务或领域的核心技术,其效率与效果直接影响大模型的落地价值。
MzKyle
·
2025-06-17 08:39
深度学习
人工智能
【GitHub开源项目实战】DINOv2 自监督视觉模型深度解构:多任务零
微调
性能与多分辨率表征架构解析
DINOv2自监督视觉模型深度解构:多任务零
微调
性能与多分辨率表征架构解析关键词DINOv2、自监督视觉模型、ViT、多分辨率表示、语义分割、深度估计、Zero-shot、图像表示学习、OpenCLIP
观熵
·
2025-06-17 01:15
GitHub开源项目实战
github
开源
架构
人工智能
实现AI数据高效评估的一种方法
在线评价阶段,则通过对synset进行
微调
,并结合特定的模型行为评估需求,快速构建出针对不同测试样本的影
mao_feng
·
2025-06-17 00:08
人工智能
【AI大模型】15、从GPT-1到GPT-3:大语言模型核心技术演进与能力涌现全解析
一、GPT-1:预训练
微调
范式的奠基者(2018)(一)架构创新:单向Transformer解码器的诞生GPT-1首次将Transformer架构应用于语言模型领域,其核心采用12层Transformer
·
2025-06-16 14:04
DeepSeek 遭美国攻击宕机,手把手教你本地部署,手机也支持!
自主控制与定制化可根据业务需求灵活调整模型参数、优化算法,或集成私有数据
微调
模型,适配特定场景。低延迟与高性能本地部署减少网络传输延迟,结合硬件优化(如GPU加速),提升实时处理效率。
MarkGosling
·
2025-06-16 11:45
人工智能
自然语言处理
ai
【项目实训】【项目博客#06】大模型
微调
与推理优化(4.21-5.11)
【项目实训】【项目博客#06】大模型
微调
与推理优化(4.21-5.11)文章目录【项目实训】【项目博客#06】大模型
微调
与推理优化(4.21-5.11)项目博客概述一、整体架构设计二、QLora量化
微调
技术
elon_z
·
2025-06-16 05:07
创新项目实训—哈哈哈萌霓队
人工智能
语言模型
python
预训练、指令
微调
与RLHF如何塑造LLM
理解这个训练过程的核心环节——大规模无监督预训练(Pre-training)、指令
微调
(InstructionFine-Tuning,IFT)以及从人类反馈中强化学习(ReinforcementLearningfromHumanFeedback
由数入道
·
2025-06-15 16:15
人工智能
提示词工程
交互
2025年大模型学习路线图:史上最全、最新的大模型学习指南!非常详细收藏这一篇就够了!
大模型学习路线建议先从主流的Llama开始,然后选用中文的Qwen/Baichuan/ChatGLM,先快速上手体验prompt工程,然后再学习其架构,跑
微调
脚本前排提示,文末有大模型AGI-CSDN独家资料包哦
大模型教程
·
2025-06-15 16:42
知识图谱
人工智能
RAG
大模型
程序员
AI大模型
大模型学习
S4-Driver: Scalable Self-Supervised Driving Multimodal Large Language Model with Spatio-Temporal
核心方法包括:稀疏体表示(SparseVolumeRepresentation):将多视图、多帧图像的视觉信息聚合到3D空间,通过轻量级投影和门控机制动态选择关键区域,增强模型的3D时空推理能力,且无需
微调
预训练的视觉
UnknownBody
·
2025-06-15 15:37
LLM
Daily
Multimodal
语言模型
人工智能
自然语言处理
【项目实训】【项目博客#04】ArkTS代码切分与
微调
数据集提示词生成(4.7-4.20)
【项目实训】【项目博客#04】ArkTS代码切分与
微调
数据集提示词生成(4.7-4.20)文章目录【项目实训】【项目博客#04】ArkTS代码切分与
微调
数据集提示词生成(4.7-4.20)项目博客概述一
elon_z
·
2025-06-15 06:05
创新项目实训—哈哈哈萌霓队
python
harmonyos
语言模型
用 LoRA 对 Qwen2.5-VL 模型进行SFT - qwen2_5vl_lora_sft.yaml
1llamafactory-clitrainexamples/train_lora/qwen2_5vl_lora_sft.yamlqwen2_5vl_lora_sft.yaml││││└──SFT:有监督
微调
二分掌柜的
·
2025-06-15 02:37
Qwen
LoRA
Qwen
qwen
记录一个大模型逐层
微调
计算损失输出少了一个维度的小bug
1.假如针对的对象是lineardef_compute_mse_on_batch(layer:nn.Module,batch_iter:Iterator[Tuple[torch.Tensor,torch.Tensor]],**kwargs)->torch.Tensor:inps_batch,outs_batch=next(batch_iter)print("Initialinps_batch:",
绒绒毛毛雨
·
2025-06-14 21:31
bug
Python打卡第50天
@浙大疏锦行知识点回顾:resnet结构解析CBAM放置位置的思考针对预训练模型的训练策略差异化学习率三阶段
微调
数据预处理+定义cbamimporttorchimporttorch.nnasnnimporttorch.optimasoptimfromtorchvisionimportdatasets
猛犸MAMMOTH
·
2025-06-14 16:25
Python打卡60天
python
深度学习
开发语言
python打卡第50天
知识点回顾:resnet结构解析CBAM放置位置的思考针对预训练模型的训练策略差异化学习率三阶段
微调
现在我们思考下,是否可以对于预训练模型增加模块来优化其效果,这里我们会遇到一个问题预训练模型的结构和权重是固定的
whyeekkk
·
2025-06-14 07:59
python
深度学习
人工智能
2025年4月大模型预训练、
微调
服务器推荐
大模型预训练与
微调
,对显卡的显存要求高,显存是决定模型能不能跑的关键因素,因此,挑选显卡时优先考虑显存问题;其次再考虑单精度等性能问题目前常用的显卡包括A600048G、L2048G、L4048G、6000Ada48G
HPC_fac13052067816
·
2025-06-14 04:40
人工智能
服务器
深度学习
神经网络
计算机视觉
语音识别
ubuntu
大模型现在用的最多 其次是预训练模型,大模型用于rag agent 预训练模型用于
微调
任务
当前的人工智能领域,大模型与预训练模型的应用场景呈现出显著的差异化特征,以下从技术逻辑、应用场景及典型案例三个维度展开分析:一、大模型(LLM)的核心应用:RAGAgent架构1.技术逻辑:动态知识检索与推理融合大模型(如GPT-4、Claude3.5)具备强大的语言理解与生成能力,但受限于参数规模(通常千亿级以上),难以存储实时或专业领域的海量知识。RAG(Retrieval-Augmented
MYH516
·
2025-06-13 21:52
人工智能
04 XTuner 大模型单卡低成本
微调
实战
目录1Finetune简介1.1监督
微调
1.2增量预训练1.3LoRA&QLoRA2XTuner
微调
框架3
微调
实战3.1公开数据集demo3.2自定义
微调
1Finetune简介LLM的下游应用中,增量预训练和指令跟随是经常会用到的两种
微调
模式
wangzixinxinxin
·
2025-06-13 20:22
书生·浦语大模型实战营
深度学习
机器学习
人工智能
大语言模型实战:从零构建AI原生应用的完整指南
大语言模型实战:从零构建AI原生应用的完整指南关键词:大语言模型、AI原生应用、Prompt工程、
微调
、RAG、LangChain、LLMOps摘要:本文将带领读者从零开始构建一个完整的AI原生应用。
AI原生应用开发
·
2025-06-13 11:15
语言模型
AI-native
人工智能
ai
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他