E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
微调GPT3.5
DeepSeek-R1-0528-Qwen3-8B为底座
微调
领域大模型准备:制作领域专用数据集
前言想要
微调
领域大模型,数据的准备是必不可少的。然而
微调
大模型需要的数据极多,这样花费很多人力和准备。有没有方便又高效的方法?一下子就可以准备大量的领域专用数据集呢?
Ven%
·
2025-06-05 17:33
简单说深度学习
微调
微调大模型
微调领域大模型
deepseek微调
数据集准备
以人类演示视频为提示,学习可泛化的机器人策略
当面对新任务时,此类方法通常需要收集一组新的遥操作数据并
微调
策略。此外,遥操作数据收集流程也很繁琐且
三谷秋水
·
2025-06-05 15:21
大模型
智能体
计算机视觉
机器人
计算机视觉
深度学习
语言模型
人工智能
AlphaCode:人工智能编程的突破性进展
1.AlphaCode技术原理AlphaCode基于Transformer架构,采用了大规模无监督预训练和有监督
微调
相结合的方法。其核心创新点包括:大规模代码
亿只小灿灿
·
2025-06-05 09:45
人工智能
人工智能
AlphaCode
【大模型入门指南 10】大模型推理部署:vLLM和llama.cpp
大模型入门指南03】提示词工程【大模型入门指南04】Transformer结构【大模型入门指南05】LLM技术选型【大模型入门指南06】LLM数据预处理【大模型入门指南07】量化技术解析【大模型入门指南08】
微调
和分布式训练
青松ᵃⁱ
·
2025-06-05 06:18
LLM入门系列
llama
RAG优化知识库检索(3):向量化模型选择与优化
本文将深入探讨嵌入模型的发展历程、不同类型的嵌入模型比较、
微调
技术、多语言挑战以及嵌入维度与性能的权衡等关键
程序员查理
·
2025-06-05 06:16
#
RAG
人工智能
AI
Agent
自然语言处理
RAG
(LLaMa Factory)大模型训练方法--准备模型(Qwen2-0.5B)
1、准备训练框架LLaMAFactory是一款开源低代码大模型
微调
框架,集成了业界最广泛使用的
微调
技术,支持通过WebUI界面零代码
微调
大模型,目前已经成为开源社区内最受欢迎的
微调
框架。
风起晨曦
·
2025-06-04 23:21
llama
4. 如何减少大模型幻觉?⸺大模型外挂向量数据库的分析(知识延伸版)
(转载需经授权)目录1.大模型幻觉1.1大模型幻觉的含义1.2大模型幻觉产生的原因2.缓解大模型幻觉方案的比较与选择2.1Prompt优化2.2
微调
大模型2.3外挂知识库3.向量数据库3.1向量3.
姚瑞南Raynan
·
2025-06-04 20:27
大模型落地探索及agent搭建
RAG技术应用探索
prompt系列课程
数据库
人工智能
算法
chatgpt
AIGC
embedding
【论文阅读】VideoChat-R1: Enhancing Spatio-Temporal Perception via Reinforcement Fine-Tuning
研究目标:方法:采用强化
微调
(RFT)结合GRPO,专门针对视频MLLMs进行优化。目标:增强模型对视频时空感知的能力。保持模型的通用能力。实验与发现RFT在小样本数据下即可显著提
s1ckrain
·
2025-06-04 17:41
强化学习
AIGC
计算机视觉
论文阅读
多模态大模型
强化学习
自动驾驶转具身智能的切入点有哪些?
从算法维度上看,具身智能领域基本延续了机器人和自驾的一些算法,比如SLAM、规划控制、模型训练与
微调
方式、数据生成方式、大模型。当然也有很多具体的任务不太一样,比如数据采集方式、重执行硬件与结构。
自动驾驶之心
·
2025-06-04 16:59
自动驾驶
人工智能
机器学习
聊天记录秒变数字分身,探索科技新边界!
WeClone:开创个性化数字分身之路WeClone通过微信聊天记录来
微调
大语言模型,为每个
人工智能我来了
·
2025-06-04 14:12
IT技术
科技
WeClone项目v0.1.2版本发布:声音克隆与聊天机器人集成
使用微信聊天记录
微调
大语言模型,并绑定到微信机器人,实现自己的数字克隆。
单盼晔
·
2025-06-04 13:07
Flink运行架构及并行度设置 —— 深入源码行级解析
(以Flink1.16为例,部分包名和类名在不同版本会有
微调
,但主线逻辑不变)Flink运行架构及并行度设置——深入源码行级解析一、Flink运行时架构源码细节1.JobManager启动入口:org.a
北漂老男人
·
2025-06-04 13:36
Flink
flink
架构
大数据
WeClone:用微信聊天记录克隆数字分身
Stars数12888Forks数961主要特点聊天记录
微调
:基于聊天记录对大语言模型进行
微调
,生成个性化数字分身。
开源项目精选
·
2025-06-04 13:36
微信
AI配色神器:一键生成专业色彩方案
✨核心优势智能生成:通过情感、主题、概念等提示词生成配色灵活编辑:支持手动调整HEX值
微调
配色社区共享:浏览和学习其他用户的配色方案实时预览:在移动应用、网页、仪表板中预览效果一键导出:快速导出配色方案用于项目快速上手
当归1024
·
2025-06-04 02:42
插件
中间件
前端
人工智能
前端
Pytorch的梯度控制
在之前的实验中遇到一些问题,因为之前计算资源有限,我就想着
微调
其中一部分参数做,于是我误打误撞使用了withtorch.no_grad,可是发现梯度传递不了,于是写下此文来记录梯度控制的两个方法与区别。
白雾街
·
2025-06-03 20:02
pytorch
人工智能
python
微调
embedding模型_jhgan-ko-sroberta-multitask
模型地址:https://huggingface.co/jhgan/ko-sroberta-multitask目录数据准备阶段特殊韩语处理技巧模型加载与配置损失函数选择指南进阶训练配置评估与优化策略数据准备阶段推荐数据格式:#句子对格式(语义相似度任务)samples=[("문장1","문장2",0.8),#相似度得分("한국어문장","다른한국어문장",0.3)]#三元组格式(信息检索任务)tr
激进小猪1002
·
2025-06-03 19:51
embedding
bert
自然语言处理
本地部署FreeGPT+内网穿透公网远程访问,搞定ChatGPT外网访问难题
FreeGPT是一个基于
GPT3.5
/4的ChatGPT聊天网页用户界面,提供了一个开放的聊天界面,开箱即用。ChatGPT是非常热门的,但访问体验一直不太理想。
搬码临时工
·
2025-06-03 15:25
chatgpt
网络
服务器
远程工作
访问公司内网
EMNLP 2017 北京论文报告会笔记
第一部分写我最喜欢的论文,第二部分总结一些以模型融合为主要方法的论文,第三部分总结一些对模型组件进行
微调
的论文,第四部分是类似旧瓶装
ljtyxl
·
2025-06-03 12:05
NLP
强化学习-深度学习和强化学习领域
GRPO(可能指Gradient-basedPolicyOptimization或ReinforcementLearningwithPolicyOptimization)是两种不同的训练范式,常用于模型
微调
或策略优化
高效匠人
·
2025-06-03 04:38
人工智能
深度学习
人工智能
大语言模型生成式AI学习笔记——2. 1.4LLM指令
微调
——多任务指令
微调
Multi-taskinstructionfine-tuning(多任务指令
微调
)Multitaskfine-tuningisanextensionofsingletaskfine-tuning,wherethetrainingdatasetiscomprisedofexampleinputsandoutputsformultipletasks.Here
预见未来to50
·
2025-06-02 23:57
机器学习
深度学习(ML/DL)
算法
AIGC领域Stable Diffusion的模型
微调
方法与实践
AIGC领域StableDiffusion的模型
微调
方法与实践关键词:StableDiffusion、模型
微调
、AIGC、深度学习、生成对抗网络、文本到图像生成、迁移学习摘要:本文系统解析StableDiffusion
AI大模型应用工坊
·
2025-06-01 10:02
AI大模型开发实战
AIGC
stable
diffusion
ai
Prompt Tuning与自然语言
微调
对比解析
PromptTuning与输入提示词自然语言
微调
的区别和联系一、核心定义与区别维度PromptTuning(提示
微调
)输入提示词自然语言
微调
本质优化连续向量空间中的提示嵌入(不可直接阅读)优化离散自然语言文本
ZhangJiQun&MXP
·
2025-05-31 18:39
教学
2024大模型以及算力
2021
AI
python
prompt
人工智能
机器学习
学习
分类
《重新定义高效
微调
:QLoRA 4位量化的颠覆式创新解析》
在深入了解QLoRA之前,我们先回顾一下传统大模型
微调
面临的严峻挑战。传统的大模型
微调
,随着模型规模的不断扩大,参数量呈指数级增长,这使得模型在内存需求和计算资源上的消耗变得极为庞大。
程序猿阿伟
·
2025-05-31 17:34
人工智能
算法
【大模型】情绪对话模型项目研发
一、使用框架:Qwen大模型后端+Open-webui前端实现使用LLamaFactory的STF
微调
数据集,vllm后端部署,二、框架安装下载千问大模型安装魔塔社区库文件pipinstall modelscopeDownload.py
SSH_5523
·
2025-05-31 14:16
大模型
python
语言模型
人工智能
【论文阅读】Federated Large Language Model : A Position Paper
联邦大模型的两种学习方式两种非常直观的方法:一种是从头训练,一种是利用私有数据集进行
微调
。优劣也非常直观:第一种方法允许特定任务的模型
只说人话绝不装逼
·
2025-05-31 07:55
联邦大模型
论文阅读
语言模型
人工智能
17、Swift框架
微调
实战(2)-QWQ-32B LORA
微调
cot数据集
相比于传统的指令
微调
(instruction-tuned)模型,QwQ具备思考与推理(thinkingandreasoning)的能力,因此在各种下游任务(特别是复杂问题)上,能实现显著的性能提升。
Andy_shenzl
·
2025-05-31 02:14
大模型学习
Swift
QWQ
微调
LORA
23、Swift框架
微调
实战(3)-Qwen2.5-VL-7B LORA
微调
OCR数据集
一、模型介绍Qwen2.5-VL是阿里通义千问团队开源的视觉语言模型,具有3B、7B和72B三种不同规模,能够识别常见物体、分析图像中的文本、图表等元素,并具备作为视觉Agent的能力。Qwen2.5-VL具备作为视觉Agent的能力,可以推理并动态使用工具,初步操作电脑和手机。在视频处理上,Qwen2.5-VL能够理解超过1小时的长视频,精准定位相关片段捕捉事件。模型还支持发票、表单等数据的结构
Andy_shenzl
·
2025-05-31 02:43
大模型学习
swift
微调
LoRA
ocr
【自然语言处理与大模型】大模型(LLM)基础知识⑤
技术层面:技术手段描述强化学习与指令
微调
通过强化学习(如RLHF)或指令
微调
,让模型更倾向于生成合规、
小oo呆
·
2025-05-31 01:42
【自然语言处理与大模型】
自然语言处理
人工智能
一文读懂Vision Transformer图像分类原理与实现
本文将详细探讨Transformer架构在图像分类中的
微调
,即VisionTransformer(ViT)的工作原理、重要细节以及具体实现。
t0_54program
·
2025-05-31 01:40
生成对抗网络
人工智能
神经网络
个人开发
中科院提出ConRFT:让机器人灵活穿针,强化学习
微调
!
从数据层面来看,基于监督学习的
微调
方式高度依赖演示数据的数量与质量。但在现实场景里,这些数据往往存在局限,数据量有限且一致性差,难以涵盖机器人可能遭遇的各种复杂状态。
xwz小王子
·
2025-05-30 21:39
扩散策略
具身智能
强化学习及自动驾驶
机器人
大模型现象级发现-2025年上半年 资料收集
大模型
微调
会思考的大模型更不听话,我的豆包失控了…WhenThinkingFails:ThePitfallsofReasoningforInstruction-
CSPhD-winston-杨帆
·
2025-05-30 15:51
人工智能
vmware安装win10
win10系统有生物识别技术、Cortana搜索功能、平板模式、桌面应用、多桌面、开始菜单进化、任务切换器、任务栏的
微调
、贴靠辅助、通知中心、命令提示符窗口升级、文件资源管理器升级、新的Edge浏览器、
2501_92223294
·
2025-05-30 13:41
windows
DPO(Direct Preference Optimization)详解
应用背景:替代PPO实现RLHF
微调
流程不需要训练Reward
要努力啊啊啊
·
2025-05-30 10:18
大模型中的技术名词解析
人工智能
深度学习
算法
分享全国数字人才技能提升师资培训班 第五期邀请函
线下(广州班):大模型与AIGC多模态技术应用实战线下(青岛班):Deepseek教学应用与智能体开发实战线上班(十二大专题):DeepSeek大模型教学应用实战大模型与AIGC技术应用实战大模型部署与
微调
实战
泰迪智能科技01
·
2025-05-29 18:46
人工智能
人工智能
【大模型基础_毛玉仁】4.5 实践与应用--参数高效
微调
PEFT
目录4.5实践与应用4.5.1PEFT实践1)PEFT主流框架2)HF-PEFT框架使用3)PEFT相关技巧4.5.2PEFT应用1)表格数据查询2)表格数据分析4.5实践与应用实践部分介绍流行HuggingFace开发的开源库HF-PEFT框架及其使用方法和技巧。应用部分展示PEFT在表格数据处理和金融领域Text-to-SQL生成任务中的案例,证明其在提升大模型特定任务性能方面的有效性,为未来
XiaoJ1234567
·
2025-05-29 16:05
《大模型基础》毛玉仁
大模型微调
用Python玩转人工智能——手搓图像分类模型
state_dict)(三)模型保存与加载示例二、加载ImageNet预训练模型三、数据准备与可视化(一)加载数据集(二)使用Matplotlib可视化数据四、模型训练五、使用torchvision进行模型
微调
六
波涛浪子
·
2025-05-28 21:23
Python教程
人工智能
python
分类
图像处理
小样本分类新突破:QPT技术详解
图1:全模型
微调
、掩码语言模型(MLM)和提示学习范例图示内容(a)通用
微调
模型(fine-tuning)输入文本直接通过预训练模
ZhangJiQun&MXP
·
2025-05-28 21:21
教学
2024大模型以及算力
2021
AI
python
分类
数据挖掘
人工智能
自然语言处理
机器学习
算法
大模型应用开发第四讲:两大方向:增加上下文信息(知识) vs 提升行动力(
微调
或Agent技术)
大模型应用开发第四讲:两大方向:增加上下文信息(知识)vs提升行动力(
微调
或Agent技术)资料取自《大模型应用开发:动手做AIAgent》。
·
2025-05-28 16:42
最强开源模型 Llama 3.1 部署推理
微调
实战大全
目录引言一、Llama3.1简介二、Llama3.1性能评估三、Llama3.1模型推理实战1、环境准备2、安装依赖3、模型下载4、模型推理四、Llama3.1模型
微调
实战1、数据集准备2、导入依赖包3
寻道AI小兵
·
2025-05-28 15:08
AI大模型预训练微调进阶
开源
llama
人工智能
AIGC
语言模型
AI编程
多模态大模型研究综述
叶梓老师带您深入了解LlamaFactory——一款革命性的大模型
微调
工具。1小时实战课程,您将学习到如何轻松上手并有效利用LlamaFactory来
微调
您的模型,以发挥其最大潜力。
人工智能培训咨询叶梓
·
2025-05-28 11:06
人工智能前沿
人工智能
语言模型
人工智能培训
大模型工具
多模态
自然语言处理
多模态大模型
常见本地大模型个人知识库工具部署、
微调
及对比选型
文章目录常见本地大模型个人知识库工具部署、
微调
及对比选型知识库侧AnythingLLMMaxKBRAGFlowFastGPTDifyOpenWebUI小结大模型侧OllamaLMStudioXinference
猫猫姐
·
2025-05-27 23:07
大模型
人工智能
大模型
LVGL(lv_spinbox
微调
框控件)
文章目录一、什么是`lv_spinbox`⚙️二、常用API简介1️⃣创建`lv_spinbox`对象2️⃣设置参数3️⃣增加/减少当前数字4️⃣光标控制三、简单示例代码四、显示效果五、注意事项六、适合场景lv_spinbox是LVGL(LightandVersatileGraphicsLibrary)中的一个用于数值输入的组件,外观上类似一个可以上下调整数字的小输入框,常用于需要手动设定数值的场
花落已飘
·
2025-05-27 17:32
C语言
UI
LVGL
从0到1搭建AI绘画模型:Stable Diffusion
微调
全流程避坑指南
从0到1搭建AI绘画模型:StableDiffusion
微调
全流程避坑指南系统化学习人工智能网站(收藏):https://www.captainbed.cn/flu文章目录从0到1搭建AI绘画模型:StableDiffusion
layneyao
·
2025-05-27 13:38
ai
AI作画
stable
diffusion
进阶篇09ChatGLM一键
微调
微调
过程
阿里云ChatGLM模型
微调
实战教程一、环境初始化与模型部署1.1环境加载流程正常异常开始环境初始化加载基础镜像检查GPU状态下载ChatGLM-6B提交工单排查安装Python依赖加载测试数据集1.2
monday_CN
·
2025-05-27 13:07
langchain
分享全国数字人才技能提升师资培训班 第五期
线下(广州班):大模型与AIGC多模态技术应用实战线下(青岛班):Deepseek教学应用与智能体开发实战线上班(十二大专题):DeepSeek大模型教学应用实战大模型与AIGC技术应用实战大模型部署与
微调
实战
泰迪智能科技01
·
2025-05-27 03:04
人工智能
vmware安装win10(Mac电脑)
win10系统有生物识别技术、Cortana搜索功能、平板模式、桌面应用、多桌面、开始菜单进化、任务切换器、任务栏的
微调
、贴靠辅助、通知中心、命令提示符窗口升级、文件资源管理器升级、新的Edge浏览器、
nimosec
·
2025-05-26 18:17
电脑
windows
Transformer大模型实战 针对下游任务进行
微调
Transformer,
微调
,下游任务,自然语言处理,预训练模型,迁移学习,计算机视觉1.背景介绍近年来,深度学习在人工智能领域取得了突破性进展,其中Transformer模型凭借其强大的序列建模能力,
AI大模型应用之禅
·
2025-05-26 04:21
java
python
javascript
kotlin
golang
架构
人工智能
工业大模型全景解析:53个大模型案例深度探索
根据沙丘智库发布的《[2024年中国工业大模型应用跟踪报告]》,工业大模型是指在通用基础大模型(例如文心一言、通义千问等)的基础上,结合行业&场景数据进行预训练和
微调
,并进行模型压缩(裁剪、蒸
大模型猫叔
·
2025-05-25 22:09
人工智能
开源
机器人
数据库
职场和发展
chatgpt
Diffusers代码学习:Stable Video Diffusion
SVDCheckpoint被训练以生成14帧视频,并且SVD-XTCheckpoint点被进一步
微调
以生成25帧视频。下面将在本指南中使用SVD-XTCheckpoint。
duhaining1976
·
2025-05-25 21:34
AIGC
相关概念辨析
主要方法分为基于
微调
、数据增强和迁移学习。(2)单样本学习:单样本学习是FSL的特例,当每个类别只有一个样本时,这个问题成为单样本学习。由于在多数情况下两者的设定较为相似,因此通常可以互换使用。
wintercoming111
·
2025-05-25 17:07
深度学习
迁移学习
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他