指令集微调

具身系列——NLP工程师切入机器人和具身智能方向

NLP工程师设计的转型路径与策略，结合最新招聘信息和技术趋势：一、技能迁移与知识重构（3-6个月）核心能力复用深度学习基础：迁移Transformer架构经验到多模态场景（视觉-语言-动作融合）大模型微调

music&movie·2025-03-25 21:47

21.13 “零代码实战：ChatGLM3-6B+Gradio打造企业级翻译神器，本地部署秒级响应“

基于ChatGLM3-6B实现图形化界面的openai-translator关键词：ChatGLM3-6B应用开发,Gradio界面设计,多语言翻译系统,大模型微调,本地化部署一、项目背景与技术选型1.1

少林码僧·2025-03-25 10:20

保姆级大模型学习路线！清华博士耗时半年整理的14个核心阶段，文科生也能跟着冲！（附论文笔记+项目源码+训练技巧）

2023行业调查报告显示：92%学习者停滞在微调阶段，核心痛点集中在：论文看不懂：Transformer源码像天书环境配不好：CUDA版本冲突天天报错算力不够用：

大模型入门教程·2025-03-25 01:17

SFT和RLHF是什么意思？

环境：SFTRLHF问题描述：SFT和RLHF是什么意思解决方案：SFT（SupervisedFine-Tuning，监督微调）和RLHF（ReinforcementLearningfromHumanFeedback

玩人工智能的辣条哥·2025-03-25 00:15

大模型微调方法之Delta-tuning

大模型微调方法之Delta-tuning大模型微调方法自从23年之后可谓是百花齐放，浙大有团队在8月将关于大模型微调方法的综述上传了ArXiv。论文将微调方法总结为等几个类别。

空白II·2025-03-24 20:09

大模型的应用与微调：如何调用 LLM？从 OpenAI API 到本地部署

本篇文章将详细介绍如何调用大语言模型（LLM），涵盖OpenAIAPI、DeepSeek、Manus、通义千问等模型的调用方式，并探讨如何在本地部署LLM进行推理。1.调用OpenAIAPI（GPT系列）OpenAI提供了RESTfulAPI供开发者调用GPT系列模型。示例：使用Python调用OpenAIAPIimportopenaiopenai.api_key="your_api_key"re

晴天彩虹雨·2025-03-24 19:02

当细致剪裁遇上大语言模型：从数据匹配到卓越性能的奇幻之旅

步子哥·2025-03-24 18:24

使用 Baseten 部署和运行机器学习模型的指南

无论是开源模型如Llama2和Mistral，还是专有或经过微调的模型，Baseten都能在专用GPU上运行。技术背景介绍Baseten提供了一种不同

shuoac·2025-03-24 03:17

Centos7部署Graylog5.2日志系统

Graylog5.2部署Graylog5.2适配MongoDB5.x~6.x，MongoDB5.0+要求CPU支持AVX指令集。

LoongKK·2025-03-24 03:15

RISC-V生态架构浅析(认识RISC-V)

什么是RISC-VRISC-V应该泛指RISC-V指令集及其衍生出来的一系列生态。而RISC-V指令集，类似于INTE

JKX_geek·2025-03-24 01:29

从指令集鸿沟到硬件抽象：AI 如何重塑手机与电脑编程语言差异——PanLang 原型全栈设计方案与实验性探索1

AI如何跨越指令集鸿沟？手机与电脑编程语言差异溯源与统一路径——PanLang原型全栈设计方案与实验性探索1文章目录AI如何跨越指令集鸿沟？

灏瀚星空·2025-03-23 14:17

大语言模型微调和大语言模型应用的区别？

大语言模型微调和大语言模型应用的区别？关键要点微调大型语言模型（LLM）是调整预训练模型以适应特定任务或领域的过程，研究表明这能显著提升性能。

AI Echoes·2025-03-23 11:30

一文说清预训练与微调：AI的双重训练法则

什么是预训练？预训练是大型语言模型训练的第一步。它在资金和计算能力的支持下，通过深入分析大量的文本数据，使模型建立起语言的基本构架。在这一阶段，模型通过学习海量的书籍、文章和网页，识别出语言的语法、句法和词汇规律。这就如同一名学生接受通识教育，他并没有专注于某一门学科，而是获取了多方面的知识。自回归语言建模和掩码语言建模是预训练中常见的两种方法。前者在逐步构建文本的连贯性时，通过预测下一单词的方式

TGITCIC·2025-03-23 07:02

Python预训练模型实现俄语音频转文字

Python预训练模型实现俄语音频转文字使用CommonVoice8.0、Golos和MultilingualTEDx的训练和验证分割对俄语的facebook/wav2vec2-xls-r-1b进行了微调

啥都鼓捣的小yao·2025-03-23 05:03

STM32八股【2】-----ARM架构

1、架构包含哪几部分内容寄存器处理模式流水线MMU指令集中断FPU总线架构2、以STM32为例进行介绍2.1寄存器寄存器名称作用R0-R3通用寄存器用于数据传递、计算及函数参数传递；R0也用于存储函数返回值

Invinciblenuonuo·2025-03-23 01:25

【从零开始学习计算机科学】计算机体系结构（一）计算机体系结构、指令、指令集（ISA）与量化评估

【从零开始学习计算机科学】计算机体系结构（一）计算机体系结构、指令、指令集（ISA）与量化评估概论计算机体系结构简介计算机的分类并行体系结构指令集体系结构（ISA）分类存储器寻址寻址模式操作数大小指令ISA

贫苦游商·2025-03-22 21:33

一文说清楚什么是预训练（Pre-Training）、微调（Fine-Tuning），零基础小白建议收藏！！

前言预训练和微调是现代AI模型的核心技术，通过两者的结合，机器能够在处理复杂任务时表现得更为高效和精准。预训练为模型提供了广泛的语言能力，而微调则确保了模型能够根据特定任务进行细化和优化。

小城哇哇·2025-03-22 20:26

LLM-Agent方法评估与效果分析

1.引言近年来，随着大型语言模型（LLM）的快速发展，基于强化学习（RL）对LLM进行微调以使其具备代理（Agent）能力成为研究热点。

·2025-03-22 18:50

llama-factory 微调 Qwen2.5-3B-Instruct

0、资源链接官方readme:https://github.com/hiyouga/LLaMA-Factory/blob/v0.9.1/README_zh.md官方文档:https://llamafactory.readthedocs.io/zh-cn/latest/官方推荐的知乎教程：https://zhuanlan.zhihu.com/p/6952876071、安装LLaMAFactorygi

coco_1998_2·2025-03-22 14:16

MiniMind

SFT数据：SFT（SupervisedFine-Tuning）数据集，用于监督式微调，可以提高模型在特定任务上的性能。DPO数据1和DPO数据2：这两个数

亚伯拉罕·黄肯·2025-03-22 14:46

DeepSpeed-Chat：Reward Model【奖励模型】

第二阶段：奖励模型微调奖励模型(RM)微调类似于第一阶段有监督微调(SFT)。

u013250861·2025-03-22 13:31

【大模型书籍PDF】从零开始大模型开发与微调：基于PyTorch与ChatGLM （推荐）_从零开始大模型开发与微调 pdf

本书使用PyTorch2.0作为学习大模型的基本框架，以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术，为读者揭示大模型开发技术。本书配套示例源代码、PPT课件。

喝不喝奶茶丫·2025-03-22 10:06

Deepseek-R1-Distill-Llama-8B + Unsloth 中文医疗数据微调实战

内容参考至博客与Bin_Nong1.环境搭建主要依赖的库(我的版本)：torch==2.5.1unsloth==2025.2.15trl==0.15.2transformers==4.49.0datasets=3.3.1wandb==0.19.62.数据准备-medical_o1_sft_Chinese经过gpt-o1的包含cot(思考过程)的中文医疗问答数据，格式与内容如下:"Question"

LuckyAnJo·2025-03-22 08:47

大模型最新面试题系列：微调篇之微调基础知识

一、全参数微调（Full-Finetune）vs参数高效微调（PEFT）对比1.显存使用差异全参数微调：需存储所有参数的梯度（如GPT-3175B模型全量微调需约2.3TB显存）PEFT：以LoRA为例

人肉推土机·2025-03-22 05:42

【大模型系列】SFT（Supervised Fine-Tuning，监督微调）

欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术,jvm,并发编程redis,kafka,Spring,微服务等常用开发工具系列:常用的开发工具,IDEA,Mac,Alfred,Git,

Kwan的解忧杂货铺@新空间代码工作室·2025-03-22 02:20

DeepSeek-R1大模型微调技术深度解析：架构、方法与应用全解析

1.DeepSeek-R1大模型架构设计与技术特性1.1架构设计DeepSeek-R1作为超大规模语言模型，其核心架构设计包含以下创新：专家混合架构（MoE）采用6710亿参数的混合专家架构（MoE），每个推理过程仅激活370亿参数，实现计算效率与资源利用率的突破性提升。Transformer框架增强基于改进型Transformer架构，结合多头注意力机制（MLA）与动态权重分配技术，优化了长程依

大势下的牛马·2025-03-22 00:58

一、大语言模型微调 vs. 大语言模型应用

一、大语言模型微调vs.大语言模型应用1.微调（Fine-Tuning）的含义与特点定义与作用微调指在预训练好（通用）的基础模型上，通过在特定领域或任务的数据集上进一步训练来调整模型参数，使其在该领域任务中获得更优表现

AI Echoes·2025-03-21 13:54

【新品发售】NVIDIA 发布全球最小个人 AI 超级计算机 DGX Spark

DGXSpark(前身为ProjectDIGITS)支持AI开发者、研究人员、数据科学家和学生，在台式电脑上对大模型进行原型设计、微调和推理。

·2025-03-21 12:09

Hugging Face预训练GPT微调ChatGPT（微调入门！新手友好！）

HuggingFace预训练GPT微调ChatGPT（微调入门！新手友好！）在实战中，⼤多数情况下都不需要从0开始训练模型，⽽是使⽤“⼤⼚”或者其他研究者开源的已经训练好的⼤模型。

y江江江江·2025-03-21 10:31

【Linux】Linux下调试器gdb的使用

作者主页：@安度因学习社区：StackFrame专栏链接：Linux文章目录一、前言二、铺垫三、指令集和使用1、指令集2、演示四、结语如果无聊的话，就来逛逛我的博客栈吧!

安度因·2025-03-21 10:26

NLU-预训练模型-2018：Bert（二）【“Masked LM”缺点：①预训练与微调不一致；②忽略了掩码位置间的依赖关系】【复杂度：O(n^2·d)；n：输入序列长度（规定最长512）】

五、BERT中的词嵌入1、为什么要使用BERT的嵌入使用BERT从文本数据中提取特征，即单词和句子的嵌入向量。我们可以用这些词和句子的嵌入向量做什么？首先，这些嵌入对于关键字/搜索扩展、语义搜索和信息检索非常有用。例如，如果你希望将客户的问题或搜索与已经回答的问题或文档化的搜索相匹配，这些表示将帮助准确的检索匹配客户意图和上下文含义的结果，即使没有关键字或短语重叠。其次，或许更重要的是，这些向量被

u013250861·2025-03-21 04:08

大模型微调

引入库2.读入数据3.对数据进行预处理4.转换为json格式文件三，使用算子分析数据并进行数据处理四，划分训练集和测试集五，编写训练脚本开始训练六，进行模型推理人工评估总结前言这是使用知乎评论进行模型微调

归一码字·2025-03-21 04:36

开源模型应用落地-qwen模型小试-调用Qwen2-7B-Instruct-进阶篇（十二）

无论是语言模型还是多模态模型，均在大规模多语言和多模态数据上进行预训练，并通过高质量数据进行后期微调以贴近人类偏好。

开源技术探险家·2025-03-20 19:23

模型微调：让AI更懂你的魔法棒

模型微调：让AI更懂你的魔法棒✨在人工智能的世界里，模型微调（Fine-tuning）就像是一位魔法师用魔法棒对预训练模型进行“个性化改造”，让它更适应特定的任务。

带上一无所知的我·2025-03-20 14:10

通过LoRA（Low-Rank Adaptation）低秩矩阵分解来高效微调权重变化

这种方法通过减少微调的参数数量来提高训练效率。

背太阳的牧羊人·2025-03-20 08:53

五、AIGC大模型_08Agent基础知识

0、概述根据知识的生命周期分类，我们通常会采取不同的方法（微调、RAG、Agent）来将知识融入到AI中0.1长生命周期知识这类知识通常具有较高的稳定性和通用性，不会因时间的推移而轻易改变。

学不会lostfound·2025-03-20 06:33

使用LangSmith Chat Datasets微调模型

在这篇文章中，我们将探讨如何通过LangSmithChatDatasets轻松微调模型。这一过程分为三个简单的步骤：创建聊天数据集。使用LangSmithDatasetChatLoader加载示例。

scaFHIO·2025-03-20 04:49

奥林巴斯道Olympus DAO、奥拉丁模式、诺瓦银行、RWA模型合约解析开发

你可以根据自己的需求微调。

白马区块Crypto100·2025-03-20 01:49

使用LoRA微调LLaMA3

使用LoRA微调LLaMA3的案例案例概述在这个案例中，我们将使用LoRA微调LLaMA3模型，进行一个文本分类任务。我们将使用HuggingFace的Transformers库来完成这个过程。

想胖的壮壮·2025-03-19 16:12

riscv linux 汇编,RISC-V汇编快速入门

另外在极端情况下使用汇编提高效率也是有必要的，例如芯片内核非常新编译器优化不够好可以在非常清楚CPU的微结构下进行指令集编码提高性能。因此学习一种新的体系结构，了解其汇编语言是非常有必要的。实

勤小墨·2025-03-19 16:11

基于MATLAB的遗传算法优化BP神经网络航空发动机寿命预测

具体优化形式包括：初始参数优化：GA仅优化初始参数，后续仍依赖BP反向传播微调。全局参数优化：GA直接优化全部网络参数，无需BP参与。混合优化：GA优化初始参数后，再通过B

默默科研仔·2025-03-19 09:41

华为海思 CPU「麒麟 X90」曝光

自不量力的A同学·2025-03-19 09:09

AVX-512近似计算double浮点数倒数指令

AVX-512指令集提供了对双精度浮点数（double）的高效支持，包括近似计算倒数的操作。你可以使用VRCP14PD指令来近似计算双精度浮点数的倒数。

东北豆子哥·2025-03-19 04:53

五、AIGC大模型_05模型的vLLM部署与LangChain调用

0、概述要搭建一个大模型应用服务，通常需要包含以下五层结构，即：基础环境、模型层、推理层、对外接口、外挂应用在了解了模型的微调训练之后，本文将以vLLM、OpenAI、LangChain为例，介绍大模型的推理部署以及对外接口开放调用

学不会lostfound·2025-03-18 19:20

LLaMA-Factory 微调训练

LLaMA-Factory微调训练该框架功能，标注-微调-导出-合并-部署，一整条流程都有，而且训练时消耗的gpu算力也会小一些一，安装（推荐在linux中训练，win可以用wsl+docker）gitclonehttps

zsh_abc·2025-03-18 14:40

llama-factory微调

大模型微调实操--llama-factoryllama-factory环境安装前置准备英伟达显卡驱动更新地址下载NVIDIA官方驱动|NVIDIAcuda下载安装地址CUDAToolkit12.2Downloads

AI Echoes·2025-03-18 13:05

Excel宏新手入门：开启高效数据处理之旅

一、认识Excel宏：自动化办公的“魔法棒”Excel宏本质上是一组自动执行的操作指令集合，可类比为一个不知疲倦

CodeJourney.·2025-03-18 08:18

core-v-verif系列之cva6 cva6.py (5)

它负责设置、编译和运行RISC-V指令集模拟器（ISS）和RTL模拟器的测试。以下是主要功能及其作用：SeedGen类：生成测试迭代的伪随机种子。

CDerL·2025-03-18 08:16

从零学习大模型（六）-----LoRA（上）

LoRA简介LoRA（Low-RankAdaptation）是一种参数高效的微调技术，旨在降低微调大规模预训练模型的存储和计算成本。

懒惰才能让科技进步·2025-03-18 06:01

部署微调框架LLaMA-Factory

LLaMAFactory1.我们在ChatGLM3的github官方页面上能看到对LLaMA-Factory的推荐2.LLaMAFactorygithub链接hiyouga/LLaMA-Factory:UnifyEfficientFine-Tuningof100+LLMs(github.com)步骤一：安装LLaMAFactory进入DSW开发环境。登录PAI控制台。在页面左上方，选择DSW实例所

高原魔女·2025-03-18 00:40

推荐频道