分层训练第7页

SFT与RLHF的关系

在大模型训练中，SFT（监督微调）和RLHF（基于人类反馈的强化学习）是相互关联但目标不同的两个阶段，通常需要结合使用以优化模型性能，而非互相替代。

一只积极向上的小咸鱼·2025-03-04 11:12

AI大模型与区块链技术的结合

模型可信度：区块链记录模型的训练和使用过程，确保模型的透明性和

小赖同学啊·2025-03-04 10:31

蚂蚁技术研究院发布推理大模型强化学习框架，邀请开发者共同助力 AGI 生态

AReaL源自开源项目ReaLHF，旨在训练每个人都可以复现和贡献的大型推理模型(LRM)。AReaL是蚂蚁技术研究院为开发一个完全开放和包容的AGI世界迈出的一步。

·2025-03-04 10:52

Android组件化、模块化、插件化

基础组件"，意思是把代码重复的部分提炼出一个个组件供给功能使用使用：Dialog，各种自定义的UI控件、能在项目或者不同项目重复应用的代码等等目的：复用，解耦依赖：组件之间低依赖，比较独立架构定位：纵向分层

写完就会了·2025-03-04 10:28

大模型开发和微调工具Llama-Factory--＞WebUI

#避免从HuggingFace下载模型导致网速不畅USE_MODELSCOPE_HUB=1llamafactory-cliwebui1.训练在模型开始训练之

m0_74823705·2025-03-04 05:56

神经网络之CNN文本识别

但是在文本分类问题上，相比于RNN，CNN的构建和训练更为简单和快速，并且效果也不差，所以仍然会有一些研究。那么，CNN到底是怎么应用到NLP上的

邪恶的贝利亚·2025-03-04 05:56

【Address Overfitting】解决过拟合的三种方法

：2.特征选择方法介绍：实践示例：适用场景：优缺点：3.正则化（Regularization）正则化类型：实践示例：适用场景：优缺点：总结与对比总结在机器学习中，过拟合（Overfitting）是模型训练过程中常见的问题

HP-Succinum·2025-03-04 05:24

Word2Vec的使用，一些思考，含示例——包括使用预训练Word2Vec模型和自训练Word2Vec模型

你可以直接通过它训练生成词向量，也就是一个新的Word2Vec，也可以使用预训练好的词向量，也就是那里直接用。

热爱生活的猴子·2025-03-04 03:13

面试基础---Spring Cloud微服务负载均衡架构

SpringCloudLoadBalancer）一、微服务负载均衡核心架构图选择目标实例选择目标实例选择目标实例服务消费者负载均衡器服务实例1服务实例2服务实例3处理请求二、Ribbon核心实现原理2.1Ribbon架构分层

WeiLai1112·2025-03-04 03:40

AI大模型教程入门到精通，非常详细收藏我这一篇就够了！AI大模型零基础入门教程（适合小白）

AI大模型是指使用大规模数据和强大的计算能力训练出来的人工智能模型。这些模型通常具有高度的准确性和泛化能力，可以应用于各种领域，如自然语言处理、图像识别、语音识别等。为什么要学AI大模型？

AGI大模型学习·2025-03-04 01:21

计算机网络——TCP / IP 网络模型

OSI七层模型七层模型是国际标准化的一个网络分层模型，大体结构可以分成七层。每层提供不同的功能。图片来源JavaGuide但是这样七层结构比较复杂，不太实用，所以有了TCP/IP模型。

确定吗阿斌·2025-03-03 23:11

大模型算法工程师的技术图谱和学习路径

负责整个模型开发生命周期，包括数据清洗、特征工程、模型选择、训练和部署。与数据科学家、工程团队和产品团队合作，理解业务需求并将算法转化为实际产品。对模型性能进行评估和优化，确保模型的准确性、效率和可扩

执于代码·2025-03-03 23:39

数据挖掘的建模流程

定义数据挖掘目标任务理解指标确定2、数据取样建模抽样(大数据是用过滤后的全量数据)抽样之前需要衡量数据质量衡量的标准主要有以下几点：资料完整无缺，各类指标齐全数据准确无误，反映的都是正常状态下的数据数据抽样的方式：随机抽样等距抽样分层抽样从起始位置开始抽样分类抽样实时采集

慢跑的Liam·2025-03-03 23:08

AI提示词终极奥秘：三招破解Zero-Shot/Few-Shot/COT魔法

二、三分钟掌握三大核心技术1.Zero-Shot：空手道大师的思维（无需任何示例）核心原理：利用模型预训练知识直接推

曦紫沐·2025-03-03 22:05

DeepSeek-R1：通过强化学习激励大型语言模型的推理能力

DeepSeek-R1-Zero是一个通过大规模强化学习（RL）训练而成的模型，无需监督微调（SFT）作为初步步骤，展示了卓越的推理能力。

AI专题精讲·2025-03-03 22:05

深度学习pytorch之4种归一化方法（Normalization）原理公式解析和参数使用

pytorch之19种优化算法（optimizer）解析深度学习pytorch之4种归一化方法（Normalization）原理公式解析和参数使用摘要归一化（Normalization）是提升模型性能、加速训练的重要技巧

@Mr_LiuYang·2025-03-03 21:55

Pta考试真题训练—1125（字符串之最小子串）

子串是一个字符串中连续的一部分，而子列是字符串中保持字符顺序的一个子集，可以连续也可以不连续。例如给定字符串atpaaabpabtt，pabt是一个子串，而pat就是一个子列。现给定一个字符串S和一个子列P，本题就请你找到S中包含P的最短子串。若解不唯一，则输出起点最靠左边的解。输入格式：输入在第一行中给出字符串S，第二行给出P。S非空，由不超过104个小写英文字母组成；P保证是S的一个非空子列。

Arbritry·2025-03-03 21:55

PyTorch Lightning 的简单使用示例

1.环境准备与依赖导入首先，代码需要导入了实现模型、数据处理和训练所需的各个包：importtorchfromtorchimportnnfromtorch.utils.dataimportDataLoader

idealmu·2025-03-03 21:54

Android中perform和handle方法的区别——以handleLaunchActivity与performLaunchActivity为例

这种命名约定反映了框架设计中的分层思想，帮助开发者区分任务的调度与实现。

猿界新星蔡·2025-03-03 21:52

基于DeepSeek 的图生文最新算法 VLM-R1

具体来说，对于引用表达式理解（REC）的任务，我们使用R1和SFT方法训练了Qwen2.5-VL。结果表明，在域内测试数据

AI算法网奇·2025-03-03 18:02

清华「DeepSeek从入门到精通」正式发布！104页超全解析使用教程

还有些用的是chatGPT的训练方式，要知道，DeepSeek和chatGPT是两种模型，一个是推理型，一个是指令型，这是驴唇不对马嘴啊。

职场程序猿·2025-03-03 18:28

【计算机网络】OSI模型、TCP/IP模型、路由器、集线器、交换机

一、计算机网络分层结构计算机网络分层结构指将计算机网络的功能划分为多个层次，每个层次都有其特定的功能和协议，并且层次之间通过接口进行通信。

茉菇·2025-03-03 18:58

C++数组综合训练：插入删除/进制转换/排序算法

第一部分：数组基础操作强化1.1数组元素插入（动态位移版）//示例：在指定位置插入元素inta[11],i,n,x,y;cin>>n;//当前元素数量for(i=0;i>a[i];cin>>x>>y;//输入插入位置（从1开始计数）和元素值x--;//转换为数组下标//关键算法：从后向前移动元素（时间复杂度O(n)）for(i=n;i>=x;i--){a[i+1]=a[i];//元素后移}a[x]

卫青~护驾！·2025-03-03 18:57

Llama 3.2入门基础教程（非常详细），Llama 3.2微调、部署以及多模态训练入门到精通，收藏这一篇就够了！

然后在训练上变化比较大，参数变大了，400B的还没放出来

中年猿人·2025-03-03 17:49

GPT-4.5

OpenAI团队表示，GPT-4.5是他们迄今为止最大、最强的模型，在预训练和后训练方面实现了重大突破。

开发者每周简报·2025-03-03 15:38

数学建模：MATLAB极限学习机解决回归问题

一、简述极限学习机是一种用于训练单隐层前馈神经网络的算法，由输入层、隐藏层、输出层组成。基本原理：输入层接受传入的样本数据。

DesolateGIS·2025-03-03 15:05

自动驾驶系统工程师的技术图谱与学习路径

以下是一个详细的自动驾驶系统工程师技术图谱与学习路径，按照“技能树与能力模型”展示，从基础到进阶，分层次列出了所需的核心技能和学习路线。一、基础能力层（数学、编程

执于代码·2025-03-03 15:34

DeepSeek-R1 技术报告解读：用强化学习激发大模型的推理潜能

文章目录1.背景2.DeepSeek-R1训练流程2.1DeepSeek-R1-Zero：纯强化学习2.2DeepSeek-R1：冷启动+多阶段训练3.蒸馏小模型3.1蒸馏流程与优势3.2蒸馏vs.直接

跑起来总会有风·2025-03-03 14:04

神经进化算法(Neuroevolution) 原理与代码实例讲解

然而，传统的神经网络训练方法通常依赖于人工设计的网络结构和参数初始化，这往往需要大量的经验和试错，并且难以找到最优的网络结构和参数。神经进化算法(Neuroevolutio

AI大模型应用之禅·2025-03-03 13:25

【硬核教程】DeepSeek 70B模型微调实战：打造工业级AI开发专家（附完整代码+案例）

——基于LoRA+GRPO算法，显存直降10倍，手把手教你训练行业大模型为什么这篇内容值得收藏？

爱吃青菜的大力水手·2025-03-03 11:06

分布式多卡训练(DDP)踩坑

多卡训练最近在跑yolov10版本的RT-DETR，用来进行目标检测。

m0_54804970·2025-03-03 11:05

YOLO 中 SPFF 模块的优化与 Focal Modulation 替代研究

文章目录1.YOLO中的SPPF模块分析2.FocalModulation简介3.在YOLO中用FocalModulation替换SPPF4.实验与对比分析4.1代码替换YOLO模型中的SPPF4.2训练对比

向哆哆·2025-03-03 10:57

【WOA-CNN-LSTM】基于鲸鱼算法优化深度学习预测模型的超参数研究（Matlab代码实现）

首先，我们介绍了LSTM模型的结构和训练过程。然后，我们

然哥爱编程·2025-03-03 10:25

基于大模型的脂肪栓塞综合征风险预测与综合治疗方案研究报告

研究目的与方法二、脂肪栓塞综合征概述2.1定义与发病机制2.2病因与危险因素2.3临床表现与分类2.4诊断标准与方法三、大模型在脂肪栓塞综合征预测中的应用3.1大模型简介3.2数据收集与预处理3.3模型训练与验证

LCG元·2025-03-03 09:50

代码随想录算法训练day65---图论系列9《dijkstra(堆优化版)&Bellman_ford 算法》

代码随想录算法训练—day64文章目录代码随想录算法训练前言一、47.参加科学大会-----dijkstra(堆优化版)二、94.城市间货物运输I---Bellman_ford算法总结前言今天是算法营的第

Ritsu栗子·2025-03-03 08:45

DeepSeek-R1：重新定义推理性能的开源人工智能

目录重新定义卓越的基准变革性应用案例技术创新后训练优化冷启动数据以提高可用性可扩展性蒸馏模型API集成：为开发者而生竞争定价：可及的高级人工智能开源优势DeepSeek代表的引用推动开放人工智能的边界推动边界意味着什么

知识小报童·2025-03-03 08:11

DeepSeek 开源周五个开源项目，引领 AI 创新？

这些项目涵盖了AI基础设施、模型训练和数据处理的各个方面，旨在通过透明和社区驱动的创新推动AI发展。这也解释了为什么DeepSeek可以用低成本训练出高质量的模型。

LaughingZhu·2025-03-03 08:09

《AI大模型开发笔记》DeepSeek技术创新点

Richard Chijq·2025-03-03 03:57

STM32实战开发（172）：智能体育训练记录系统

引言随着人们对健康和运动的关注，体育训练记录系统变得越来越重要。智能体育训练记录系统能够帮助运动员记录、分析并优化他们的训练数据。

嵌入式开发项目·2025-03-03 02:53

STM32实战开发（179）：智能体育训练计划反馈系统

引言随着现代科技的不断发展，运动科学领域也在不断取得突破，尤其是在体育训练中，科技的应用越来越普及。从专业运动员到普通健身爱好者，都开始使用智能设备来优化训练计划，提高训练效率。

嵌入式开发项目·2025-03-03 02:53

【AI大模型】Transformers大模型库（九）：大模型微调之计算微调参数占比

、计算微调参数占比2.1概述2.2模型参数结构一览2.3微调参数占比计算三、总结一、引言这里的Transformers指的是huggingface开发的大模型库，为huggingface上数以万计的预训练大模型提供预测

LDG_AGI·2025-03-03 01:45

PyTorch数据加载：实战入门

"好的数据加载是成功训练的第一步"一、为什么要用DataLoader？当我们刚开始学习深度学习时，常常会这样处理数据：#传统方式加载数据images=[...]#所有图片数据labels=[...]

秋‍.·2025-03-03 01:43

大模型国产化迁移大模型到昇腾教程（Pytorch版）

已有国产AI芯片和Mindformers框架，基于昇腾910训练大模型，使用MindIE实现大模型服务化。本文介绍如何迅速将大型模型迁移到昇腾910B,许多入门者都是从斯坦福羊驼开始的。

科技互联人生·2025-03-03 01:42

大模型微调入门（Transformers + Pytorch）

输出：我们预训练的名字。训练为了性能好下载小参数模型，普通机器都能运行。

昵称不能为null·2025-03-03 00:06

计算机视觉实战：YOLOv8在工业质检中的应用（附完整代码+数据集）

从数据标注到模型部署，包含环境配置、数据增强、模型训练全流程详解，手把手教你打造高精度智能质检系统！

emmm形成中·2025-03-03 00:03

CATIA二次开发实战：基于Python的智能背景颜色控制工具开发

一、工具设计架构本工具采用MVC分层设计模式，通过三大模块实现核心功能

Python×CATIA工业智造·2025-03-02 23:27

如何学习训练大模型——100条建议（附详细说明）_如何训练自己的大模型_大模型如何训练

摘要：通过深入了解本文中的这些细节，并在实际项目中应用相关知识，将能够更好地理解和利用大模型的潜力，不仅在学术研究中，也在工程实践中。通过不断探索新方法、参与项目和保持热情，并将其应用于各种领域，从自然语言处理到计算机视觉和自动驾驶。通过不断学习、实践和探索，可以不断提升自己在深度学习领域的技能和洞察力，同时也能为社会和行业带来创新和改进。从小规模的项目和模型开始，逐渐迭代和扩展到更大的模型，逐步

大耳朵爱学习·2025-03-02 21:18

前端数据缓存的几种方式详细讲解

以下是前端数据缓存的完整解决方案，涵盖策略设计、技术实现和性能优化：一、缓存策略分层设计缓存策略内存缓存持久化缓存Map/WeakMap闭包变量LocalStorageSessionStorageIndexedDBServiceWorker

爱分享的程序员·2025-03-02 21:14

以太网的分层架构_以太网上TCP/IP协议的分层结构及其报文格式

weixin_39589557·2025-03-02 21:44

Transformer架构深度研究报告（二、分层原理）

一、Transformer不同层作用剖析1.1低层作用在Transformer架构中，低层（1-3层）主要承担着局部语法建模的关键任务，其对语言基础结构的理解和处理为后续高层语义分析奠定了坚实基础。在词性标注（POStagging）任务中，低层通过对相邻词之间关系的细致捕捉，能够精准判断每个词的词性。例如在句子“Thedogrunsfast”中，对于“runs”这个词，低层模型会关注其与相邻词“d

jiaojieran·2025-03-02 20:36

推荐频道

分层训练