Caffe训练第15页

DeepSeek V3 模型微调（SFT）技术详解

DeepSeekV3模型微调（SFT）技术详解目录引言背景知识2.1深度学习与预训练模型2.2微调（Fine-tuning）的概念2.3监督微调（SupervisedFine-tuning,SFT）DeepSeekV3

zhangjiaofa·2025-01-30 00:28

【DeepSeek】大模型强化学习训练GRPO算法，你学会了吗？

如果你还不知道GRPO，你可以先看这篇帖子：【DeepSeek】一文详解GRPO算法——为什么能减少大模型训练资源？看了论文跟没看一样？做两道题练练！曾经最痛恨的应试教育，却能让你深深记住这知识点。

FF-Studio·2025-01-29 21:56

缓存失效算法

常见的缓存失效算法有FIFO、LRU、LFU，以及Caffeine中的WindowTinyLFU算法。FIFOFIFO算法是一种比较容易实现也最容易理解的算法。

孜泽·2025-01-29 20:55

智联未来——打造基于机器学习的MySQL智能运维助手，开启协作新时代

今天，我们将深入了解如何训练这样一个基于机器学习的MySQL智能运维助手

墨夶·2025-01-29 19:45

大模型部署工具 llama.cpp 介绍与安装使用

1.大模型部署工具llama.cpp大模型的研究分为训练和推理两个部分。训练的过程，实际上就是在寻找模型参数，使得模型的损失函数最小化，推理结果最优化的过程。

大模型柳儿·2025-01-29 18:03

自建stgcn数据集并训练

1.安装st-gcn复现STGCNCPU版（ubuntu16.04+pytorch0.4.0+openpose+caffe）_Significance的博客-CSDN博客复现旧版STGCNGPU版（win10

青年夏日科技工作者·2025-01-29 18:31

kinetics-skeleton格式行为数据提取方法

用自建kinetics-skeleton行为识别数据集训练st-gcn网络流程记录，利用Lightweight-OpenPose生成kinetics-skeleton格式数据0.准备工作1.下载/裁剪视频

青年夏日科技工作者·2025-01-29 18:31

火出圈的DeepSeeK R1详解

强化学习驱动的训练：采用大规模强化学习技术，仅需极少量标注数据，显著提升推理能力。长链推理（CoT）支持：思维链长度可达数万字，能逐步分解复杂问题，通过多步骤逻辑推理解决问题。

清风AI·2025-01-29 17:58

Transformer--概念、作用、原理、优缺点以及简单的示例代码

与传统的循环神经网络（RNN）和长短时记忆网络（LSTM）不同，Transformer完全摆脱了序列结构的依赖，可以并行处理数据，显著提高了训练效率和效果

Ambition_LAO·2025-01-29 17:23

DeepSeek：通用人工智能的技术前沿与创新突破

其研发方向覆盖自然语言处理、多模态交互、强化学习等领域，并在模型架构、训练效率及实际应用场景中取得显著成果。二、核心

热爱分享的博士僧·2025-01-29 17:52

如何从零开始训练大模型（预训练方向）

但还有一个很直观的情况，随着预训练样本的质量不断提升，训练手段的优化。新的模型，往往效果能轻松反超参数量两倍于它的模型。例如，最新出的minicpm，微信内部评测效果也是非常棒的。

AI小白熊·2025-01-29 16:43

如何用Python训练一个AI模型（超详细教程）非常详细收藏我这一篇就够了！

AI模型是通过训练得到的一种程序，能够利用海

程序员二飞·2025-01-29 15:42

万字精研：大型语言模型微调Fine-Tuning技术——14种主流方法的原理、适用场景及实践指南

万字精研：大型语言模型微调Fine-Tuning技术——14种主流方法的原理、适用场景及实践指南LLM训练时间和的成本太过庞大，况且个人卷训练经验极为困难，不妨从微调开始搞起。

汀、人工智能·2025-01-29 15:40

详解三种常用标准化：Batch Norm、Layer Norm和RMSNorm

在深度学习中，标准化技术是提升模型训练速度、稳定性和性能的重要手段。

yyytucj·2025-01-29 13:57

MATLAB设计控制系统仿真实验,基于MATLAB的自动控制原理实验仿真系统的设计

传统性实验训练了学生对以传递函数为核心的控制系统与模拟电

stellagugu·2025-01-29 13:55

YOLOv8改进策略【Backbone/主干网络】| 替换骨干网络为2023-CVPR ConvNeXt V2 （附网络详解和完整配置步骤）

本文将ConvNeXtV2应用于YOLOv8，一方面利用全卷积掩码自动编码器在训练时优化特征学习，减少模型对大规模标注数据的依赖；另一方面，通过全局响应归一化层增强特征竞争，缓解特征坍塌问题，提高特征多样性

Limiiiing·2025-01-29 13:54

GEE 训练教程——哨兵2号、Landsat-8以及DEM影像的可视化展示

目录简介1.哨兵2号（Sentinel-2）2.Landsat-83.CGIAR/SRTM90_V4函数visualize(bands,gain,bias,min,max,gamma,opacity,palette,forceRgbOutput)Arguments:Returns:Imageexpression(expression,map)Arguments:Returns:Imageee.Te

此星光明·2025-01-29 11:59

利用 PyTorch 动态计算图和自动求导机制实现自适应神经网络

动态添加/移除层：可以在训练过程中根据需

drebander·2025-01-29 11:24

Qwen-VL论文解读

从Qwen-LM开始，我们通过精心设计的（i）视觉受体，（ii）输入-输出接口，（iii）3阶段训练管道，以及（iv）多语言多模态清洗语料库，赋予其视觉能力。

dream_home8407·2025-01-29 09:10

基于Blackwell架构的GPU，用七十二个GPU拼接成性能强大的计算集群，其性能比上一代提升三倍，GPU已成为AI时代的基础设施，可实现各种大模型的训练

英伟达在2024年3月发布了基于Blackwell架构的GPU，这一新一代GPU在性能上相比上一代Hopper架构有显著提升。具体来说，Blackwell架构的GPU拥有2080亿个晶体管，采用台积电4纳米工艺制造，其AI性能达到了20petaflops，是前代H100GPU的五倍。Blackwell架构通过多芯片封装技术（MCM），将两个GPU集成在一起，从而解决了内存局部性和缓存问题，提高了计

百态老人·2025-01-29 08:03

Tensorflow入门——训练结果的保存与加载

2019独角兽企业重金招聘Python工程师标准>>>训练完成以后我们就可以直接使用训练好的模板进行预测了但是每次在预测之前都要进行训练，不是一个常规操作，毕竟有些复杂的模型需要训练好几天甚至更久所以将训练好的模型进行保存

weixin_34087301·2025-01-29 08:32

使用PyTorch实现逻辑回归：从训练到模型保存与加载

PyTorch用于构建和训练模型，pandas和numpy用于数据处理，matplotlib用于结果的可视化。

Luzem0319·2025-01-29 08:26

python3+TensorFlow 2.x（四）反向传播

目录反向传播算法反向传播算法基本步骤：反向中的参数变化总结反向传播算法反向传播算法（Backpropagation）是训练人工神经网络时使用的一个重要算法，它是通过计算梯度并优化神经网络的权重来最小化误差

刀客123·2025-01-29 07:53

scikit-learn基本功能和示例代码

scikit-learn（简称sklearn）是一个广泛使用的Python机器学习库，提供了丰富的工具和算法，涵盖了数据预处理、模型训练、评估和优化等多个方面。

weixin_30777913·2025-01-29 02:02

强化学习很多ac架构的算法比如ppo，为什么使用状态价值网络而不使用动作价值网络实现critic呢?｜状态价值网络的优势与挑战｜Actor-Critic｜状态价值｜强化学习

3.1训练稳定性3.2计算效率3.3高维动作空间的适应性4.使用状态价值网络的挑战4.1收敛速度4.2欠拟合风险5.解决方案与未来方向5.1改进的状态价值网络5.2结合动作价值和状态价值6.结论随着强化学习技术的不断发展

concisedistinct·2025-01-29 01:27

强化学习中，为什么用AC架构

资源存储库·2025-01-29 01:25

AI会不会是一个大泡沫

推出后不久，R1就凭借其开源的性质、大幅下降的售价和训练成本获得了

人机与认知实验室·2025-01-28 23:38

machine learning knn算法之使用KNN对鸢尾花数据集进行分类

通过导入必要的scikit-learn导入必要的库，加载给定的数据，划分测试集和训练集之后训练预测和评估即可具体代码如下：importnumpyasnpfromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitfromsklearn.preprocessingimportStandardS

知识鱼丸·2025-01-28 21:53

LLM架构与优化：从理论到实践的关键技术

重点分析了预训练、后训练、监督微调（SFT）和偏好对齐（PreferenceAlignment）在提升模型性能中的作用，并对比了直接偏好优化（DPO）

XianxinMao·2025-01-28 20:14

YOLOv10涨点改进：特征融合创新 | 多层次特征融合（SDI），小目标涨点明显，| UNet v2，比UNet显存占用更少、参数更少

YOLOv10魔术师专栏》将从以下各个方向进行创新：【原创自研模块】【多组合点优化】【注意力机制】【卷积魔改】【block&多尺度融合结合】【损失&IOU优化】【上下采样优化】【小目标性能提升】【前沿论文分享】【训练实战篇

AI小怪兽·2025-01-28 19:08

YOLO11涨点优化：特征融合创新 | 多层次特征融合（SDI），小目标涨点明显| UNet v2，比UNet显存占用更少、参数更少

YOLOv11魔术师专栏》将从以下各个方向进行创新：【原创自研模块】【多组合点优化】【注意力机制】【卷积魔改】【block&多尺度融合结合】【损失&IOU优化】【上下采样优化】【小目标性能提升】【前沿论文分享】【训练实战篇

AI小怪兽·2025-01-28 19:08

MicroAI™将人工智能培训引入RENESAS MCU

与全球微控制器领导者Renesas合作将机器学习引入MCU，并借助MicroAI直接在嵌入式环境中训练机器学习模型的能力——这在业界尚属

sinat_41698914·2025-01-28 16:16

DeepSeek R1：中国AI黑马的崛起与挑战

文章目录技术突破：从零开始的推理能力进化DeepSeekR1-Zero：纯RL训练的“自我觉醒”DeepSeekR1：冷启动与多阶段训练的平衡之道实验验证：推理能力的全方位跃升基准测试：超越顶尖闭源模型蒸馏技术

码事漫谈·2025-01-28 16:13

C++ 与机器学习：构建高效推理引擎的秘诀

虽然Python被广泛用于模型的训练和开发，但C++却在推理领域独占鳌头，其性能优势和硬件控制能力无可替代。

salsm·2025-01-28 15:07

【Java程序员面试专栏数据结构】五高频面试算法题：二叉树

存在morning·2025-01-28 15:36

第76期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。

云起无垠·2025-01-28 15:05

第84期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。

云起无垠·2025-01-28 14:30

使用onnxruntime-web 运行yolov8-nano推理

端上运行推理模型，为了让这个推理更直观，我选择了试验下yolov8识别预览图片：1.跨平台兼容性ONNX是一种开放的格式，可以在不同的深度学习框架之间共享模型，如PyTorch、TensorFlow、MXNet和Caffe2

CHEN_RUI_2200·2025-01-28 14:27

使用Bert+BiLSTM+CRF训练 NER任务

使用的数据集在这里E-CommercialNERDataset/电商NER数据集_数据集-阿里云天池针对面向电商的命名实体识别研究，我们通过爬取搜集了淘宝商品文本的标题，并标注了4大类，9小类的实体类别。具体类型及实体数量如下针对面向电商的命名实体识别研究，我们通过爬取搜集了淘宝商品文本的标题，并标注了4大类，9小类的实体类别。具体类型及实体数量如下：每个文件数据格式相同，都为根据BIschema

CHEN_RUI_2200·2025-01-28 14:57

Silero VAD 开源项目教程

SileroVAD开源项目教程项目地址:https://gitcode.com/gh_mirrors/si/silero-vad项目介绍SileroVAD是一个预训练的企业级语音活动检测器（VoiceActivityDetector

苏鹃咪Healthy·2025-01-28 14:55

人工智能学习框架：深入解析与实战指南

本指南将全面介绍人工智能主流学习框架的特点、安装方法、核心功能，以及通过实践案例展示如何使用这些框架进行AI模型开发、训练与优化。1.

一ge科研小菜鸡·2025-01-28 11:07

json格式的标记文件转yolo格式（txt）的标记文件

背景我在使用anylabeling标记软件时发现导出的标记文件格式只能是json格式，而我yolov8训练模型的标记文件需要时txt格式的，所以我需要写一个转换脚本脚本1.脚本1这个脚本是针对于矩形框标记的转换

帅气的亮·2025-01-28 10:33

AI人工智能深度学习算法：搭建可拓展的深度学习模型架构

然而，随着模型规模的不断扩大，如何高效地搭建、训练和部署深度学习模型，成为一个亟待解决的问题。传统的单机训练方式在计算资源有限的情况

AI天才研究院·2025-01-28 10:30

高效向量搜索RAG解决方案（Canopy）

一、基本原理1.向量嵌入：Canopy首先会将文本数据转换为向量表示，通常使用预训练的语言模型等技术，将文本映射到

deepdata_cn·2025-01-28 08:18

遥感深度学习过程中图像分割的尺寸对模型训练结果的影响

1.计算资源与显存占用大尺寸图像：需要更高的显存和计算资源，可能限制训练时的批大小（batchsize），甚至导致无法训练。

司南锤·2025-01-28 08:18

使用小尺寸的图像进行逐像素语义分割训练，出现样本不均衡训练效果问题

在使用小尺寸图像进行逐像素语义分割训练时，确实可能出现样本不均衡问题，且这种问题可能比大尺寸图像更显著。1.小尺寸图像如何加剧样本不均衡？