detectron训练第3页

训练模型时，步长为什么不能太大也不能太小？

在训练模型时，步长（也称为学习率，LearningRate）是一个关键的超参数，它控制着每次参数更新的大小。

yuanpan·2025-03-15 16:52

六十天前端强化训练之第十七天React Hooks 入门：useState 深度解析

=====欢迎来到编程星辰海的博客讲解======看完可以给一个免费的三连吗，谢谢大佬！目录一、知识讲解1.Hooks是什么？2.useState的作用3.基本语法解析4.工作原理5.参数详解a)初始值设置方式b)更新函数特性6.注意事项7.类组件对比8.常见问题解答二、核心代码示例三、实现效果四、学习要点总结五、扩展阅读推荐官方文档优质文章推荐学习路径进阶资源六、实践步骤一、表单输入控制二、动态

编程星辰海·2025-03-15 16:50

机器学习中的梯度到底是什么？（chat-gpt问答）

在机器学习中，我们通过不断调整参数，使目标函数达到最小值，从而实现模型的训练和学习。2、为什么梯度要求偏导来求解？梯度是一个向量，它的方向指向函数值增加最快的方向，其大小表示函数值的变化率。

湫怿·2025-03-15 16:19

大型语言模型与强化学习的融合：迈向通用人工智能的新范式——基于基础复现的实验平台构建

强化学习（RL）作为一种通过与环境交互学习最优策略的方法，在智能体训练中发挥着重要作用。本文旨在探索LLM与RL的深度融合，分析LLM如何赋能RL，并阐述这种融合对于迈向通用人工智能（AGI）的意义。

（initial）·2025-03-15 16:17

深度学习-服务器训练SparseDrive过程记录

1、cuda安装1.1卸载安装失败的cuda参考：https://blog.csdn.net/weixin_40826634/article/details/127493809注意：因为/usr/local/cuda-xx.x/bin/下没有卸载脚本，很可能是apt安装的，所以通过执行下面的命令删除：apt-get--purgeremove"cuda*"apt-getautoremove然后执行f

weixin_40826634·2025-03-15 15:41

使用 Ollama 对 LLaMA-2 模型进行微调的详细指南

如果条件允许，使用多卡GPU（如RTX4090或A100）可以显著加快训练速度。对于更大的模型（如LLaMA-213B或33B），

软件职业规划·2025-03-15 15:08

机器学习-----决策树

概念2.决策树的构建过程2.1特征选择2.2树的生成2.3树的剪枝3.决策树的优缺点4.决策树的应用4.1分类任务4.2回归任务4.3集成学习代码示例总结1、概念1.1决策树是什么决策树是通过对样本的训练

多巴胺与内啡肽.·2025-03-15 15:37

算法训练-拓扑排序2

洛谷P1807最长路https://www.luogu.com.cn/problem/P1807本题数据范围过大盲目使用dfs容易超时爆栈题目要求中提到i#defineintlonglong#defineendl'\n'/*===\\================//\\===================//\\============//\\==========//=========\\=

往往歌咏理想·2025-03-15 14:33

代码随想录算法训练营DAY05之栈和队列

题目和链接232.用栈实现队列225.用队列实现栈20.有效的括号1047.删除字符串中的所有相邻重复项150.逆波兰表达式求值239.滑动窗口最大值347.前k个高频元素232.用栈实现队列题意：请你仅使用两个栈实现先入先出队列。队列应当支持一般队列支持的所有操作（push、pop、peek、empty）：实现MyQueue类：voidpush(intx)将元素x推到队列的末尾intpop()从

失序空间·2025-03-15 14:33

HuggingFace下载模型并导入Ollama指南

众所周知，HuggingFace仓库托管了诸多训练模型。DeepSeek官方也将完整满血版DeepSeek-R1:671B模型镜像托管在此仓库，但是目前国内无法直接从HugingFace下载。

Repetion_Maxumim·2025-03-15 14:00

增量预训练和微调的区别

文章目录前言一、增量预训练和微调的区别二、代码示例1.增量预训练示例2.微调示例3.代码的区别三、数据格式1.增量预训练2.微调3.示例4.小结四、数据量要求1.指导原则2.示例3.实际操作中的考虑4.

做个天秤座的程序猿·2025-03-15 13:54

【Transformer-Hugging Face手册 07/10】微调预训练模型

微调预训练模型-目录一、说明二、在本机PyTorch中微调预训练模型。

无水先生·2025-03-15 13:54

《探秘人工智能与鸿蒙系统集成开发的硬件基石》

对于模型训练任务，尤其是深度学习模型，其复杂的

程序猿阿伟·2025-03-15 12:43

数据标注工具及其对预训练模型性能的影响

1.背景介绍1.1预训练模型的崛起近年来，预训练模型（Pre-trainedModels）在自然语言处理（NLP）领域取得了显著的成功。

AGI大模型与大数据研究院·2025-03-15 10:00

数据标注质量对AI模型质量的影响分析

没有高质量的标注数据，就如同建造高楼大厦没有坚实的地基，AI模型就无法有效地学习和训练，最终的AI质量也就无从谈起。训练数据是AI模型

自由鬼·2025-03-15 10:30

基于纯视觉的 GUI 代理的屏幕解析工具（OmniParser）

一、技术原理1.数据集构建：从流行网页和应用中提取数据，构建可交互图标检测数据集和图标描述数据集，为模型训练提供基础。

deepdata_cn·2025-03-15 09:51

Anthropic 的模型

Anthropic的模型（特别是Claude系列）之所以在性能和推理能力上表现强劲，可以从技术设计、研究理念、训练方法以及应用优化等多个方面进行详细分析。

调皮的芋头·2025-03-15 06:50

RV1126笔记三十七：PaddleOCR检测模型训练

PaddleOCR检测模型训练及验证测试1、准备数据集在PaddleOCR目录下新建文件夹：train_data,这个文件夹用于存放数据集的。

殷忆枫·2025-03-15 05:16

大语言模型微调和大语言模型应用的区别？

1.基本概念微调（Fine-tuning）定义：微调是指在预训练大语言模型的基础上，通过在特定领域或任务的数据上进一步训练，从而使模型在该特定任务上表现更优。

AI Echoes·2025-03-15 05:38

大语言模型（LLMs）全面学习指南（非常详细）零基础入门到精通，收藏这一篇就够了

如下这份指南将涵盖LLMs的基础知识、训练过程、用例和未来趋势……一.WhatareLargeLanguage

网络安全大白·2025-03-15 04:38

DeepSeek创始人专访：中国的AI不可能永远跟随，需要有人站到技术的前沿

训练成本估计只有Llama3.1405B模型的11分之一，后者的效果还不如它。

AIBigModel·2025-03-15 04:06

十分钟学会微调大语言模型

在之前的文章中，我分享了一些使用大语言模型开发应用的方法，也介绍了几个开源大语言模型的部署方式，有同学给我留言说想知道怎么训练自己的大语言模型，让它更贴合自己的业务场景。

喝不喝奶茶丫·2025-03-15 04:35

大语言模型微调和大语言模型应用的区别？

1.定义与目标微调（Fine-tuning）目标：调整预训练模型（如GPT、LLaMA、PaLM）的参数，使其适应特定任务或领域。

AI Echoes·2025-03-15 04:34

神经网络完成训练的详细过程

神经网络完成训练的详细过程一、神经网络的基本概念神经网络是一种模拟人脑神经系统的计算模型，由大量的神经元（节点）和它们之间的连接（权重）组成。

每天五分钟玩转人工智能·2025-03-15 04:34

pytorch实现cifar10多分类总结

它包含了10个不同类别，每个类别有6000张图像，其中5000张用于训练，1000张用于测试。这10个类别分别为：飞机、汽车、鸟类、猫、鹿、狗、青蛙、马、船和卡车。

L_pyu·2025-03-15 00:31

多分类—微调DistilBERT对生物医学文本进行实验方法多分类：Automated Text Mining of Experimental Methodologies from Biomedical

AutomatedTextMiningofExperimentalMethodologiesfromBiomedicalLiterature从生物医学文献中自动挖掘实验方法文本paper：https://arxiv.org/abs/2404.13779github：本文做的就是微调DistilBERT去做多分类任务，训练自己的数据集

小小帅AIGC·2025-03-14 23:56

数据挖掘技术介绍

功能：根据已标记的训练数据，学习一个模型，用于预测新数据的类别。方法：决策树、支持向量机、神经网络、逻辑回归、

柒柒钏·2025-03-14 23:25

图神经网络学习笔记—高级小批量处理（专题十四）

小批量（mini-batch）的创建对于让深度学习模型的训练扩展到海量数据至关重要。与逐条处理样本不同，小批量将一组样本组合成一个统一的表示形式，从而可以高效地并行处理。

AI专题精讲·2025-03-14 23:52

医学文本分析中的命名实体识别：从理论到实践

1.数据预处理数据预处理是医学命名实体识别系统的基础步骤，其质量直接影响模型的训练效果和最终性能。数据预处理主要包括医学文本的标注、清洗以及数据增强三个方面。

软件职业规划·2025-03-14 23:51

Deepseek:物理神经网络PINN入门教程

一、物理信息网络（PINN）的概念与原理1.定义与来源物理信息网络（Physics-InformedNeuralNetworks,PINN）是一种将物理定律（如偏微分方程、守恒定律等）嵌入神经网络训练过程的深度学习方法

天一生水water·2025-03-14 23:50

基于Transformer的医学文本分类：从BERT到BioBERT

Transformer模型，尤其是BERT及其变体，通过预训练和微调的方式，能够有效捕捉医学文本中的语义信息，为医学文本分类提供了强大的工具。本文将探讨Transfor

Evaporator Core·2025-03-14 23:17

H100解锁生成式AI算力新纪元

其创新性设计聚焦三大技术支柱：第三代TensorCore通过稀疏计算与混合精度支持，显著提升矩阵运算效率；显存带宽优化技术结合HBM3高带宽内存，将数据吞吐量提升至3.35TB/s，有效缓解大规模模型训练中的显存墙问题

智能计算研究中心·2025-03-14 22:43

Batch Normalization理解

来说输入的就是满足某一分布的特征矩阵，但对于Conv2而言输入的featuremap就不一定满足某一分布规律了（注意这里所说满足某一分布规律并不是指某一个featuremap的数据要满足分布规律，理论上是指整个训练

zhimengxiang·2025-03-14 22:13

深度学习项目--基于DenseNet网络的“乳腺癌图像识别”，准确率90%+，pytorch复现

本文为365天深度学习训练营中的学习记录博客原作者：K同学啊前言如果说最经典的神经网络，ResNet肯定是一个，从ResNet发布后，很多人做了修改，denseNet网络无疑是最成功的一个，它采用密集型连接

羊小猪~~·2025-03-14 22:08

从零到一：Transformer模型的原理与实战之旅

1.2自注意力机制的核心1.3Transformer的结构2.实战：构建Transformer模型2.1任务目标2.2环境准备2.3数据准备2.4模型构建2.5模型训练3.推理实战：完整示例与输出结果3.1

樽酒ﻬق·2025-03-14 21:06

PyTorch 深度学习实战（13）：Proximal Policy Optimization (PPO) 算法

一、PPO算法基础PPO是OpenAI提出的一种强化学习算法，旨在解决策略梯度方法中的训练不稳定问题。PPO通过

进取星辰·2025-03-14 19:47

笔记:代码随想录算法训练营day39:LeetCode 198.打家劫舍,213.打家劫舍II,337.打家劫舍III

学习资料:代码随想录198.打家劫舍力扣题目链接思路：有点像贪心，是一个不断比较取最大路径的思路定义：偷到下标为i的这家，能偷到的最大值递推公式：选当前这家偷能得到的钱和不偷当前这家的钱作比较，选能偷到的最大金额。因为这个金额是逐一递推过来的，所以是能够代表最大值的。初始化：把第一家和第二家初始化，简单来说，因为递推公式需要i-1和i-2遍历顺序：顺着偷打印：//五部曲//定义:dp[i]为偷到第

jingjingjing1111·2025-03-14 18:07

【大模型LLM面试合集】分布式训练_总结

数据并行不仅仅指对训练的数据并行操作，还可以对网络模型梯度、权重参数、优化器状态等数据进行并行。

X.AI666·2025-03-14 17:28

2025年渗透测试面试题总结-阿里巴巴-阿里云安全（二面）（题目+回答）

目录阿里巴巴-阿里云安全二面一、职业方向与技术偏好1.安全研究vs安全研发的定位二、云安全与身份认证2.云上PKI与身份认证的关注方向三、项目实践与成果3.字节跳动训练营项目四、攻防技术深度解析4.SQL

独行soc·2025-03-14 17:25

KNN算法实例_手写识别系统

数据集我们将使用MNIST数据集，它包含60000个训练样本和10000个测试样本。每个样本是一个28x28像素的灰度图像，表示0-9之间的手写数字。

V文宝·2025-03-14 16:47

大模型高效优化技术全景解析：微调、量化、剪枝、梯度裁剪与蒸馏

Quantization）剪枝（Pruning）梯度裁剪（GradientClipping）知识蒸馏（KnowledgeDistillation）技术对比与协同策略总结与趋势1.微调（Fine-tuning）核心思想在预训练模型

时光旅人01号·2025-03-14 15:40

推理大模型：技术解析与未来趋势全景

ReasoningLLMs）是专门针对复杂多步推理任务优化的大型语言模型，具备以下核心特性：输出形式创新展示完整逻辑链条（如公式推导、多阶段分析）任务类型聚焦擅长数学证明、编程挑战、多模态谜题等深度逻辑任务训练方法升级融合强化学习

时光旅人01号·2025-03-14 15:10

LibreTranslate的本地部署与应用服务开发

最近在关注大模型预训练文章和应用服务开发，有时候需要借助翻译工具，使用起来都不太方便，就找了一下类似的常见语言的翻译方案，无意中看到一个开源翻译方案（即LibreTranslate），对于通用和计算机类内容的翻译效果还是不错的

一望无际的大草原·2025-03-14 15:08

【AI论文】TPDiff：时序金字塔视频扩散模型

基于这一洞见，我们提出了TPDiff，一个统一的框架，用于提高训练和推理效率。通过将扩散过程分为几个阶段，我们的框架在扩散过程中逐步增加帧率，仅在最后阶段采用全帧率，从而优化计算效率。

东临碣石82·2025-03-14 14:31

DeepSeek 面试题精选

以下是针对DeepSeek面试的精选问题及解答，涵盖技术原理、模型架构、训练方法和应用场景等方面，供面试准备参考：一、DeepSeek模型架构与技术原理1.请简述DeepSeek-V3模型的总体架构和主要创新点

CarlowZJ·2025-03-14 14:00

30.代码随想录算法训练营第三十天|452. 用最少数量的箭引爆气球,435. 无重叠区间,763. 划分字母区间

30.代码随想录算法训练营第三十天|452.用最少数量的箭引爆气球,435.无重叠区间,763.划分字母区间452.用最少数量的箭引爆气球-力扣（LeetCode）有一些球形气球贴在一堵用XY平面表示的墙面上

白鹭鸣鸣！·2025-03-14 14:00

从LayerNorm到RMSNorm：深度学习归一化技术的进化！qwen2.5的技术。

（RootMeanSquare,RMS）来进行归一化，避免了传统归一化方法中均值和方差的计算1.LayerNorm（层归一化）LayerNorm（层归一化）是一种用于深度学习的归一化技术，主要用于稳定训练过程

KangkangLoveNLP·2025-03-14 13:29

十种处理权重矩阵的方法及数学公式

1.权重归一化（WeightNormalization）目的：通过分离权重向量的范数和方向来加速训练。

阳光明媚大男孩·2025-03-14 13:26

【Agent实战】发票信息识别提取专家（AI +OCR技术结合ChatGPT4o能力+结构化prompt（CoT、One-shot等）+Knowledge - RAG+API工具Agent项目实践）

本文原创作者：姚瑞南AI-agent大模型运营专家，先后任职于美团、猎聘等中大厂AI训练专家和智能运营专家岗；多年人工智能行业智能产品运营及大模型落地经验，拥有AI外呼方向国家专利与PMP项目管理证书。

姚瑞南·2025-03-14 13:55

【漫话机器学习系列】137.随机搜索（Randomized Search）

随机搜索（RandomizedSearch）详解在机器学习和深度学习的模型训练过程中，超参数调优（HyperparameterTuning）是至关重要的一环。

IT古董·2025-03-14 12:50

推荐频道

detectron训练

训练模型时，步长为什么不能太大也不能太小？

六十天前端强化训练之第十七天React Hooks 入门：useState 深度解析

机器学习中的梯度到底是什么？（chat-gpt问答）

大型语言模型与强化学习的融合：迈向通用人工智能的新范式——基于基础复现的实验平台构建

深度学习-服务器训练SparseDrive过程记录

使用 Ollama 对 LLaMA-2 模型进行微调的详细指南

机器学习-----决策树

算法训练-拓扑排序2

代码随想录算法训练营DAY05之栈和队列

HuggingFace下载模型并导入Ollama指南

增量预训练和微调的区别

【Transformer-Hugging Face手册 07/10】 微调预训练模型

《探秘人工智能与鸿蒙系统集成开发的硬件基石》

数据标注工具及其对预训练模型性能的影响

数据标注质量对AI模型质量的影响分析

基于纯视觉的 GUI 代理的屏幕解析工具（OmniParser）

Anthropic 的模型

RV1126笔记三十七：PaddleOCR检测模型训练

大语言模型微调和大语言模型应用的区别？

大语言模型（LLMs）全面学习指南（非常详细）零基础入门到精通，收藏这一篇就够了

DeepSeek创始人专访：中国的AI不可能永远跟随，需要有人站到技术的前沿

十分钟学会微调大语言模型

大语言模型微调和大语言模型应用的区别？

神经网络完成训练的详细过程

pytorch实现cifar10多分类总结

多分类—微调DistilBERT对生物医学文本进行实验方法多分类：Automated Text Mining of Experimental Methodologies from Biomedical

数据挖掘技术介绍

图神经网络学习笔记—高级小批量处理（专题十四）

医学文本分析中的命名实体识别：从理论到实践

Deepseek:物理神经网络PINN入门教程

基于Transformer的医学文本分类：从BERT到BioBERT

H100解锁生成式AI算力新纪元

Batch Normalization理解

深度学习项目--基于DenseNet网络的“乳腺癌图像识别”，准确率90%+，pytorch复现

从零到一：Transformer模型的原理与实战之旅

PyTorch 深度学习实战（13）：Proximal Policy Optimization (PPO) 算法

笔记:代码随想录算法训练营day39:LeetCode 198.打家劫舍,213.打家劫舍II,337.打家劫舍III

【大模型LLM面试合集】分布式训练_总结

2025年渗透测试面试题总结-阿里巴巴-阿里云安全（二面）（题目+回答）

KNN算法实例_手写识别系统

大模型高效优化技术全景解析：微调、量化、剪枝、梯度裁剪与蒸馏

推理大模型：技术解析与未来趋势全景

LibreTranslate的本地部署与应用服务开发

【AI论文】TPDiff：时序金字塔视频扩散模型

DeepSeek 面试题精选

30.代码随想录算法训练营第三十天|452. 用最少数量的箭引爆气球,435. 无重叠区间,763. 划分字母区间

从LayerNorm到RMSNorm：深度学习归一化技术的进化！qwen2.5的技术。

十种处理权重矩阵的方法及数学公式

【Agent实战】发票信息识别提取专家（AI +OCR技术结合ChatGPT4o能力+结构化prompt（CoT、One-shot等）+Knowledge - RAG+API工具Agent项目实践）

【漫话机器学习系列】137.随机搜索（Randomized Search）

【Transformer-Hugging Face手册 07/10】微调预训练模型