天梯赛训练第7页

DeepSeek R1技术报告关键解析(5/10)：知识蒸馏：如何让小模型也能具备强推理能力？

在DeepSeek-R1训练过程中，研究人员通过知识蒸馏，让较小的模型也能具备较强的

董董灿是个攻城狮·2025-02-05 19:43

学霸带你游戏化增强学习动力奖励与挑战助力成长

无论是语言、编程还是技能训练，游戏化都能提供全新的解决方案。游戏化吸引学习者注意力游戏的奖励机制、即时反馈和目标导向能迅速抓住学习者的注意力。

Snow Hide（雪诺海德）·2025-02-05 18:10

目标检测数据集-Pascal VOC 数据集介绍

在该挑战中，这是一个监督学习的问题，训练集以带标签的图片的形式给出。介绍PascalVOC数据集：C

AI研习图书馆·2025-02-05 17:01

人工智能基础知识速成 - 机器学习、深度学习算法原理及其实际应用案例

机器学习的基本原理机器学习的基本原理是通过构建数学模型，使用大量的数据进行训练，使得模型能够智能地预测和决策。在机器学习中，常用的模型包括线性回归、逻辑回

苹果酱0567·2025-02-05 16:23

基于昇腾用PyTorch实现传统CTR模型WideDeep网络

基于昇腾用PyTorch实现传统CTR模型WideDeep网络本文主要介绍如何在昇腾上使用pytorch对推荐系统中经典的网络模型WideDeep网络进行训练的实战讲解，使用数据集是criteo，主要内容分为以下几个模块

·2025-02-05 14:00

PyTorch中的 torch.nn.GRU

与传统的RNN相比，GRU引入了门控机制，旨在解决长序列训练中的梯度消失问题，并提高了训练效率和性能。在PyTorch中，torch.nn.GRU是一个非常方便的模块，用于构建和训练GRU网络。

彬彬侠·2025-02-05 12:53

深度探索：机器学习中的粒子群优化算法（PBMT）原理及应用

目录一、引言与背景二、定理三、算法原理四、算法实现五、优缺点分析优点：缺点：六、案例应用七、对比与其他算法八、结论与展望一、引言与背景随着机器学习技术的迅速发展，优化算法在模型训练、特征选择、参数调优等多个环节扮演着至关重要的角色

生瓜蛋子·2025-02-05 12:22

基于深度学习的车牌检测识别系统 —— 使用YOLOv5实现车牌检测与识别

目录引言项目背景与目标1.1项目背景1.2项目目标系统设计与架构2.1系统功能概述2.2系统架构数据准备与处理3.1数据集选择与收集3.2数据标注3.3数据集划分YOLOv5模型训练与优化4.1YOLOv5

2025年数学建模美赛·2025-02-05 12:20

DeepSeek-R1 低成本训练的根本原因是？

然而，高性能的背后往往是高昂的训练成本，动辄数百万美元的投入让许多企业和研究机构望而却步。近期，国产大模型DeepSeek-R1的横空出世，以其卓越的性能和极具竞争力的成本，打破了这一固有认知。

明哲AI·2025-02-05 11:10

关于大模型 AGI 应知应会＿生在AI发展的时代

这些模型通过训练海量数据来学习复杂的模式和特

森焱森·2025-02-05 10:38

【知识图谱增强】大模型应用架构：融合智能与数据的新纪元！

ChatGPT的外部搜索能力，使其不仅限于预训练的数据，而是可以实时访问和检索互联网的最新信息。这就是典型的知识增强大模型应用，通过外部知识的增强能够扩展大模型的能力，让其

大模型入门教程·2025-02-05 10:36

如何利用DeepSeek打造医疗领域专属AI助手？从微调到部署全流程解析

本文将手把手带您实现医疗垂直领域大模型的定制化训练，以DeepSeek-R1为基座，打造专业可靠的医疗AI助手。

明哲AI·2025-02-05 10:05

国内首个！百度成功点亮昆仑芯三代万卡集群，将于近日点亮3万卡集群

而24年9月升级的百度百舸AI异构计算平台4.0，围绕落地大模型全旅程的算力需求，在集群创建、开发实验、模型训练、模型推理四大方面，能为企业提供“多、快、稳、省”的AI基础设施，在万卡集群的建设中发挥了至关

·2025-02-05 09:50

大语言模型LLM分布式训练：TensorFlow攻略与深度解析（LLM系列04）

文章目录大语言模型LLM分布式训练：TensorFlow攻略与深度解析（LLM系列04）1.引言2.TensorFlow分布式训练基础概念3.TensorFlow中LLM分布式训练的关键技术及应用4.利用

North_D·2025-02-05 08:20

自定义数据集使用pytorch框架实现逻辑回归并保存模型，然后保存模型后再加载模型进行预测，对预测结果计算精确度和召回率及F1分数

训练模型：使用二元交叉熵损失函数BCELoss和随机梯度下降优化器SGD进行训练。保存模型：使用torch.save保存模型的参数。加载模型并预测：加载

知识鱼丸·2025-02-05 06:42

GPU 进阶笔记（二）：华为昇腾 910B GPU

1术语1.1与NVIDIA术语对应关系1.2缩写2产品与机器2.1GPU产品2.2训练机器底座CPU功耗操作系统2.3性能3实探：鲲鹏底座8*910BGPU主机3.1CPU3.2网卡和网络3.3GPU信息

hao_wujing·2025-02-05 04:22

【2024第一期CANN训练营】Ascend C算子开发基础篇

AscendC是面向算子开发场景的编程语言，它原生支持C和C++标准规范，并提供了多层接口抽象、自动并行计算等关键技术，以提高算子开发效率。AscendC的特点C/C++原语编程编程模型屏蔽硬件差异类库API封装，兼顾易用与高效孪生调试，可在CPU侧模拟NPU侧的行为开发基本流程环境准备使用AscendC完成Add算子核函数开发；使用ICPU_RUN_KFCPU调测宏完成算子核函数CPU侧运行验证

小超编程·2025-02-05 03:45

DeepSeek-R1全面超越OpenAI o1：开源大模型训练范式革新

CSS技巧与案例详解vue2与vue3技巧合集VueUse源码解读人工智能在过去十年中的发展令人惊叹。其中，2017年Google发布的“AttentionIsAllYouNeed”论文奠定了神经网络架构的重要基础，推动了大规模语言模型（LLM）的突破。OpenAI早期专注于强化学习（RL），但在Transformer结构问世后，迅速调整方向，借助Google的开源研究开发出强大的LLM。然而，尽

·2025-02-05 02:16

心法利器[128] | 2024年算法小结-个人成长-打开思路-生日

往期回顾心法利器[123]|算法面试的八股和非八股讨论心法利器[124]|24年算法思考-大模型的应用与训练篇心法利器[125]|24年算法思考-RAG技术论文和实践小

机智的叉烧·2025-02-05 01:07

心法利器[127] | 24年算法思考-特征工程和经典深度学习

往期回顾心法利器[122]|效果提升的根本来源讨论心法利器[123]|算法面试的八股和非八股讨论心法利器[124]|24年算法思考-大模型的应用与训练篇心法利器[125

机智的叉烧·2025-02-05 01:37

大模型带你学pytorch课程

PyTorch是一个强大的开源机器学习框架，由Facebook的人工智能研究实验室开发，被广泛用于深度学习模型的构建和训练。让我们开始你的PyTorch旅程吧！1.预备课程大纲1.1引入Pyth

立杰说·2025-02-05 01:33

自定义数据集使用scikit-learn中svm的包实现svm分类

数据划分：-使用train_test_split函数将生成的数据集划分为训练集和测试集，测试集占比为20%，同样通过random_state=42保证划分的一致性。SVM模型：-初始化SV

知识鱼丸·2025-02-05 01:31

招商银行2022 Fintech精英训练营数据赛道-第4名方案分享

0.比赛简介竞赛时间：4月29日9:00-5月12日17:00竞赛流程：4月29日9:00-5月9日24:00，赛题开放A榜数据（test_A榜），预测结果数据每天限提交3次；5月10日00:00-5月12日17:00，赛题开放B榜数据（test_B榜），预测结果数据每天限提交3次。重复提交或提交格式错误均扣除有效提交次数，请谨慎提交答案，结果提交后请务必点击“运行”按钮，方可查看当前个人排名。排

藏在云中的猫·2025-02-04 22:38

Llama最新开源大模型Llama3.1

以下是关于Llama3.1的详细介绍：参数规模与训练数据Llama3.1拥有4050亿（405B）参数，是目前开源领域中参数规模最大的模型之一。

kcarly·2025-02-04 21:32

MagicBot：AI 与算力让它在工厂立足

可能大家都曾在脑海中预想过机器人活跃于工厂的场景：它们如同训练有素的“工作狂魔”，在工厂的各个角落穿梭，自主分工合作，高效地完成各项任务。

算家云·2025-02-04 20:57

scikit-learn实现SVM

最大间隔超平面：SVM的目标是找到能够最大化训练样本间隔的超平面。间隔被定义为到最近训练样本点的距离，这些点被称为支持向量。这种策略的优势在于它提供了一种防止模型过拟合的方法，从而提高了泛化能力。

PeterClerk·2025-02-04 19:23

PyTorch中的In-place操作是什么？为什么要避免使用这种操作？

点击上方“小白学视觉”，选择加"星标"或“置顶”重磅干货，第一时间送达导读In-place操作用在推理的时候可以显著节省内存，但是训练的时候一定要小心使用。

小白学视觉·2025-02-04 19:49

AI大模型学习的七个阶段，学完你就是大模型大师！

预训练、SFT、RLHF。第三阶段：编程基础与工具使用目标：掌握大

AGI大模型老王·2025-02-04 19:48

大模型文件格式GGUF格式

GGUF简介当前的大模型的参数规模较大，数以千亿的参数导致了它们的预训练结果文件都在几十GB甚至是几百GB，这不仅导致其使用成本很高，在不同平台进行交换也非常困难。

·2025-02-04 18:36

【自然语言处理（NLP）】生成词向量：GloVe（Global Vectors for Word Representation）原理及应用

文章目录介绍GloVe介绍核心思想共现矩阵1.共现矩阵的定义2.共现概率矩阵的定义3.共现概率矩阵的意义4.共现概率矩阵的构建步骤5.共现概率矩阵的应用6.示例7.优缺点优点缺点**总结**目标函数训练过程使用预训练的

道友老李·2025-02-04 16:59

蓝桥杯算法训练排序C++

代码：#includeusingnamespacestd;intmain(){intnum[3];inttemp;cin>>num[0]>>num[1]>>num[2];for(inti=0;inum[i]){temp=num[j];num[j]=num[i];num[i]=temp;}for(inti=0;i<3;i++)cout<<num[i]<<"";return0;}

王大头不吃藕·2025-02-04 15:47

DeepSeek R1 AI 论文翻译

DeepSeek-R1-Zero是一个通过大规模强化学习（RL）训练的模型，且在此过程中未使用监督微调（SFT）作为预处理步骤，展现出了显著的推理能力。

·2025-02-04 14:27

自定义数据集，使用朴素贝叶斯对其进行分类

fit_transform方法在训练数据上拟合向量器并进行转换。模型训练：-初始化MultinomialNB模型，这是适用于离散数据（如词频）的朴素贝叶斯分类器。

知识鱼丸·2025-02-04 14:40

【AI开源项目】Dify- 轻松打造可持续运营的 GPT 系列的 AI应用 —— 全面解析LLMOps平台

Q2:如何使用Dify“训练”自己的

ChatGPT-千鑫·2025-02-04 13:02

【漫话机器学习系列】079.超参数调优（Hyperparameter Tuning）

超参数是模型在训练之前设定的参数，而不是通过训练数据学习到的参数。正确地选择超参数可以显著提高模型的预测能力，反之，错误的超参数选择可能会导致过拟合、欠拟合或训练过程缓慢。

IT古董·2025-02-04 11:44

全场景深度学习开源框架（MindSpore）

无论是在数据中心的大规模计算，还是在手机、物联网设备等资源受限的终端上，MindSpore都能灵活适配，充分发挥各硬件平台的性能优势，实现模型的高效训练和推理。

deepdata_cn·2025-02-04 11:41

torch.nn.RNN: PyTorch 中的循环神经网络（RNN）模块

它提供了一个可以进行训练的RNN层，广泛应用于序列数据的建模，如自然语言处理、时间序列分析等。这个模块可以处理各种类型的序列数据，并支持多种功能和配置。

彬彬侠·2025-02-04 10:40

AI学习指南HuggingFace篇-高级优化技巧

一、引言在深度学习和自然语言处理（NLP）中，模型训练的效率和性能至关重要。HuggingFace提供了多种高级优化技巧，帮助开发者提升模型训练的效率和效果。

俞兆鹏·2025-02-04 10:35

DeepSeek- R1 原理介绍

DeepSeek-R1是由DeepSeek公司推出的一款基于强化学习（RL）的开源推理模型，其核心原理和特点如下：1.核心技术与架构强化学习驱动：DeepSeek-R1是首个完全通过强化学习训练的大型语言模型

kcarly·2025-02-04 08:50

深度学习框架PyTorch原理与实践

3.2PyTorch的特点1）自动求导机制2）GPU加速3）模型部署4）数据管道5）代码阅读友好4.核心算法原理4.1神经网络结构4.2神经网络层4.3激活函数5.实际案例——MNIST手写数字识别数据准备模型定义训练测试整体代码

AI天才研究院·2025-02-04 07:47

自定义数据集使用paddlepaddle框架实现逻辑回归并保存模型，然后保存模型后再加载模型进行预测

1.引言在这篇博客中，我们将使用PaddlePaddle框架实现一个逻辑回归模型，利用NumPy自定义数据集进行训练，并保存模型。最后，我们将演示如何加载保存的模型并进行预测。

辞落山·2025-02-04 07:16

Databricks 开源 LLM，训练只需三个小时

像ChatGPT和Bard这样的生成式AI，它们使用的数据通常来自于在成千上万不同网站，使用的数据量十分惊人，而且想要使用这些数据训练AI还需要数以千计的强大GPU在背后提供支持。

唐城·2025-02-04 07:15

解决_pickle.UnpicklingError: A load persistent id instruction was encountered,but no persistent_load

Aloadpersistentidinstructionwasencountered,butnopersistent_loadfunctionwasspecified.报错原因：在加载模型参数时，torch版本发生变化，我报错因为训练前

邻家的狗2·2025-02-04 07:14

DeepSeek R1 AI 论文翻译

DeepSeek-R1-Zero是一个通过大规模强化学习（RL）训练的模型，且在此过程中未使用监督微调（SFT）作为预处理步骤，展现出了显著的推理能力。

老马啸西风·2025-02-04 06:04

Yuan 2.0-M32 是一个基于 Yuan 2.0 架构的双语混合专家 (MoE) 语言模型，旨在以更少的参数和计算量实现更高的准确率

高效计算：使用MoE架构，40B总参数中仅有3.7B激活参数，训练计算消耗仅为同规模密集模型的9.25%，推理成本与3.7B参数的密集模型相当。

东方佑·2025-02-04 06:01

【分割评价指标-nnUNet V2训练】- AutoDL

目录一、DSC二、IOU三、VOE(VolumeOverlapError)四、RVD(RelativeVolumeDifference)五、Hausdorff95(95thPercentileofHausdorffDistance)六、ASSD(AverageSymmetricSurfaceDistance)七、MSD(MeanSurfaceDistance)八、NSD(NormalizedSur

HUI 别摸鱼了·2025-02-04 05:00

PyTorch 训练一个分类器

文章目录0前言1加载和规范化CIFAR102定义一个卷积网络3定义损失函数和优化器4训练网络5测试网络6在GPU上训练模型参考资料0前言 TRAINGINGACLASSIFIER这篇教程很清楚的描述了如何使用

亚里·2025-02-04 05:59

蓝桥杯——试题集——入门训练

入门训练BEGIN-1A+B问题问题描述输入A、B，输出A+B。输入格式输入的第一行包括两个整数，由空格分隔，分别表示A、B。输出格式输出一行，包括一个整数，表示A+B的值。

唐煜鑫·2025-02-04 04:54

蓝桥杯训练1——缩位求和

缩位求和例如123输出为6n=int(input())lst=list(str(n))sum=0foriinlst:sum+=int(i)whilesum>=10:s=0lst1=list(str(sum))foriteminlst1:s+=int(item)sum=sprint(s)

会编程的小孩·2025-02-04 04:52

python中keras_Python深度学习——keras（一）

大多数深度学习，都是将若干个简单的层给链接起来，实现渐进式的数据过滤，也就是数据蒸馏(过滤到一定程度就等同于蒸馏)首先来看一个数字识别的案例(1)读取训练集和测试集fromkeras.datasetsimportmnist

weixin_39534321·2025-02-04 04:48

推荐频道

天梯赛训练

DeepSeek R1技术报告关键解析(5/10)：知识蒸馏：如何让小模型也能具备强推理能力？

学霸带你游戏化增强学习动力奖励与挑战助力成长

目标检测数据集-Pascal VOC 数据集介绍

人工智能基础知识速成 - 机器学习、深度学习算法原理及其实际应用案例

基于昇腾用PyTorch实现传统CTR模型WideDeep网络

PyTorch中的 torch.nn.GRU

深度探索：机器学习中的粒子群优化算法（PBMT）原理及应用

基于深度学习的车牌检测识别系统 —— 使用YOLOv5实现车牌检测与识别

DeepSeek-R1 低成本训练的根本原因是？

关于大模型 AGI 应知应会＿生在AI发展的时代

【知识图谱增强】大模型应用架构：融合智能与数据的新纪元！

如何利用DeepSeek打造医疗领域专属AI助手？从微调到部署全流程解析

国内首个！百度成功点亮昆仑芯三代万卡集群，将于近日点亮3万卡集群

大语言模型LLM分布式训练：TensorFlow攻略与深度解析（LLM系列04）

自定义数据集 使用pytorch框架实现逻辑回归并保存模型，然后保存模型后再加载模型进行预测，对预测结果计算精确度和召回率及F1分数

GPU 进阶笔记（二）：华为昇腾 910B GPU

【2024第一期CANN训练营】Ascend C算子开发基础篇

DeepSeek-R1全面超越OpenAI o1：开源大模型训练范式革新

心法利器[128] | 2024年算法小结-个人成长-打开思路-生日

心法利器[127] | 24年算法思考-特征工程和经典深度学习

大模型带你学pytorch课程

自定义数据集 使用scikit-learn中svm的包实现svm分类

招商银行2022 Fintech精英训练营数据赛道-第4名方案分享

Llama最新开源大模型Llama3.1

MagicBot：AI 与算力让它在工厂立足

scikit-learn实现SVM

PyTorch中的In-place操作是什么？为什么要避免使用这种操作？

AI大模型学习的七个阶段，学完你就是大模型大师！

大模型文件格式GGUF格式

【自然语言处理（NLP）】生成词向量：GloVe（Global Vectors for Word Representation）原理及应用

蓝桥杯算法训练 排序C++

DeepSeek R1 AI 论文翻译

自定义数据集 ，使用朴素贝叶斯对其进行分类

【AI开源项目】Dify- 轻松打造可持续运营的 GPT 系列的 AI应用 —— 全面解析LLMOps平台

【漫话机器学习系列】079.超参数调优（Hyperparameter Tuning）

全场景深度学习开源框架（MindSpore）

torch.nn.RNN: PyTorch 中的循环神经网络（RNN）模块

AI学习指南HuggingFace篇-高级优化技巧

DeepSeek- R1 原理介绍

深度学习框架PyTorch原理与实践

自定义数据集 使用paddlepaddle框架实现逻辑回归并保存模型，然后保存模型后再加载模型进行预测

Databricks 开源 LLM，训练只需三个小时

解决_pickle.UnpicklingError: A load persistent id instruction was encountered,but no persistent_load

DeepSeek R1 AI 论文翻译

Yuan 2.0-M32 是一个基于 Yuan 2.0 架构的双语混合专家 (MoE) 语言模型，旨在以更少的参数和计算量实现更高的准确率

【分割评价指标-nnUNet V2训练】- AutoDL

PyTorch 训练一个分类器

蓝桥杯——试题集——入门训练

蓝桥杯训练1——缩位求和

python中keras_Python深度学习——keras（一）

自定义数据集使用pytorch框架实现逻辑回归并保存模型，然后保存模型后再加载模型进行预测，对预测结果计算精确度和召回率及F1分数

自定义数据集使用scikit-learn中svm的包实现svm分类

蓝桥杯算法训练排序C++

自定义数据集，使用朴素贝叶斯对其进行分类

自定义数据集使用paddlepaddle框架实现逻辑回归并保存模型，然后保存模型后再加载模型进行预测