2020牛客组队训练

AI学习指南HuggingFace篇-高级优化技巧

一、引言在深度学习和自然语言处理（NLP）中，模型训练的效率和性能至关重要。HuggingFace提供了多种高级优化技巧，帮助开发者提升模型训练的效率和效果。

俞兆鹏·2025-02-04 10:35

DeepSeek- R1 原理介绍

DeepSeek-R1是由DeepSeek公司推出的一款基于强化学习（RL）的开源推理模型，其核心原理和特点如下：1.核心技术与架构强化学习驱动：DeepSeek-R1是首个完全通过强化学习训练的大型语言模型

kcarly·2025-02-04 08:50

深度学习框架PyTorch原理与实践

3.2PyTorch的特点1）自动求导机制2）GPU加速3）模型部署4）数据管道5）代码阅读友好4.核心算法原理4.1神经网络结构4.2神经网络层4.3激活函数5.实际案例——MNIST手写数字识别数据准备模型定义训练测试整体代码

AI天才研究院·2025-02-04 07:47

自定义数据集使用paddlepaddle框架实现逻辑回归并保存模型，然后保存模型后再加载模型进行预测

1.引言在这篇博客中，我们将使用PaddlePaddle框架实现一个逻辑回归模型，利用NumPy自定义数据集进行训练，并保存模型。最后，我们将演示如何加载保存的模型并进行预测。

辞落山·2025-02-04 07:16

Databricks 开源 LLM，训练只需三个小时

像ChatGPT和Bard这样的生成式AI，它们使用的数据通常来自于在成千上万不同网站，使用的数据量十分惊人，而且想要使用这些数据训练AI还需要数以千计的强大GPU在背后提供支持。

唐城·2025-02-04 07:15

解决_pickle.UnpicklingError: A load persistent id instruction was encountered,but no persistent_load

Aloadpersistentidinstructionwasencountered,butnopersistent_loadfunctionwasspecified.报错原因：在加载模型参数时，torch版本发生变化，我报错因为训练前

邻家的狗2·2025-02-04 07:14

DeepSeek R1 AI 论文翻译

DeepSeek-R1-Zero是一个通过大规模强化学习（RL）训练的模型，且在此过程中未使用监督微调（SFT）作为预处理步骤，展现出了显著的推理能力。

老马啸西风·2025-02-04 06:04

Yuan 2.0-M32 是一个基于 Yuan 2.0 架构的双语混合专家 (MoE) 语言模型，旨在以更少的参数和计算量实现更高的准确率

高效计算：使用MoE架构，40B总参数中仅有3.7B激活参数，训练计算消耗仅为同规模密集模型的9.25%，推理成本与3.7B参数的密集模型相当。

东方佑·2025-02-04 06:01

【分割评价指标-nnUNet V2训练】- AutoDL

目录一、DSC二、IOU三、VOE(VolumeOverlapError)四、RVD(RelativeVolumeDifference)五、Hausdorff95(95thPercentileofHausdorffDistance)六、ASSD(AverageSymmetricSurfaceDistance)七、MSD(MeanSurfaceDistance)八、NSD(NormalizedSur

HUI 别摸鱼了·2025-02-04 05:00

PyTorch 训练一个分类器

文章目录0前言1加载和规范化CIFAR102定义一个卷积网络3定义损失函数和优化器4训练网络5测试网络6在GPU上训练模型参考资料0前言 TRAINGINGACLASSIFIER这篇教程很清楚的描述了如何使用

亚里·2025-02-04 05:59

蓝桥杯——试题集——入门训练

入门训练BEGIN-1A+B问题问题描述输入A、B，输出A+B。输入格式输入的第一行包括两个整数，由空格分隔，分别表示A、B。输出格式输出一行，包括一个整数，表示A+B的值。

唐煜鑫·2025-02-04 04:54

蓝桥杯训练1——缩位求和

缩位求和例如123输出为6n=int(input())lst=list(str(n))sum=0foriinlst:sum+=int(i)whilesum>=10:s=0lst1=list(str(sum))foriteminlst1:s+=int(item)sum=sprint(s)

会编程的小孩·2025-02-04 04:52

python中keras_Python深度学习——keras（一）

大多数深度学习，都是将若干个简单的层给链接起来，实现渐进式的数据过滤，也就是数据蒸馏(过滤到一定程度就等同于蒸馏)首先来看一个数字识别的案例(1)读取训练集和测试集fromkeras.datasetsimportmnist

weixin_39534321·2025-02-04 04:48

Solidity/Rust 实战 —— Web3 开发者免费训练营（第 21 期）

HackQuest第21期Solidity/Rust共学营即将开营！Solidity/Rust共学营信息清单7月23日-8月1日免费（成功结营的小伙伴还将获得专属周边）全程线上(会议具体时间入营后通知)️头部公链官方签发的学习证书主办社区:HackQuestHackQuest是一个充满活力的Web3开发者教育社区，我们的目标是培养下一代Web3开发者。目前，HackQuest组织的共学营已达20期

·2025-02-04 03:50

Move on Sui 实战 —— Web3 开发者免费训练营「第22期」

HackQuest第22期MoveonSui共学营即将开营！MoveonSui共学营信息清单7月31日-8月8日免费（成功结营的小伙伴还将获得Sui基金会提供的奖金）全程线上(会议具体时间入营后通知)️头部公链官方签发的学习证书关于HackQuestHackQuest是一个充满活力的Web3开发者教育社区，我们的目标是培养下一代Web3开发者。目前我们的产品仍处于内测阶段，我们计划招募小伙伴们一起

·2025-02-04 03:50

Web3 黑客松组队报名 — 10000 美金奖池，新手友好，需要前后端，设计，产品，合约工程师

Linea黑客松基本信息ℹ️报名截止6月30日10,000美金奖池在HackQuest平台举办，新手友好，适合Web2转型Web3的开发者参与需要前端，后端，设计，产品，合约工程师关于HackQuestHackQuest是一个充满活力的Web3开发者教育社区，我们的目标是培养下一代Web3开发者。黑客松要求✍️本次黑客松由HackQuest和Linea合作推，仅在HackQuest平台组织和举办不

·2025-02-04 03:20

机器学习笔记20241017

文章目录torchvisiondataloadernn.module卷积非线性激活模型选择训练误差泛化误差正则化权重衰退的基本概念数学表示权重衰退的效果物理解释数值稳定性（GradientVanishing

tt555555555555·2025-02-04 03:11

Transformer预测模型及其Python和MATLAB实现

这些模型虽然在许多任务中取得了成功，但由于其计算效率低下以及长距离依赖关系处理的不足，导致模型训练时间漫长，并在处理较长文本时效果不佳。

追蜻蜓追累了·2025-02-04 03:10

MOE模型入门

如何训练、微调MOE模型？基础架构优缺点不同MOE模型实现方式、训练方法二、实现定义：MOE架构MOE:混合专家模型，多个专家共同决策的模型。

云帆@·2025-02-04 01:29

MIT 6.S081 实验6 笔记与心得

Lab6：COWFork文章目录Lab6：COWFork背景知识Implementcopy-onwrite([hard](https://pdos.csail.mit.edu/6.828/2020/labs

cube__4·2025-02-04 01:56

Web3 黑客松组队报名 — 30000 美金奖池，需要前后端，设计，产品，合约工程师

MantleAPACHackathon基本信息ℹ️项目提交截至12月15日30,000美金奖池三大赛道：DeFi、Infra&AI、Gaming&Meme需要前端，后端，设计，产品，合约工程师黑客松要求✍️本次黑客松由MantleFoundation联合Hackguest和OpenBuild共同打造，面向亚太地区开发者和区块链爱好者的线上黑客马拉松不限制主题部署在Mantle测试网上谁适合参加UI

·2025-02-04 00:16

本周AI动态：生成型AI的命运掌握在法院手中

诉讼声称，Udio和Suno在未经音乐公司同意的情况下，使用这些公司的音乐训练生成型AI模型，要求每首涉嫌侵权的作品赔偿15万美元。唱片公司在投诉中表示，“合成音乐输出可能会使市场充斥机器生成的

·2025-02-04 00:15

Solidity/Rust 实战 —— Web3 开发者免费训练营（第17期）

HackQuest第17期Solidity/Rust共学营即将开营！Solidity/Rust共学营信息清单6月18日-6月27日免费（成功结营的小伙伴还将获得专属周边）全程线上(会议具体时间入营后通知)️头部公链官方签发的学习证书关于HackQuestHackQuest是一个充满活力的Web3开发者教育社区，我们的目标是培养下一代Web3开发者。目前我们的产品仍处于内测阶段，我们计划招募小伙伴们

·2025-02-04 00:44

DeepSeek的出现对全球GPT产业产生的冲击

特别是以GPT（GenerativePre-trainedTransformer）系列模型为代表的大规模预训练语言模型，已经在全球范围内引发了广泛关注和应用。

不要em0啦·2025-02-03 23:07

python 图像特征提取_python实现LBP方法提取图像纹理特征实现分类的步骤

题目描述这篇博文是数字图像处理的大作业.题目描述:给定40张不同风格的纹理图片,大小为512*512,要求将每张图片分为大小相同的9块,利用其中的5块作为训练集,剩余的4块作为测试集,构建适当的模型实现图片的分类

weixin_39969060·2025-02-03 22:28

张家口市塞北地图矢量cdr格式ai2020年内容测评

2020年版本，全区县范围的图，不是城区范围图。范围看预览图。

天赐信息科技·2025-02-03 21:57

打架检测系统：基于YOLOv5的实时人群打架行为识别

本博客将详细介绍如何使用YOLOv5模型搭建一个打架检测系统，包含数据集准备、YOLOv5训练、UI界面设计以及优化和部署

2025年数学建模美赛·2025-02-03 21:56

A deep multimodal fusion method for personality traits prediction

研究方法模型架构：视觉特征提取：使用预训练模型ViT-B16和VGG16。音频特征提取：使用预训练模型VGGish。文本分析：使用预训练模型GloVe。

m0_59933522·2025-02-03 21:20

Qwen2.5-Max

Qwen2.5-Max是阿里巴巴于2024年1月29日发布的一款旗舰级人工智能模型，基于混合专家（MoE）架构开发，拥有超过20万亿tokens的超大规模预训练数据。

百态老人·2025-02-03 20:18

DeepSeek R1 AI 论文翻译

DeepSeek-R1-Zero是一个通过大规模强化学习（RL）训练的模型，且在此过程中未使用监督微调（SFT）作为预处理步骤，展现出了显著的推理能力。

·2025-02-03 20:09

代码随想录算法训练营Day51 | 101.孤岛的总面积、102.沉没孤岛、103.水流问题、104.建造最大岛屿

文章目录101.孤岛的总面积思路与重点102.沉没孤岛思路与重点103.水流问题思路与重点104.建造最大岛屿思路与重点101.孤岛的总面积题目链接：101.孤岛的总面积讲解链接：代码随想录状态：直接看题解了。思路与重点nextx或者nexty越界了则说明当前的x或y处于边界处，所以当前的岛不是孤岛，不能记入总面积。#include#includeusingnamespacestd;intdir[

Harryline-lx·2025-02-03 19:43

Ubuntu16.04环境下安装cuda10+pytorch1.2

1、背景环境：Ubuntu16.04&titanx作为新一代的人工智能训练平台的PYTORCH，有其独特的优势，为此，完整的安装这一平台，是开展所有工作的首要条件，一开始，笔者认为应该轻松的完成，但是发现实际上要从零完成这一工作

小楼昨夜，东风·2025-02-03 19:11

【PyTorch】6.张量运算函数：一键开启！PyTorch 张量函数的宝藏工厂

它作为强大的深度学习框架，为构建和训练神经网络提供了高效且灵活的平台。神经网络作为人工智能的核心技术，能够处理复杂的数据模式。

Icomi_·2025-02-03 19:39

机器学习—大语言模型：推动AI新时代的引擎

2.Transformer架构3.模型训练二、大语言模型的应用场景1.文本生成2.问答系统3.编码助手4.多语言翻译三、大语言模型的最新进展1.GPT-42.开源模型四、构建和部署一个简单的大语言模型1

云边有个稻草人·2025-02-03 19:38

4、PyTorch 第一个神经网络，手写神经网络的基本部分组成

以下实例展示了如何使用神经网络完成简单的二分类任务，为更复杂的任务奠定了基础，通过PyTorch的模块化接口，神经网络的构建、训练和可视化都非常直观。

找个栗子·2025-02-03 19:35

M｜哪吒之魔童闹海

上映时间：<19901990s2000s2010s2020s主题表达：差普通深度欠缺晦涩好情节逻辑：差一般基本严密但没亮点适当牺牲逻辑性（合理降智等）基本严密而有亮点人物塑造：差大部分合格主要人

影林握雪·2025-02-03 18:57

DeepSeek-R1 论文. Reinforcement Learning 通过强化学习激励大型语言模型的推理能力

工作原理：主要技术，就是训练出一些专有用途小模型，来帮助大模型训练。主要技术：1.强化学习(RL)核心是强化学习技术，像训练小狗一样，当模型做出正确的推理步骤或得到正确的

davenian·2025-02-03 18:56

Apache Iceberg数据湖技术在海量实时数据处理、实时特征工程和模型训练的应用技术方案和具体实施步骤及代码

ApacheIceberg在处理海量实时数据、支持实时特征工程和模型训练方面的强大能力。Iceberg支持实时特征工程和模型训练，特别适用于需要处理海量实时数据的机器学习工作流。

weixin_30777913·2025-02-03 15:07

线性回归的简单实现

本文是《动手学深度学习》的笔记文章目录线性回归的简单实现生成随机数据集读取数据初始化模型参数定义模型定义损失函数定义优化算法训练模型线性回归的简洁实现生成数据集读取数据定义模型初始化模型参数定义损失函数定义优化算法训练模型线性回归的简单实现用了

SkaWxp·2025-02-03 14:58

hive分区和分桶详解

1）分区表基本操作（1）引入分区表（需要根据日期对日志进行管理,通过部门信息模拟）dept_20200401.logdept_2020

CodeShelby·2025-02-03 14:56

【论文笔记】基于图神经网络的多视角视觉重定位 GRNet CVPR 2020 论文笔记

GRNet:LearningMulti-viewCameraRelocalizationwithGraphNeuralNetworks驭势科技,北京大学机器感知重点实验室,北京长城航空测控技术研究所本文提出了一种使用多视角图像进行相机重定位的图神经网络。该网络可以使得不连续帧之间进行信息传递，相比于只能在相邻前后帧之间进行信息传递的序列输入和LTSM，其能捕获更多视角信息以进行重定位。因此LSTM

phy12321·2025-02-03 14:26

初入机器学习

辰尘_星启·2025-02-03 14:54

深度学习：基于MindNLP的RAG应用开发

与传统LLM的区别：传统LLM仅依赖预训练参数中的静态知

Landy_Jay·2025-02-03 13:47

跟李沐学AI：视频生成类论文精读（Movie Gen、HunyuanVideo）

MovieGen：ACastofMediaFoundationModels简介MovieGen是Meta公司提出的一系列内容生成模型，包含了3.2.1预训练数据MovieGen采用大约100M的视频-文本对和

Landy_Jay·2025-02-03 13:16

TensorFlow：tensorflow.keras.Model.fit（）报错： TypeError: Failed to convert elements of xxx

一、问题在使用TensorFlow进行数据训练的时候，报了下面这样的一个错误。

向小凯同学学习·2025-02-03 12:45

常用软件安装包

1ddVXKjxPZ5OL4gPSKMzwLg提取码：wmwkvivado2021.2链接：链接：https://pan.baidu.com/s/1EcrkcZzTe6v9LRnc5Fp0bg提取码：9tf8vivado2020.3

sinat_39901027·2025-02-03 12:45

拼多多2025届校招开起，无拼不青春，欢迎加入！！！

部门是做硅片对专项练习训练营打卡第一天专项练习训练营打卡第一天实习大家好，我现在是大三暑假，刚刚找到一个实习Linux开发工程师，是第一份实习，现在有必要去吗？

愤怒的小青春·2025-02-03 12:14

Mixture of Experts（MoE）学习笔记

不过在这之后开源社区并没有对MoE架构进行很多的探索，更多的工作还是聚焦在预训练新的大模型，在Llama2或其他模型上做Fine-tune，以及扩展大模型的ContextLength。12月8号

南七小僧·2025-02-03 12:44

Uboot中外存MMC(sd/iNand等)驱动架构代码简单分析

2020-7-519:50北京晴屋内开空调不知道外面啥情况一天没出屋外面貌似闷热吧！本文仅作为技术积累，方便日后查阅！

IT悟物穷理IT·2025-02-03 10:18

python3 mysql8_python3连接MySQL8.0的两种方式

python3连接MySQL8.0的两种方式发布时间：2020-09-1913:15:14来源：脚本之家阅读：111作者：兔猪合家欢1、下载MySQL官方的mysql-connector-python-

weixin_39872123·2025-02-03 09:14

推荐频道

2020牛客组队训练

AI学习指南HuggingFace篇-高级优化技巧

DeepSeek- R1 原理介绍

深度学习框架PyTorch原理与实践

自定义数据集 使用paddlepaddle框架实现逻辑回归并保存模型，然后保存模型后再加载模型进行预测

Databricks 开源 LLM，训练只需三个小时

解决_pickle.UnpicklingError: A load persistent id instruction was encountered,but no persistent_load

DeepSeek R1 AI 论文翻译

Yuan 2.0-M32 是一个基于 Yuan 2.0 架构的双语混合专家 (MoE) 语言模型，旨在以更少的参数和计算量实现更高的准确率

【分割评价指标-nnUNet V2训练】- AutoDL

PyTorch 训练一个分类器

蓝桥杯——试题集——入门训练

蓝桥杯训练1——缩位求和

python中keras_Python深度学习——keras（一）

Solidity/Rust 实战 —— Web3 开发者免费训练营（第 21 期）

Move on Sui 实战 —— Web3 开发者免费训练营「第22期」

Web3 黑客松组队报名 — 10000 美金奖池，新手友好，需要前后端，设计，产品，合约工程师

机器学习笔记20241017

Transformer预测模型及其Python和MATLAB实现

MOE模型入门

MIT 6.S081 实验6 笔记与心得

Web3 黑客松组队报名 — 30000 美金奖池，需要前后端，设计，产品，合约工程师

本周AI动态：生成型AI的命运掌握在法院手中

Solidity/Rust 实战 —— Web3 开发者免费训练营（第17期）

DeepSeek的出现对全球GPT产业产生的冲击

python 图像特征提取_python实现LBP方法提取图像纹理特征实现分类的步骤

张家口市塞北地图矢量cdr格式ai2020年内容测评

打架检测系统：基于YOLOv5的实时人群打架行为识别

A deep multimodal fusion method for personality traits prediction

Qwen2.5-Max

DeepSeek R1 AI 论文翻译

代码随想录算法训练营Day51 | 101.孤岛的总面积、102.沉没孤岛、103.水流问题、104.建造最大岛屿

Ubuntu16.04环境下安装cuda10+pytorch1.2

【PyTorch】6.张量运算函数：一键开启！PyTorch 张量函数的宝藏工厂

机器学习—大语言模型：推动AI新时代的引擎

4、PyTorch 第一个神经网络，手写神经网络的基本部分组成

M｜哪吒之魔童闹海

DeepSeek-R1 论文. Reinforcement Learning 通过强化学习激励大型语言模型的推理能力

Apache Iceberg数据湖技术在海量实时数据处理、实时特征工程和模型训练的应用技术方案和具体实施步骤及代码

线性回归的简单实现

hive分区和分桶详解

【论文笔记】基于图神经网络的多视角视觉重定位 GRNet CVPR 2020 论文笔记

初入机器学习

深度学习：基于MindNLP的RAG应用开发

跟李沐学AI：视频生成类论文精读（Movie Gen、HunyuanVideo）

TensorFlow：tensorflow.keras.Model.fit（）报错： TypeError: Failed to convert elements of xxx

常用软件安装包

拼多多2025届校招开起，无拼不青春，欢迎加入！！！

Mixture of Experts（MoE）学习笔记

Uboot中外存MMC(sd/iNand等)驱动架构代码简单分析

python3 mysql8_python3连接MySQL8.0的两种方式

自定义数据集使用paddlepaddle框架实现逻辑回归并保存模型，然后保存模型后再加载模型进行预测