预训练卷积神经网络第27页

第26篇：pFedLoRA: Model-Heterogeneous Personalized Federated Learning with LoRA使用lora微调的模型异构个性化联邦学习

第一部分：解决的问题联邦学习（FederatedLearning,FL）是一种分布式机器学习方法，允许客户端在本地数据上训练模型，同时通过中心服务器共享学习成果。

还不秃顶的计科生·2025-02-20 20:10

GPT (Generative Pre-trained Transformer)

GPT模型通过大规模无监督预训练，使用大量的文本数据进行学习，然后再进行微调（fine-tuning）来适应具体的下游任务。

彬彬侠·2025-02-20 19:07

Vision Transformer（ViT）：用 Transformer 颠覆图像识别

VisionTransformer（ViT）：用Transformer颠覆图像识别在计算机视觉领域，卷积神经网络（CNN）长期以来一直是图像识别任务的主流架构。

金外飞176·2025-02-20 19:36

HarmonyOS Next数据处理与模型训练优化

本文旨在深入探讨华为鸿蒙HarmonyOSNext系统（截止目前API12）中数据处理与模型训练优化相关技术细节，基于实际开发实践进行总结。

·2025-02-20 17:51

深度学习工厂的蓝图：拆解CUDA驱动、PyTorch与OpenCV的依赖关系

想象一下，你正在建造一座深度学习工厂，这座工厂专门用于高效处理深度学习任务（如训练神经网络）和计算机视觉任务（如图像处理）。

时光旅人01号·2025-02-20 17:46

图论篇--代码随想录算法训练营第五十七天打卡| 最小生成树问题

题目链接：53.寻宝（第七期模拟笔试）题目描述：在世界的某个区域，有一些分散的神秘岛屿，每个岛屿上都有一种珍稀的资源或者宝藏。国王打算在这些岛屿上建公路，方便运输。不同岛屿之间，路途距离不同，国王希望你可以规划建公路的方案，如何可以以最短的总公路距离将所有岛屿联通起来（注意：这是一个无向图）。给定一张地图，其中包括了所有的岛屿，以及它们之间的距离。以最小化公路建设长度，确保可以链接到所有岛屿。解题

無量空所·2025-02-20 17:09

DeepSeek-R1 技术全景解析：从原理到实践的“炼金术配方” ——附多阶段训练流程图与核心误区澄清...

合集-人工智能(5)1.如何改进AI模型在特定环境中的知识检索2024-09-242.深度学习与统计学中的时间序列预测2024-10-033.《使用coze搭建一个会搜索、写ppt、思维导图的Agent》2024-10-294.深入浅出：Agent如何调用工具——从OpenAIFunctionCall到CrewAI框架01-145.DeepSeek-R1技术全景解析：从原理到实践的“炼金术配方”—

雪停时偶遇一叶春·2025-02-20 16:02

YOLOv8 Pose使用RKNN进行推理

该模型在COCO关键点数据集上训练，适合多种姿势估计任务。二、ONNX推理1.首先需要先将Pytorch模型转换为Onnx模型，下载pt模型这里给出官方的权重下载地

い不靠譜︶朱Sir·2025-02-20 15:30

【自然语言处理|迁移学习-08】：中文语料完型填空

文章目录1中文语料完型填空任务介绍2数据集加载及处理3定义下游任务模型4模型训练5.模型测试1中文语料完型填空任务介绍任务介绍：完成中文语料完型填空完型填空是一个分类问题，[MASK]单词有21128种可能数据构建实现分析

爱学习不掉头发·2025-02-20 14:50

马斯克的Grok-3：技术突破与行业冲击的深度解析

一、技术架构与核心突破超大规模算力集群Grok-3基于xAI自研的Colossus超级计算机训练完成，搭载20万块英伟达H100GPU，累计消耗2亿GPU小时，算力投入是前代Grok-2的10倍48。

♢.＊·2025-02-20 14:15

BP 神经网络在考古数据分析中的应用

随后详细介绍了BP神经网络的结构、原理与训练算法。

fanxbl957·2025-02-20 13:42

图像识别与应用

图像识别作为人工智能领域的重要分支，近年来取得了显著进展，其中卷积神经网络（CNN）功不可没。

狂踹瘸子那条好脚·2025-02-20 13:10

动态蛇形卷积在YOLOv8中的探索与实践：提高目标识别与定位精度

的卷积改进2.1常规卷积与动态蛇形卷积的区别2.2动态蛇形卷积的实现原理2.3YOLOv8中集成动态蛇形卷积3.手把手实现动态蛇形卷积3.1安装依赖3.2设计动态蛇形卷积层3.3集成到YOLOv8中3.4训练与优化

向哆哆·2025-02-20 13:07

大模型（含deepseek r1）本地部署利器ollama的API操作指南

它支持多种预训练的大型语言模型（如LLaMA2、Mistral、Gemma、DeepSeek等），并提供了一个简单高效的方式来加载和使用这些模型。

·2025-02-20 13:41

DeepSeek与ChatGPT：AI语言模型的全面对决

以下从六大维度展开全面对比，为不同需求场景提供选择参考：一、核心技术对比维度DeepSeekChatGPT架构设计混合专家系统（MoE）+自研深度优化架构Transformer架构（GPT-3.5/4系列）训练策略万亿

金枝玉叶9·2025-02-20 12:01

DeepSeek和ChatGPT的全面对比

优化版本参数量级开放7B/35B/120B闭源175B+位置编码RoPE+NTK扩展ALiBiAttention机制FlashAttention-3FlashAttention-2激活函数SwiGLUProGeGLU训练框架

陈皮话梅糖@·2025-02-20 12:00

线性回归理论

线性回归的核心思想是通过训练数据来学习参数，使得模型的预测值与真实值之间的差异最小化。在神经网络中，线性回归可以看作是一个单层神经网络。通过损失函数来衡量预测值与真实值之间的差异，常用的损失函数包

狂踹瘸子那条好脚·2025-02-20 11:21

基于python深度学习遥感影像地物分类与目标识别、分割实践技术应用

专题一：深度学习发展与机器学习深度学习的历史发展过程机器学习，深度学习等任务的基本处理流程梯度下降算法讲解不同初始化，学习率对梯度下降算法的实例分析从机器学习到深度学习算法专题二深度卷积网络、卷积神经网络

xiao5kou4chang6kai4·2025-02-20 11:20

muzero 算法原理

Muzero算法通过不断地训练模型和策略网络，来提高它们的准确性，从而使得机器学到了如何玩游

战神哥·2025-02-20 11:45

SAT-3D饮食行为训练系统在营养教学中的应用心得体会

在营养学领域的探索之旅中，我有幸深入接触并实践了SAT-3D膳食诊断和饮食行为训练系统（以下简称SAT-3D系统，研制单位：上海共荣医学科技有限公司），这一经历不仅极大地拓宽了我的专业视野，也让我在营养实训教学上获得了前所未有的启示与感悟

上海GR·2025-02-20 10:08

基于Kitti数据集实现MMDetection3D点云物体检测训练

DataBall助力快速掌握数据集的信息和使用方式，会员享有百种数据集，持续增加中。需要更多数据资源和技术解决方案，知识星球：“DataBall-X数据球(free)”贵在坚持！-----------------------------------------------------------------------------------------------MMDetection3D环境安

Xian-HHappy·2025-02-20 09:02

AI服务器散热黑科技：让芯片“冷静”提速

以GPT-4的训练为例，它需要大量的GPU

小深ai硬件分享·2025-02-20 09:29

如果MLlib 中没有所需要的模型，如何使用 Spark 进行分布式训练？

如果MLlib中没有你所需要的模型，并且不打算结合更强大的框架（如TensorFlowOnSpark或Horovod），仍然可以使用Spark进行分布式训练，但需要手动处理训练任务的分配、数据准备、模型训练

是纯一呀·2025-02-20 08:57

使用BLIP模型生成图像描述的可查询索引

在本篇文章中，我们将介绍如何使用预训练的SalesforceBLIP图像描述模型，生成一个可查询的图像描述索引。我们将使用ImageCaptionLoader来加载图像，并通过一系列步骤生成查询索引。

dgay_hua·2025-02-20 08:24

卷积神经网络之AlexNet经典神经网络，实现手写数字0~9识别

深度学习中较为常见的神经网络模型AlexNet，AlexNet是一个采用GPU训练的深层CNN，本质是种LeNet变体。由特征提取层的5个卷积层两个下采样层和分类器中的三个全连接层构成。

知识鱼丸·2025-02-20 08:24

DeepSeek掀起推理服务器新风暴，AI应用迎来变革转折点？

其发展分数据收集整理、模型训练、推理应用三个阶段，过去重模型训练，如今大量预训练模型出现，如何高效应用成新挑战，推理服务器应运而生。

小深ai硬件分享·2025-02-20 08:20

用 TensorFlow 搭建简单的手写数字识别模型

TensorFlow是一个强大的开源机器学习框架，由Google开发并维护，它提供了丰富的工具和接口，能帮助我们快速搭建和训练深度学习模型。

lozhyf·2025-02-20 07:48

深入解析：Tableau在数据可视化中的高级应用

数据预

Echo_Wish·2025-02-20 07:18

【拥抱AI】一文讲清楚MCP(Model Context Protocol)核心功能及应用

MCP的主要功能包括数据集成、工具集成、模板化交互、安全性、开发者支持、预构建服务器和上下文维护。它通过客户端-服务器架构，支持多个服务连接到任何兼容的客户端，

奔跑草-·2025-02-20 06:08

华为的云端训练算力与迭代效率

华为云、云端训练、算力、迭代效率、人工智能、深度学习、模型训练、分布式训练、优化算法1.背景介绍人工智能（AI）技术近年来发展迅速，深度学习作为其核心驱动力，在图像识别、自然语言处理、语音识别等领域取得了突破性进展

AI大模型应用之禅·2025-02-20 05:34

使用Yuan 2.0与LangChain构建智能聊天应用：完整指南

相比之前的Yuan1.0，Yuan2.0使用了更广泛的高质量预训练数据，并通过指令微调数据集增强了模型的语义理解、数学推理、编程知识等能力。

scaFHIO·2025-02-20 05:33

训练与优化

训练与优化损失函数与反向传播损失函数能够衡量神经网络输出与目标值之间的误差，同时为反向传播提供依据，计算梯度来优化网络中的参数。torch.nn.L1Loss计算所有预测值与真实值之间的绝对差。

钰见梵星·2025-02-20 04:23

Pytorch实现之利用特征分布的差异来指导GAN的训练

简介简介：FIDGAN通过将FID损失引入GAN的训练过程，显著提升了生成图像的质量。其核心思想是利用特征分布的差异来指导生成器的训练，同时通过使用轻量级的MobileNet-v3提高了计算效率。

这张生成的图像能检测吗·2025-02-20 04:47

使用LangChain与Clarifai模型进行交互

在现代AI应用开发中，Clarifai提供了一个完整的AI生命周期管理平台，包括数据探索、数据标注、模型训练、评估和推理。本文将探讨如何使用LangChain库与Clarifai的模型进行交互。

vaidfl·2025-02-20 02:06

【深度学习pytorch-93】Transformer 相比 RNN 的优势

这意味着，在训练

华东算法王·2025-02-20 02:04

吐血整理！权重持久化方案优化，让你的模型性能飙升

权重持久化方案优化，让你的模型性能飙升引言你是否在做深度学习项目时，遭遇过模型训练结果无法有效保存，导致之前的努力付诸东流的痛苦？又或者在模型权重持久化时，发现保存和加载的速度极慢，严重影响项目进度？

盼达思文体科创·2025-02-20 01:57

训练时数据增强策略调整，让模型性能飙升

训练时数据增强策略调整，让模型性能飙升引言你是否遇到过模型训练效果不佳，明明投入了大量数据，可模型的准确率、泛化能力就是提不上去？其实啊，很多时候问题就出在数据增强策略上。

盼达思文体科创·2025-02-20 01:26

模型版本回滚机制支持，让你的模型训练不再走弯路

模型版本回滚机制支持，让你的模型训练不再走弯路引言你是否遇到过模型训练过程中，因为一个小失误导致之前的努力白费，只能从头再来的糟心事？为什么辛辛苦苦训练出来的模型，突然效果变差，却找不到问题所在？

盼达思文体科创·2025-02-20 01:26

吐血整理！模型热加载能力大比拼，谁才是真正王者？

当你训练出了一个新的、性能更好的模型时，如果不能进行热加

盼达思文体科创·2025-02-20 01:56

吐血整理！过拟合抑制策略调整方法大揭秘，让模型性能飙升

过拟合抑制策略调整方法大揭秘，让模型性能飙升引言你是否遇到过模型在训练集上表现完美，可一到测试集就“原形毕露”的糟心情况？为啥模型训练得好好的，实际应用时却差强人意呢？这其实就是过拟合在捣乱！

盼达思文体科创·2025-02-20 01:56

梯度累积和优化器配置差异，让模型训练效果天差地别！

梯度累积和优化器配置差异，让模型训练效果天差地别！引言你是否还在为模型训练效果不佳而苦恼？明明花费了大量时间和精力，模型的性能却始终无法达到预期。其实，很多时候问题可能就出在梯度累积和优化器配置上。

盼达思文体科创·2025-02-20 01:26

还在为模型权重共享效率发愁？模型权重共享策略优化让效果飙升

模型权重共享策略优化让效果飙升引言你是否在进行模型训练时，常常被漫长的训练时间和巨大的计算资源消耗搞得焦头烂额？为什么明明使用了模型权重共享策略，却还是达不到理想的训练效果和效率？

盼达思文体科创·2025-02-20 01:26

模型保存、训练与验证

模型保存、训练与验证网络模型的保存与读取在PyTorch中，模型的保存与加载有两种主要方式：保存&加载完整模型（包括网络结构和参数）只保存&加载模型参数（推荐方式）可以直接跳过看最后几行。

钰见梵星·2025-02-20 00:21

python中的深度学习框架TensorFlow 和 PyTorch 有什么区别？

这使得TensorFlow在大规模分布式训练和部署时具有优势，但调试和动态修改模型时可能不够灵活。功能全面：TensorFlow提

大懒猫软件·2025-02-20 00:51

人工智能与机器学习入门：决策树应用

尝试使用决策树模型来训练数据，并进行test数据集的测试。什么是决策树决策树，简单来讲可以认为是一个大的ifelse判断树，有了决策树后，测试集中的数据便可以使用该决策树进行判断了。

·2025-02-20 00:24

深度学习torch之19种优化算法（optimizer）解析

Adam、AdamW、NAdam、RAdam以及SparseAdam等，通过对这些算法的公式和参数说明进行详细解析，博客旨在为机器学习工程师和研究人员提供清晰的理论指导，帮助读者选择合适的优化算法提升模型训练效率

@Mr_LiuYang·2025-02-19 23:06

DeepSeek 本地部署硬件配置全解析

而且它可“省钱”了，预训练费用还不到OpenAIGPT-4o模型的十

喜-喜·2025-02-19 23:34

GPU通信革命：跨平面网络效率提升300%的秘密武器

技术解析：突破AI算力瓶颈的底层创新1.技术背景：终结多平面网络CPU中转困境传统多平面网络中，跨平面GPU通信必须经过CPU内存拷贝，导致两大痛点：20-30%的通信带宽浪费在CPU中转环节大规模集群训练时

CodePatentMaster·2025-02-19 22:27

自然语言处理NLP 01语言转换&语言模型

（FeatureExtraction）(1)词袋模型（BagofWords,BoW）(2)TF-IDF(3)词嵌入（WordEmbedding）3.模型输入（ModelInput）(1)序列编码(2)预训练模型输入

伊一大数据&人工智能学习日志·2025-02-19 22:56

常用的高性能计算工具有哪些

无论是模拟宇宙的起源、设计新型航空器，还是训练复杂的人工智能模型，HPC都扮演着不可或缺的角色。本文将深入探讨高性能计算的定义、其背后的强大工具，以及它们如何助力各领域的突破性发展。

这题有点难度·2025-02-19 21:24

推荐频道

预训练卷积神经网络

第26篇：pFedLoRA: Model-Heterogeneous Personalized Federated Learning with LoRA使用lora微调的模型异构个性化联邦学习

GPT (Generative Pre-trained Transformer)

Vision Transformer（ViT）：用 Transformer 颠覆图像识别

HarmonyOS Next数据处理与模型训练优化

深度学习工厂的蓝图：拆解CUDA驱动、PyTorch与OpenCV的依赖关系

图论篇--代码随想录算法训练营第五十七天打卡| 最小生成树问题

DeepSeek-R1 技术全景解析：从原理到实践的“炼金术配方” ——附多阶段训练流程图与核心误区澄清...

YOLOv8 Pose使用RKNN进行推理

【自然语言处理|迁移学习-08】：中文语料完型填空

马斯克的Grok-3：技术突破与行业冲击的深度解析

BP 神经网络在考古数据分析中的应用

图像识别与应用

动态蛇形卷积在YOLOv8中的探索与实践：提高目标识别与定位精度

大模型（含deepseek r1）本地部署利器ollama的API操作指南

DeepSeek与ChatGPT：AI语言模型的全面对决

DeepSeek和ChatGPT的全面对比

线性回归理论

基于python深度学习遥感影像地物分类与目标识别、分割实践技术应用

muzero 算法原理

SAT-3D饮食行为训练系统在营养教学中的应用心得体会

基于Kitti数据集实现MMDetection3D点云物体检测训练

AI服务器散热黑科技：让芯片“冷静”提速

如果MLlib 中没有所需要的模型，如何使用 Spark 进行分布式训练？

使用BLIP模型生成图像描述的可查询索引

卷积神经网络之AlexNet经典神经网络，实现手写数字0~9识别

DeepSeek掀起推理服务器新风暴，AI应用迎来变革转折点？

用 TensorFlow 搭建简单的手写数字识别模型

深入解析：Tableau在数据可视化中的高级应用

【拥抱AI】一文讲清楚MCP(Model Context Protocol)核心功能及应用

华为的云端训练算力与迭代效率

使用Yuan 2.0与LangChain构建智能聊天应用：完整指南

训练与优化

Pytorch实现之利用特征分布的差异来指导GAN的训练

使用LangChain与Clarifai模型进行交互

【深度学习pytorch-93】Transformer 相比 RNN 的优势

吐血整理！权重持久化方案优化，让你的模型性能飙升

训练时数据增强策略调整，让模型性能飙升

模型版本回滚机制支持，让你的模型训练不再走弯路

吐血整理！模型热加载能力大比拼，谁才是真正王者？

吐血整理！过拟合抑制策略调整方法大揭秘，让模型性能飙升

梯度累积和优化器配置差异，让模型训练效果天差地别！

还在为模型权重共享效率发愁？模型权重共享策略优化让效果飙升

模型保存、训练与验证

python中的深度学习框架TensorFlow 和 PyTorch 有什么区别？

人工智能与机器学习入门：决策树应用

深度学习torch之19种优化算法（optimizer）解析

DeepSeek 本地部署硬件配置全解析

GPU通信革命：跨平面网络效率提升300%的秘密武器

自然语言处理NLP 01语言转换&语言模型

常用的高性能计算工具有哪些