E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
预训练卷积神经网络
第26篇:pFedLoRA: Model-Heterogeneous Personalized Federated Learning with LoRA使用lora微调的模型异构个性化联邦学习
第一部分:解决的问题联邦学习(FederatedLearning,FL)是一种分布式机器学习方法,允许客户端在本地数据上
训练
模型,同时通过中心服务器共享学习成果。
还不秃顶的计科生
·
2025-02-20 20:10
联邦学习
深度学习
人工智能
开发语言
GPT (Generative Pre-trained Transformer)
GPT模型通过大规模无监督
预
训练
,使用大量的文本数据进行学习,然后再进行微调(fine-tuning)来适应具体的下游任务。
彬彬侠
·
2025-02-20 19:07
自然语言处理
gpt
transformer
预训练
NLP
自然语言处理
Vision Transformer(ViT):用 Transformer 颠覆图像识别
VisionTransformer(ViT):用Transformer颠覆图像识别在计算机视觉领域,
卷积神经网络
(CNN)长期以来一直是图像识别任务的主流架构。
金外飞176
·
2025-02-20 19:36
论文精读
transformer
深度学习
人工智能
HarmonyOS Next数据处理与模型
训练
优化
本文旨在深入探讨华为鸿蒙HarmonyOSNext系统(截止目前API12)中数据处理与模型
训练
优化相关技术细节,基于实际开发实践进行总结。
·
2025-02-20 17:51
harmonyos
深度学习工厂的蓝图:拆解CUDA驱动、PyTorch与OpenCV的依赖关系
想象一下,你正在建造一座深度学习工厂,这座工厂专门用于高效处理深度学习任务(如
训练
神经网络)和计算机视觉任务(如图像处理)。
时光旅人01号
·
2025-02-20 17:46
深度学习
pytorch
opencv
图论篇--代码随想录算法
训练
营第五十七天打卡| 最小生成树问题
题目链接:53.寻宝(第七期模拟笔试)题目描述:在世界的某个区域,有一些分散的神秘岛屿,每个岛屿上都有一种珍稀的资源或者宝藏。国王打算在这些岛屿上建公路,方便运输。不同岛屿之间,路途距离不同,国王希望你可以规划建公路的方案,如何可以以最短的总公路距离将所有岛屿联通起来(注意:这是一个无向图)。给定一张地图,其中包括了所有的岛屿,以及它们之间的距离。以最小化公路建设长度,确保可以链接到所有岛屿。解题
無量空所
·
2025-02-20 17:09
leetcode
算法
图论
数据结构
c++
学习
DeepSeek-R1 技术全景解析:从原理到实践的“炼金术配方” ——附多阶段
训练
流程图与核心误区澄清...
合集-人工智能(5)1.如何改进AI模型在特定环境中的知识检索2024-09-242.深度学习与统计学中的时间序列预测2024-10-033.《使用coze搭建一个会搜索、写ppt、思维导图的Agent》2024-10-294.深入浅出:Agent如何调用工具——从OpenAIFunctionCall到CrewAI框架01-145.DeepSeek-R1技术全景解析:从原理到实践的“炼金术配方”—
雪停时偶遇一叶春
·
2025-02-20 16:02
流程图
YOLOv8 Pose使用RKNN进行推理
该模型在COCO关键点数据集上
训练
,适合多种姿势估计任务。二、ONNX推理1.首先需要先将Pytorch模型转换为Onnx模型,下载pt模型这里给出官方的权重下载地
い不靠譜︶朱Sir
·
2025-02-20 15:30
实用项目部署
YOLO
人工智能
python
linux
pip
【自然语言处理|迁移学习-08】:中文语料完型填空
文章目录1中文语料完型填空任务介绍2数据集加载及处理3定义下游任务模型4模型
训练
5.模型测试1中文语料完型填空任务介绍任务介绍:完成中文语料完型填空完型填空是一个分类问题,[MASK]单词有21128种可能数据构建实现分析
爱学习不掉头发
·
2025-02-20 14:50
深度学习
自然语言处理(NLP)
自然语言处理
迁移学习
人工智能
马斯克的Grok-3:技术突破与行业冲击的深度解析
一、技术架构与核心突破超大规模算力集群Grok-3基于xAI自研的Colossus超级计算机
训练
完成,搭载20万块英伟达H100GPU,累计消耗2亿GPU小时,算力投入是前代Grok-2的10倍48。
♢.*
·
2025-02-20 14:15
马斯克
人工智能
大模型
xAI
Grok
3
BP 神经网络在考古数据分析中的应用
随后详细介绍了BP神经网络的结构、原理与
训练
算法。
fanxbl957
·
2025-02-20 13:42
人工智能理论与实践
神经网络
数据分析
人工智能
图像识别与应用
图像识别作为人工智能领域的重要分支,近年来取得了显著进展,其中
卷积神经网络
(CNN)功不可没。
狂踹瘸子那条好脚
·
2025-02-20 13:10
python
动态蛇形卷积在YOLOv8中的探索与实践:提高目标识别与定位精度
的卷积改进2.1常规卷积与动态蛇形卷积的区别2.2动态蛇形卷积的实现原理2.3YOLOv8中集成动态蛇形卷积3.手把手实现动态蛇形卷积3.1安装依赖3.2设计动态蛇形卷积层3.3集成到YOLOv8中3.4
训练
与优化
向哆哆
·
2025-02-20 13:07
YOLO
目标跟踪
深度学习
YOLOv8
大模型(含deepseek r1)本地部署利器ollama的API操作指南
它支持多种
预
训练
的大型语言模型(如LLaMA2、Mistral、Gemma、DeepSeek等),并提供了一个简单高效的方式来加载和使用这些模型。
·
2025-02-20 13:41
人工智能llm
DeepSeek与ChatGPT:AI语言模型的全面对决
以下从六大维度展开全面对比,为不同需求场景提供选择参考:一、核心技术对比维度DeepSeekChatGPT架构设计混合专家系统(MoE)+自研深度优化架构Transformer架构(GPT-3.5/4系列)
训练
策略万亿
金枝玉叶9
·
2025-02-20 12:01
程序员知识储备1
程序员知识储备2
程序员知识储备3
chatgpt
人工智能
语言模型
DeepSeek和ChatGPT的全面对比
优化版本参数量级开放7B/35B/120B闭源175B+位置编码RoPE+NTK扩展ALiBiAttention机制FlashAttention-3FlashAttention-2激活函数SwiGLUProGeGLU
训练
框架
陈皮话梅糖@
·
2025-02-20 12:00
AI编程
线性回归理论
线性回归的核心思想是通过
训练
数据来学习参数,使得模型的预测值与真实值之间的差异最小化。在神经网络中,线性回归可以看作是一个单层神经网络。通过损失函数来衡量预测值与真实值之间的差异,常用的损失函数包
狂踹瘸子那条好脚
·
2025-02-20 11:21
python
基于python深度学习遥感影像地物分类与目标识别、分割实践技术应用
专题一:深度学习发展与机器学习深度学习的历史发展过程机器学习,深度学习等任务的基本处理流程梯度下降算法讲解不同初始化,学习率对梯度下降算法的实例分析从机器学习到深度学习算法专题二深度卷积网络、
卷积神经网络
xiao5kou4chang6kai4
·
2025-02-20 11:20
深度学习
遥感
勘测
python
深度学习
分类
muzero 算法原理
Muzero算法通过不断地
训练
模型和策略网络,来提高它们的准确性,从而使得机器学到了如何玩游
战神哥
·
2025-02-20 11:45
SAT-3D饮食行为
训练
系统在营养教学中的应用心得体会
在营养学领域的探索之旅中,我有幸深入接触并实践了SAT-3D膳食诊断和饮食行为
训练
系统(以下简称SAT-3D系统,研制单位:上海共荣医学科技有限公司),这一经历不仅极大地拓宽了我的专业视野,也让我在营养实训教学上获得了前所未有的启示与感悟
上海GR
·
2025-02-20 10:08
经验分享
基于Kitti数据集实现MMDetection3D点云物体检测
训练
DataBall助力快速掌握数据集的信息和使用方式,会员享有百种数据集,持续增加中。需要更多数据资源和技术解决方案,知识星球:“DataBall-X数据球(free)”贵在坚持!-----------------------------------------------------------------------------------------------MMDetection3D环境安
Xian-HHappy
·
2025-02-20 09:02
技术知识点
kitti三维点云
无人驾驶
MMDetection3D
人工智能
计算机视觉
目标检测
AI服务器散热黑科技:让芯片“冷静”提速
以GPT-4的
训练
为例,它需要大量的GPU
小深ai硬件分享
·
2025-02-20 09:29
人工智能
深度学习
服务器
如果MLlib 中没有所需要的模型,如何使用 Spark 进行分布式
训练
?
如果MLlib中没有你所需要的模型,并且不打算结合更强大的框架(如TensorFlowOnSpark或Horovod),仍然可以使用Spark进行分布式
训练
,但需要手动处理
训练
任务的分配、数据准备、模型
训练
是纯一呀
·
2025-02-20 08:57
WSL
Docker
AI
spark
分布式
mllib
使用BLIP模型生成图像描述的可查询索引
在本篇文章中,我们将介绍如何使用
预
训练
的SalesforceBLIP图像描述模型,生成一个可查询的图像描述索引。我们将使用ImageCaptionLoader来加载图像,并通过一系列步骤生成查询索引。
dgay_hua
·
2025-02-20 08:24
python
计算机视觉
开发语言
卷积神经网络
之AlexNet经典神经网络,实现手写数字0~9识别
深度学习中较为常见的神经网络模型AlexNet,AlexNet是一个采用GPU
训练
的深层CNN,本质是种LeNet变体。由特征提取层的5个卷积层两个下采样层和分类器中的三个全连接层构成。
知识鱼丸
·
2025-02-20 08:24
深度学习
神经网络
cnn
人工智能
深度学习
AlexNet
经典神经网络
DeepSeek掀起推理服务器新风暴,AI应用迎来变革转折点?
其发展分数据收集整理、模型
训练
、推理应用三个阶段,过去重模型
训练
,如今大量
预
训练
模型出现,如何高效应用成新挑战,推理服务器应运而生。
小深ai硬件分享
·
2025-02-20 08:20
人工智能
大数据
用 TensorFlow 搭建简单的手写数字识别模型
TensorFlow是一个强大的开源机器学习框架,由Google开发并维护,它提供了丰富的工具和接口,能帮助我们快速搭建和
训练
深度学习模型。
lozhyf
·
2025-02-20 07:48
工作
面试
学习
tensorflow
人工智能
python
深入解析:Tableau在数据可视化中的高级应用
数据
预
Echo_Wish
·
2025-02-20 07:18
实战高阶大数据
信息可视化
数据分析
数据挖掘
【拥抱AI】一文讲清楚MCP(Model Context Protocol)核心功能及应用
MCP的主要功能包括数据集成、工具集成、模板化交互、安全性、开发者支持、
预
构建服务器和上下文维护。它通过客户端-服务器架构,支持多个服务连接到任何兼容的客户端,
奔跑草-
·
2025-02-20 06:08
人工智能
人工智能
LLM
自然语言处理
MCP
Function
call
华为的云端
训练
算力与迭代效率
华为云、云端
训练
、算力、迭代效率、人工智能、深度学习、模型
训练
、分布式
训练
、优化算法1.背景介绍人工智能(AI)技术近年来发展迅速,深度学习作为其核心驱动力,在图像识别、自然语言处理、语音识别等领域取得了突破性进展
AI大模型应用之禅
·
2025-02-20 05:34
DeepSeek
R1
&
AI大模型与大数据
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
使用Yuan 2.0与LangChain构建智能聊天应用:完整指南
相比之前的Yuan1.0,Yuan2.0使用了更广泛的高质量
预
训练
数据,并通过指令微调数据集增强了模型的语义理解、数学推理、编程知识等能力。
scaFHIO
·
2025-02-20 05:33
langchain
python
训练
与优化
训练
与优化损失函数与反向传播损失函数能够衡量神经网络输出与目标值之间的误差,同时为反向传播提供依据,计算梯度来优化网络中的参数。torch.nn.L1Loss计算所有预测值与真实值之间的绝对差。
钰见梵星
·
2025-02-20 04:23
小土堆PyTorch深度学习
深度学习
pytorch
人工智能
Pytorch实现之利用特征分布的差异来指导GAN的
训练
简介简介:FIDGAN通过将FID损失引入GAN的
训练
过程,显著提升了生成图像的质量。其核心思想是利用特征分布的差异来指导生成器的
训练
,同时通过使用轻量级的MobileNet-v3提高了计算效率。
这张生成的图像能检测吗
·
2025-02-20 04:47
优质GAN模型训练自己的数据集
GAN系列
pytorch
生成对抗网络
人工智能
神经网络
深度学习
计算机视觉
机器学习
使用LangChain与Clarifai模型进行交互
在现代AI应用开发中,Clarifai提供了一个完整的AI生命周期管理平台,包括数据探索、数据标注、模型
训练
、评估和推理。本文将探讨如何使用LangChain库与Clarifai的模型进行交互。
vaidfl
·
2025-02-20 02:06
langchain
交互
python
【深度学习pytorch-93】Transformer 相比 RNN 的优势
这意味着,在
训练
华东算法王
·
2025-02-20 02:04
DL-pytorch
深度学习
pytorch
transformer
吐血整理!权重持久化方案优化,让你的模型性能飙升
权重持久化方案优化,让你的模型性能飙升引言你是否在做深度学习项目时,遭遇过模型
训练
结果无法有效保存,导致之前的努力付诸东流的痛苦?又或者在模型权重持久化时,发现保存和加载的速度极慢,严重影响项目进度?
盼达思文体科创
·
2025-02-20 01:57
经验分享
训练
时数据增强策略调整,让模型性能飙升
训练
时数据增强策略调整,让模型性能飙升引言你是否遇到过模型
训练
效果不佳,明明投入了大量数据,可模型的准确率、泛化能力就是提不上去?其实啊,很多时候问题就出在数据增强策略上。
盼达思文体科创
·
2025-02-20 01:26
经验分享
模型版本回滚机制支持,让你的模型
训练
不再走弯路
模型版本回滚机制支持,让你的模型
训练
不再走弯路引言你是否遇到过模型
训练
过程中,因为一个小失误导致之前的努力白费,只能从头再来的糟心事?为什么辛辛苦苦
训练
出来的模型,突然效果变差,却找不到问题所在?
盼达思文体科创
·
2025-02-20 01:26
经验分享
吐血整理!模型热加载能力大比拼,谁才是真正王者?
当你
训练
出了一个新的、性能更好的模型时,如果不能进行热加
盼达思文体科创
·
2025-02-20 01:56
经验分享
吐血整理!过拟合抑制策略调整方法大揭秘,让模型性能飙升
过拟合抑制策略调整方法大揭秘,让模型性能飙升引言你是否遇到过模型在
训练
集上表现完美,可一到测试集就“原形毕露”的糟心情况?为啥模型
训练
得好好的,实际应用时却差强人意呢?这其实就是过拟合在捣乱!
盼达思文体科创
·
2025-02-20 01:56
经验分享
梯度累积和优化器配置差异,让模型
训练
效果天差地别!
梯度累积和优化器配置差异,让模型
训练
效果天差地别!引言你是否还在为模型
训练
效果不佳而苦恼?明明花费了大量时间和精力,模型的性能却始终无法达到预期。其实,很多时候问题可能就出在梯度累积和优化器配置上。
盼达思文体科创
·
2025-02-20 01:26
经验分享
还在为模型权重共享效率发愁?模型权重共享策略优化让效果飙升
模型权重共享策略优化让效果飙升引言你是否在进行模型
训练
时,常常被漫长的
训练
时间和巨大的计算资源消耗搞得焦头烂额?为什么明明使用了模型权重共享策略,却还是达不到理想的
训练
效果和效率?
盼达思文体科创
·
2025-02-20 01:26
经验分享
模型保存、
训练
与验证
模型保存、
训练
与验证网络模型的保存与读取在PyTorch中,模型的保存与加载有两种主要方式:保存&加载完整模型(包括网络结构和参数)只保存&加载模型参数(推荐方式)可以直接跳过看最后几行。
钰见梵星
·
2025-02-20 00:21
小土堆PyTorch深度学习
深度学习
人工智能
python中的深度学习框架TensorFlow 和 PyTorch 有什么区别?
这使得TensorFlow在大规模分布式
训练
和部署时具有优势,但调试和动态修改模型时可能不够灵活。功能全面:TensorFlow提
大懒猫软件
·
2025-02-20 00:51
python
深度学习
tensorflow
pytorch
人工智能与机器学习入门:决策树应用
尝试使用决策树模型来
训练
数据,并进行test数据集的测试。什么是决策树决策树,简单来讲可以认为是一个大的ifelse判断树,有了决策树后,测试集中的数据便可以使用该决策树进行判断了。
·
2025-02-20 00:24
决策树机器学习入门
深度学习torch之19种优化算法(optimizer)解析
Adam、AdamW、NAdam、RAdam以及SparseAdam等,通过对这些算法的公式和参数说明进行详细解析,博客旨在为机器学习工程师和研究人员提供清晰的理论指导,帮助读者选择合适的优化算法提升模型
训练
效率
@Mr_LiuYang
·
2025-02-19 23:06
论文阅读
深度学习
optimizer
Adam
学习率调整
优化算法
DeepSeek 本地部署硬件配置全解析
而且它可“省钱”了,
预
训练
费用还不到OpenAIGPT-4o模型的十
喜-喜
·
2025-02-19 23:34
人工智能
深度学习
DeepSeek配置要求
GPU通信革命:跨平面网络效率提升300%的秘密武器
技术解析:突破AI算力瓶颈的底层创新1.技术背景:终结多平面网络CPU中转困境传统多平面网络中,跨平面GPU通信必须经过CPU内存拷贝,导致两大痛点:20-30%的通信带宽浪费在CPU中转环节大规模集群
训练
时
CodePatentMaster
·
2025-02-19 22:27
人工智能
深度学习
机器学习
自然语言处理
微服务
服务器
AIGC
自然语言处理NLP 01语言转换&语言模型
(FeatureExtraction)(1)词袋模型(BagofWords,BoW)(2)TF-IDF(3)词嵌入(WordEmbedding)3.模型输入(ModelInput)(1)序列编码(2)
预
训练
模型输入
伊一大数据&人工智能学习日志
·
2025-02-19 22:56
自然语言处理
自然语言处理
人工智能
语言模型
nlp
机器学习
深度学习
常用的高性能计算工具有哪些
无论是模拟宇宙的起源、设计新型航空器,还是
训练
复杂的人工智能模型,HPC都扮演着不可或缺的角色。本文将深入探讨高性能计算的定义、其背后的强大工具,以及它们如何助力各领域的突破性发展。
这题有点难度
·
2025-02-19 21:24
人工智能
学习
上一页
23
24
25
26
27
28
29
30
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他