E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
cnn注意力机制
Transformer 模型架构
以下是详细解释:1.架构vs框架的区别概念定义示例模型架构定义神经网络的结构设计Transformer、
CNN
、RNN开发框架提供实现模型的工具和库PyTorch、TensorFlow2.Transformer
2401_89793006
·
2025-02-20 15:24
热门话题
transformer
深度学习
人工智能
图像识别与应用
图像识别作为人工智能领域的重要分支,近年来取得了显著进展,其中卷积神经网络(
CNN
)功不可没。
狂踹瘸子那条好脚
·
2025-02-20 13:10
python
Mamba超绝创新!搭上异常检测准确率99%+!一区秒了!
以往的异常检测方法,以基于
CNN
、Transformer为主。但
CNN
在处理长距离依赖性方面存在困难,Transformer虽然表现出色,但由于其自
注意力机制
,计算复杂度较高。
人工智能学起来
·
2025-02-20 13:10
人工智能
深度学习
基于python深度学习遥感影像地物分类与目标识别、分割实践技术应用
深度学习等任务的基本处理流程梯度下降算法讲解不同初始化,学习率对梯度下降算法的实例分析从机器学习到深度学习算法专题二深度卷积网络、卷积神经网络、卷积运算的基本原理池化操作,全连接层,以及分类器的作用BP反向传播算法的理解一个简单
CNN
xiao5kou4chang6kai4
·
2025-02-20 11:20
深度学习
遥感
勘测
python
深度学习
分类
卷积神经网络之AlexNet经典神经网络,实现手写数字0~9识别
深度学习中较为常见的神经网络模型AlexNet,AlexNet是一个采用GPU训练的深层
CNN
,本质是种LeNet变体。由特征提取层的5个卷积层两个下采样层和分类器中的三个全连接层构成。
知识鱼丸
·
2025-02-20 08:24
深度学习
神经网络
cnn
人工智能
深度学习
AlexNet
经典神经网络
【机器学习】基于3D
CNN
通过CT图像分类预测肺炎
1.引言1.1.研究背景在医学诊断中,医生通过分析CT影像来预测疾病时,面临一些挑战和局限性:图像信息的广度与复杂性:CT扫描生成的大量图像对医生来说既是信息的宝库也是处理上的负担。每组CT数据可能包含数百张切片,医生必须迅速审阅这些图像,以便捕捉到病变的微小细节。这种庞大的信息量要求医生在有限的时间内做出精准诊断,但同时也增加了漏诊或误诊的风险。部分容积效应也可能模糊小病变的边界,使得准确诊断变
MUKAMO
·
2025-02-20 07:43
AI
Python应用
机器学习
深度学习
人工智能
神经网络
3D
CNN
从代码到专利:如何用自
注意力机制
实现高效序列转换?——深度解析Google的Transformer架构
US201816021971A,ATTENTION-BASEDSEQUENCETRANSDUCTIONNEURALNETWORKS一、技术问题:为什么需要自
注意力机制
?
CodePatentMaster
·
2025-02-19 21:53
transformer
深度学习
人工智能
AIGC
架构
【深度学习】计算机视觉(CV)-目标检测-DETR(DEtection TRansformer)—— 基于 Transformer 的端到端目标检测
DETR(DEtectionTRansformer)是FacebookAI(FAIR)于2020年提出的端到端目标检测算法,它基于Transformer架构,消除了FasterR-
CNN
、YOLO等方法中的候选框
IT古董
·
2025-02-19 16:12
深度学习
人工智能
深度学习
计算机视觉
目标检测
遥感影像目标检测:从
CNN
(Faster-R
CNN
)到Transformer(DETR)
我国高分辨率对地观测系统重大专项已全面启动,高空间、高光谱、高时间分辨率和宽地面覆盖于一体的全球天空地一体化立体对地观测网逐步形成,将成为保障国家安全的基础性和战略性资源。未来10年全球每天获取的观测数据将超过10PB,遥感大数据时代已然来临。一:深度卷积网络知识1.深度学习在遥感图像识别中的范式和问题2.深度学习的历史发展历程3.机器学习,深度学习等任务的基本处理流程4.卷积神经网络的基本原理5
岁月如歌,青春不败
·
2025-02-19 15:05
生态遥感
目标检测
cnn
transformer
遥感
遥感影像
RadioTransformer:用于视觉注意力引导疾病分类的级联全局焦点Transformer
但即使是那些依赖
注意力机制
的框架,也不会利用这种丰富的领域信息来进行诊断。RadioTransformer通过学习放射科医生的视觉搜索模式,在级联的全局焦点Transfo
托比-马奎尔
·
2025-02-19 14:24
医学图像处理
Transformer变形
transformer
深度学习
人工智能
医学顶会 MICCAI‘24 | COVID19 至肺炎:使用
CNN
Transformer 位置感知特征编码网络对多区域肺部严重程度进行分类
本文内容只为星球内部成员学习和学术交流,请勿用作他用论文信息题目:COVID19toPneumonia:MultiRegionLungSeverityClassificationusing
CNN
TransformerPosition-AwareFeatureEncodingNetworkCOVID19
小白学视觉
·
2025-02-19 14:24
医学图像处理论文解读
cnn
transformer
分类
深度学习
医学图像处理
医学图像顶会
论文解读
DeepSeek与ChatGPT:AI语言模型的全面对决
以下从多个维度对两者进行对比分析:一、技术路线与核心优势DeepSeek:算法创新与成本优化混合专家模型(MoE)与MLA技术:DeepSeek采用混合专家模型框架,通过动态选择专家模型处理复杂任务,结合多头潜在
注意力机制
芯作者
·
2025-02-19 08:38
DD:日记
人工智能
自然语言处理
用deepseek学大模型08-卷积神经网络(
CNN
)
yuanbao.tencent.com从入门到精通卷积神经网络(
CNN
),着重介绍的目标函数,损失函数,梯度下降标量和矩阵形式的数学推导,pytorch真实能跑的代码案例以及模型,数据,预测结果的可视化展示
wyg_031113
·
2025-02-19 07:30
机器学习
人工智能
Python 用pytorch从头写Transformer源码,一行一解释;机器翻译实例代码;Transformer源码解读与实战
为了解决这个问题,Transformer模型被设计出来,内核思想是利用自
注意力机制
,这样模型可以直接对输入序列的任意两个位置建立直
医学小达人
·
2025-02-19 03:24
NLP
LLMs
GPT
深度学习
人工智能
transformer
python
机器学习
DeepSeek大模型的发展的十问十答
大模型是由杭州深度求索人工智能基础技术研究有限公司开发的一款基于Transformer架构的大型语言模型,具体介绍如下:1.架构基础Transformer架构:DeepSeek大模型基于Transformer架构,该架构由Google在2017年提出,以自
注意力机制
为核心
科技互联人生
·
2025-02-19 00:25
人工智能
AIGC
Deepseek
【有啥问啥】DeepSeek 技术原理详解
DeepSeek技术原理详解DeepSeek是一款具有突破性技术的大型语言模型,其背后的技术原理涵盖了多个方面,以下是对其主要技术原理的详细介绍:架构创新多头潜在
注意力机制
(MLA)传送门链接:DeepSeekV3
有啥问啥
·
2025-02-18 19:34
大模型
深度学习
搜广推校招面经十九
快手推荐算法一、1*1的
cnn
有什么作用?1.1.降维与通道数调整(ChannelReduction)在
CNN
中,特征图(FeatureMap)通常有多个通道(channels)。
Y1nhl
·
2025-02-18 16:28
搜广推面经
搜索引擎
推荐算法
python
求职招聘
【YOLOv11改进- 主干网络】YOLOv11+CSWinTransformer: 交叉窗口注意力Transformer助力YOLOv11有效涨点;
本文给大家带来的改进内容是在YOLOv11中更换主干网络为CSWinTransformer,助力YOLOv11有效涨点,通过创新性地开发了十字形窗口自
注意力机制
。
算法conv_er
·
2025-02-18 15:43
YOLOv11目标检测改进
YOLO
目标跟踪
人工智能
目标检测
深度学习
transformer
计算机视觉
深度学习下的图像分割
基于学习的图像分割算法主要依赖于深度神经网络,经典的深度神经网络分为如下几种:2.1卷积神经网络
CNN
:卷积神经网络是图像处理领域应用最为广泛的网络,其权值共享,局部连接等特性
人工智能大讲堂
·
2025-02-18 14:01
深度学习
人工智能
《DeepSeek训练算法:开启高效学习的新大门》
Transformer架构的核心是
注意力机制
,这让模型在处理序列数
·
2025-02-18 04:41
人工智能深度学习
DeepSeek推理模型架构以及DeepSeek爆火的原因
大家好,我是微学AI,今天给大家介绍一下DeepSeek推理模型架构以及DeepSeek爆火的原因,DeepSeek推理模型凭借其创新的混合专家(MoE)架构和优化的Transformer架构,融合稀疏
注意力机制
微学AI
·
2025-02-18 03:06
架构
LLM
deepseek
大语言模型(LLM)如何实现上下文的长期记忆?
传统LLM的上下文长度通常受限于计算资源和架构设计(如
注意力机制
),这限制了其处理长文档或保持复杂对话连续性的能力。本篇文章将深入探讨大语言模型的上下文记忆问题,分析其技术难点,并
·
2025-02-18 00:06
Python中LLM的稀疏Transformer架构:Longformer与BigBird
2.2BigBird2.2.1随机注意力2.2.2局部注意力2.2.3全局注意力2.2.4实现3.稀疏Transformer架构的优势4.稀疏Transformer架构的挑战5.未来发展方向5.1更高效的稀疏
注意力机制
二进制独立开发
·
2025-02-17 22:36
非纯粹GenAI
GenAI与Python
python
transformer
架构
开发语言
分布式
人工智能
自然语言处理
PyTorch实战深度学习——用
CNN
进行手写数字识别
用
CNN
进行手写数字识别---计算机专业研究生的代码第一课,相当于”HelloWorld“,不管以后选择什么研究方向,都值得一看,欢迎大家留言交流学习!
一位小说男主
·
2025-02-17 19:43
人工智能入门
深度学习
计算机视觉中图像的基础认知
第一章:计算机视觉中图像的基础认知第二章:计算机视觉:卷积神经网络(
CNN
)基本概念(一)第三章:计算机视觉:卷积神经网络(
CNN
)基本概念(二)第四章:搭建一个经典的LeNet5神经网络一、图像/视频的基本属性在计算机视觉中
全栈你个大西瓜
·
2025-02-17 15:38
人工智能
计算机视觉
人工智能
图像基本属性
RGB
三通道彩色
单通道灰度图像
OpenCV
Matplotlib
【深度学习】计算机视觉(CV)-图像分类-ResNet(Residual Network,残差网络)
ResNet(ResidualNetwork,残差网络)是一种深度卷积神经网络(
CNN
)架构,由何恺明(KaimingHe)等人在2015年提出,最初用于ImageNet竞赛,并在分类任务上取得了冠军。
IT古董
·
2025-02-17 14:57
深度学习
人工智能
深度学习
计算机视觉
分类
【深度学习基础】什么是
注意力机制
文章目录一、
注意力机制
的核心地位:从补充到主导二、技术突破:从Transformer到多模态融合三、跨领域应用:从NLP到通用人工智能四、未来挑战与趋势结语参考链接
注意力机制
:深度学习的核心革命与未来基石在深度学习的发展历程中
我的青春不太冷
·
2025-02-17 14:26
深度学习
人工智能
注意力机制
【论文精读】Sparse4D v2: Recurrent Temporal Fusion with Sparse Model
2存在的问题2.1其他稀疏3D检测的问题PETR是query-based方法,但是为了实现特征融合,进行了全局
注意力机制
,导致高计算量。
EEPI
·
2025-02-17 12:36
自动驾驶
人工智能
论文阅读
深度学习
目标检测
DeepSeek底层揭秘——多头潜在注意力MLA
应用场景7.实际案例:DeepSeek8.最新研究与技术进展9.未来趋势猫哥说1.多头潜在注意力(MLA)(1)定义“多头潜在注意力(Multi-HeadLatentAttention,MLA)”是一种基于
注意力机制
的深度学习方法
9命怪猫
·
2025-02-17 11:33
AI
ai
人工智能
大模型
AI大模型的技术突破与传媒行业变革
这一突破的核心在于三大技术创新:MoE架构升级:通过部署256个细粒度专家网络,减少知识冗余,提升模型效率;MLA
注意力机制
:动态压缩推理过程中的缓存需求,降低GPU内存
AIQL
·
2025-02-17 07:52
行业分析
人工智能
传媒
轻量级的注意力网络(LANMSFF)模型详解及代码复现
注意力机制
:引入了一种新的
注意力机制
,能够有效地捕捉图像中的关键特征,提高模型的表达能力。多尺度特
清风AI
·
2025-02-17 00:02
深度学习算法详解及代码复现
深度学习
人工智能
神经网络
python
计算机视觉
Transformer
1.TransformerTransformer是一种新的、基于attention机制来实现的特征提取器,可用于代替
CNN
和RNN来提取序列的特征。
AI专题精讲
·
2025-02-15 18:18
深度学习
transformer
深度学习
自然语言处理
PyTorch入门实战:从零搭建你的第一个神经网络
核心概念:张量与自动求导1.张量(Tensor):深度学习的数据基石2.自动求导(Autograd):神经网络训练的核心四、实战:手写数字识别(MNIST)1.数据集加载与预处理2.构建卷积神经网络(
CNN
不打滑的西瓜皮
·
2025-02-15 08:58
机器学习
深度学习
人工智能
神经网络
python
pytorch
pycharm
基于深度学习YOLOv8的海洋动物检测系统(Python+PySide6界面+训练代码)
深度学习,尤其是卷积神经网络(
CNN
)的出现,极大地提高了计算机处理图像和视频的能力。
深度学习&目标检测实战项目
·
2025-02-15 04:57
深度学习
YOLO
python
目标检测
人工智能
开发语言
Bengio新作Aaren:探索Transformer性能与RNN效率的融合
论文链接:https://arxiv.org/pdf/2405.13956一、摘要总结:本文提出了一种新的
注意力机制
,名为Aaren,它将注意力视为一种特殊的递归神经网络(RNN),能够高效地计算其多对一
AI记忆
·
2025-02-15 03:17
深度
学习论文与相关应用
transformer
rnn
深度学习
Aaren
Bengio
双通道
CNN
的惊人突破,准确率接近100%!
双通道
CNN
作为一种创新的卷积神经网络架构,正引领深度学习领域的新趋势。其核心优势在于并行卷积层设计,能够同时处理更多特征信息,从而显著提升模型的特征表示能力和识别精度。
沃恩智慧
·
2025-02-15 03:45
深度学习
人工智能
cnn
人工智能
神经网络
焦损函数(Focal Loss)与RetinaNet目标检测模型详解
近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎【柏企】公众号【柏企科技说】【柏企阅文】目前,精度最高的目标检测器大多基于由R-
CNN
·
2025-02-14 22:31
人工智能
【深入探讨 ResNet:解决深度神经网络训练问题的革命性架构】
深入探讨ResNet:解决深度神经网络训练问题的革命性架构随着深度学习的快速发展,卷积神经网络(
CNN
)已经成为图像识别、目标检测等计算机视觉任务的主力军。
机器学习司猫白
·
2025-02-14 16:26
深度学习
人工智能
resnet
神经网络
残差
上下文扩展技术-详细解释Longformer和BigBird的主要创新;详细说明bert原理,并说一说他的上下文限制是怎么来的
答案LongformerLongformer是为有效处理长文本序列而设计的Transformer模型,它通过结合滑动窗口
注意力机制
和扩张注意力模式来捕捉局部和远距离的上下文信息,并通过全局注意力来捕捉整个文档的广泛背景和联系
AI生成曾小健
·
2025-02-14 12:22
人工智能
【故障诊断】基于RIME-
CNN
-SVM霜冰算法优化卷积神经网络结合支持向量机的故障诊断模型(matlab)
【故障诊断】基于RIME-
CNN
-SVM霜冰算法优化卷积神经网络结合支持向量机的故障诊断模型(matlab)文章目录【故障诊断】基于RIME-
CNN
-SVM霜冰算法优化卷积神经网络结合支持向量机的故障诊断模型
天天科研工作室
·
2025-02-14 10:12
故障诊断模型
RIME-CNN-SVM
故障诊断
matlab
cnn
cnn
以及例子
cnn
CNN
即卷积神经网络(ConvolutionalNeuralNetwork),是一种专门为处理具有网格结构数据(如图像、音频)而设计的深度学习模型,在计算机视觉、语音识别等诸多领域都有广泛应用。
阿拉斯攀登
·
2025-02-14 10:41
机器学习
cnn
人工智能
神经网络
【JCR一区级】雾凇算法RIME-
CNN
-BiLSTM-Attention故障诊断分类预测【含Matlab源码 5471期】
Matlab武动乾坤博客之家
Matlab武动乾坤
·
2025-02-14 10:40
matlab
【SCI2区】雾凇优化算法RIME-
CNN
-GRU-Attention用电需求预测Matlab实现
✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,代码获取、论文复现及科研仿真合作可私信。个人主页:Matlab科研工作室个人信条:格物致知。更多Matlab完整代码及仿真定制内容点击智能优化算法神经网络预测雷达通信无线传感器电力系统信号处理图像处理路径规划元胞自动机
matlab科研帮手
·
2025-02-14 10:40
算法
cnn
gru
RIME-
CNN
-SVM故障诊断
构建一个高效、准确的基于卷积神经网络(
CNN
)的电力系统故障识别与分类仿真系统,实现对电力系统故障的精准识别与分类。
九亿AI算法优化工作室&
·
2025-02-14 10:39
cnn
支持向量机
人工智能
matlab
python
视觉中的transformer:ViT
但是在cv领域用的很少,视觉里一般是和
cnn
一起用或者把某些conv替换成transformer(整体还是
CNN
)本篇文章证明纯的transformer直接在图片分类上也做得很好:在大量数据集上进行预训练的前提上
ch隔壁老张
·
2025-02-14 06:12
深度学习笔记
transformer
深度学习
计算机视觉
【Transformer】小白入门指南
目录1、简介2、Transformer解决问题技术概览核心组成自
注意力机制
(Self-AttentionMechanism)多头
注意力机制
(Multi-HeadAttention)前馈神经网络(Feed-ForwardNeuralNetwork
静静喜欢大白
·
2025-02-14 04:18
随记
医疗影像
transformer
深度学习
人工智能
【AI系列】从零开始学习大模型GPT (2)- Build a Large Language Model (From Scratch)
Attention机制的基本原理数学表示应用总结为什么要使用
注意力机制
如何实现?简单
注意力机制
带训练权重的注意力机
Tasfa
·
2025-02-13 23:33
AI人工智能教程
人工智能
学习
gpt
【语义分割专题文章】
一、数据篇【遥感】【道路】篇:【语义分割】【专题系列】一、MassachusettsRoadsDataset马萨诸塞州道路数据集获取二、
CNN
篇Unet(2015):【语义分割】【专题系列】二、Unet
BoostingIsm
·
2025-02-13 22:59
Segmentation
python
R-
CNN
架构
R-
CNN
架构架构RCCN由三个模块组成:第一个模块生成与类别无关的区域提议。这些提议定义了我们的检测器可用的候选检测集。第二个模块是一个大型卷积神经网络,它从每个区域中提取固定长度的特征向量。
·
2025-02-13 16:10
人工智能
微软 LayoutLMv3:通过统一文本和图像掩码进行文档人工智能预训练
Transformer具有多层架构,每层主要由多头自
注意力机制
和逐位置全连接前馈网络组成。
·
2025-02-13 16:39
人工智能
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他