E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Transform
【大模型开发】大模型背后的基础组件与生态概览
本文将介绍其中几大核心组件和框架,包括HuggingFace
Transform
ers、DeepSpeed、Megatron-LM,以及其他相关工具和方法,展示它们在训练效率
云博士的AI课堂
·
2025-03-11 08:56
深度学习
哈佛博后带你玩转机器学习
大模型技术开发与实践
大模型开发
Hugging
Face
DeepSpeed
大模型生态
机器学习
深度学习
大模型技术栈
基于PyTorch的深度学习6——数据处理工具箱2
torchvision有4个功能模块:model、datasets、
transform
s和utils。
Wis4e
·
2025-03-11 07:47
深度学习
pytorch
人工智能
大语言模型原理基础与前沿 挑战与机遇
它们通过深度学习技术,特别是基于变换器(
Transform
er)架构的模型,能够在自然语言处理(NLP)任务中表现出色。大语言模型的出现不仅推动了学术研究的发展,也在实际应用中展现了巨大的潜力。
AI大模型应用之禅
·
2025-03-11 02:07
DeepSeek
R1
&
AI大模型与大数据
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
Google力作 | Infini-attention无限长序列处理
Transform
er
更多文章,请关注微信公众号:NLP分享汇原文链接:Google力作|Infini-attention无限长序列处理
Transform
erhttps://mp.weixin.qq.com/s?
NLP分享汇
·
2025-03-10 23:46
transformer
深度学习
在Ubuntu系统下部署大语言模型
前言在Ubuntu系统下部署大语言模型,可以使用HuggingFace的
Transform
ers库来加载和使用预训练的模型。
脱泥不tony
·
2025-03-10 22:39
ubuntu
语言模型
linux
人工智能
大数据
产品经理
transformer
周报 | 25.3.3-25.3.9文章汇总
从
Transform
er(2017)到DeepSeek-R1(2025)--建议收藏!
双木的木
·
2025-03-10 21:04
大模型专栏
深度学习拓展阅读
人工智能
linux
服务器
deepseek
llama
YOLO
transformer
文本向量化-词嵌入方法系列1:静态词嵌入(Word2Vec+GloVe)
静态词嵌入有Word2Vec,Sen2Vec,Doc2Vec,以及GloVe模型;而动态词嵌入有ELMO,
Transform
er,GPT,Bert和XLNet等等。
学习ml的小菜鸡
·
2025-03-10 19:15
nlp
自然语言处理
word2vec
Training-Free
Transform
er Architecture Search WithZero-Cost Proxy Guided Evolution(预览版本)
摘要
Transform
ers已表现出卓越的性能,然而,其架构设计是一个耗时的过程,需要专业知识和反复试验。
境心镜
·
2025-03-10 18:05
transformer
深度学习
人工智能
深度学习 PyTorch 中 18 种数据增强策略与实现
PyTorch提供torchvision.
transform
s模块丰富的数据增强操作,我们可以通过组合多种策略来实现复杂的增强效果。
@Mr_LiuYang
·
2025-03-10 16:25
计算机视觉基础
数据增强
深度学习
torchvision
transforms
Vision
Transform
er 分类水果图片集 Python 代码(可训练自己数据集)
代码链接:https://github.com/Illusionna/ComputerVision/tree/main/Efficient
Transform
erArepositoryforViT.ContributetoIllusionna
Illusionna.
·
2025-03-10 14:37
transformer
深度学习
人工智能
Unity Job系统详解原理和基础应用处理大量物体位置
通过双缓冲技术实现无锁并行计算,适用于需要高性能批量处理
Transform
的场景。
废嘉在线抓狂.
·
2025-03-10 13:03
Unity
大语言模型引擎全解析:
Transform
ers、vLLM、Llama.cpp等,最佳选择全攻略!
本文将带你深入了解
Transform
ers、vLLM、Llama.cpp、SGLang、MLX和Ollama这些引擎,帮助你找到最适合的工具,释放大语言模型的全部潜力!作为技术人员,不仅
大模型入门教程
·
2025-03-10 12:29
语言模型
llama
人工智能
DeepSeek
prompt
AI大模型
大模型
前端学习——CSS3实现时钟效果
先写一个div,然后给相关的样式.clock{position:absolute;width:250px;height:250px;left:50%;top:50%;
transform
:translate
younger_LF
·
2025-03-10 11:17
前端(HTML+CSS+JS)
CSS动画
时钟效果
前端学习——css照片墙
text-align:center;/*照片居中*/}img{width:12%;/*设置高度*/padding:10px;/*设置内边距*/background-color:white;/*设置照片背景色*/
transform
野生小米椒
·
2025-03-10 10:47
三大基础语言
AF3 squeeze_features函数解读
AlphaFold3data_
transform
s模块的squeeze_features函数的作用去除蛋白质特征张量中不必要的单维度(singletondimensions)和重复维度,以使其适配AlphaFold3
qq_27390023
·
2025-03-10 10:43
pytorch
深度学习
人工智能
生物信息学
AF3 block_delete_msa函数解读
AlphaFold3data_
transform
s模块的block_delete_msa函数用于从MSA(多序列比对)中删除多个块(block)序列,以模拟MSA数据的缺失或噪声。
qq_27390023
·
2025-03-10 10:43
深度学习
人工智能
python
生物信息学
pytorch
论文阅读笔记——Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware
ALOHA论文ALOHA解决了策略中的错误可能随时间累积,且人类演示可能是非平稳的,提出了ACT(ActionChunkingwith
Transform
ers)方法。
寻丶幽风
·
2025-03-10 09:09
论文阅读笔记
论文阅读
笔记
人工智能
深度学习
机器人
新范式:人机协作与AI时代的胜利(Kyndryl赞助)
人机协作与AI时代的胜利(Kyndryl赞助)关键字:[AmazonWebServicesre:Invent2024,亚马逊云科技,KindrelVital,HumanExperienceDesign,Ai
Transform
ationJourneys
出海指南针
·
2025-03-10 09:38
AWS
RoPE——
Transform
er 的旋转位置编码
在自然语言处理领域,
Transform
er是现代深度学习模型的基础,而位置编码(PositionEmbedding)则是
Transform
er处理序列数据的关键模块之一。
机智的小神仙儿
·
2025-03-10 09:34
深度学习
大模型
transformer
深度学习
人工智能
构建一个完整的视觉
Transform
er(ViT)图像分类模型 VIT (vision
transform
er)图像分类
构建一个完整的视觉
Transform
er(ViT)图像分类模型VIT(vision
transform
er)图像分类根据提供的截图内容,我们可以看到一个名为VitNet的视觉
Transform
er(Vision
Transform
er
Jackie_AI
·
2025-03-10 04:29
transformer
分类
深度学习
【
Transform
er优化】
Transform
er的局限在哪?
自2017年
Transform
er横空出世以来,它几乎重写了自然语言处理的规则。但当我们在享受其惊人的并行计算能力和表征能力时,是否真正理解了它的局限性?
T-I-M
·
2025-03-10 04:26
transformer
深度学习
人工智能
AIGC实战——
Transform
er模型
AIGC实战——
Transform
er模型0.前言1.T52.GPT-3和GPT-43.ChatGPT小结系列链接0.前言我们在GPT(GenerativePre-trained
Transform
er)
盼小辉丶
·
2025-03-10 01:31
AIGC
transformer
深度学习
2022IJCAI速读:SparseTT,使用稀疏
Transform
ers进行视觉跟踪
原文标题:SparseTT:VisualTrackingwithSparse
Transform
ers中文标题:SparseTT:使用稀疏
Transform
ers进行视觉跟踪代码地址:GitHub-fzh0917
夜深人静打代码
·
2025-03-10 00:53
目标检测跟踪论文速读专栏
视觉跟踪
计算机视觉
目标检测
人工智能
Transform
er 工作原理图文详解和实践:在生成式对话系统中的核心技术剖析
v=wjZofJX0v4M&t=33s
Transform
er在生成式对话系统中的核心技术剖析作者:禅与计算机程序设计艺术文章目录
Transform
er在生成式对话系统中的核心技术剖析1.背景介绍2.核心概念与联系
AI天才研究院
·
2025-03-09 18:03
ChatGPT
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
搜广推校招面经三十八
二、
Transform
er中对梯度消失或者梯度爆炸的处理在
Transform
er模型中,梯度消失和梯度爆炸是深度学习中常见的问题,尤其是在处理长序列数据时。
Y1nhl
·
2025-03-09 12:45
搜广推面经
算法
pytorch
推荐算法
搜索算法
机器学习
2025最新
Transform
er模型及深度学习前沿技术应用
第一章、注意力(Attention)机制1、注意力机制的背景和动机(为什么需要注意力机制?注意力机制的起源和发展里程碑)。2、注意力机制的基本原理(什么是注意力机制?注意力机制的数学表达与基本公式、用机器翻译任务带你了解Attention机制、如何计算注意力权重?)3、注意力机制的主要类型:键值对注意力机制(Key-ValueAttention)、自注意力(Self-Attention)与多头注意
weixin_贾
·
2025-03-09 06:35
Python
MATLAB
python
深度学习
MATLAB编程
深度学习模型
图神经网络
自编码
物理信息神经网络
目标检测
大语言模型
深度解析SSD2351核心板:硬核视频处理+工业级可靠性设计
芯片技术细节:视频处理能力:IVE引擎支持高斯滤波、膨胀/腐蚀等图像预处理;IPU支持人脸识别、运动检测及
Transform
er网络推理;显示接口支持MIPIDSI2560x1600@60fps,适配工业
明远智睿嵌入式方案商
·
2025-03-09 05:16
arm开发
嵌入式硬件
人工智能
机器人
转换器与预估器,KNN算法,朴素贝叶斯算法,决策树,随机森林的特点,优缺点
转换器与预估器,KNN算法,朴素贝叶斯算法,决策树,随机森林的特点,优缺点1转换器与预估器实例化转换器fit_
transform
转换实例化预估器fit将训练集的特征值和目标值传进来fit运行完后,已经把这个模型训练出来了
qq_43625764
·
2025-03-09 01:05
笔记
KNN算法
随机森林
朴素贝叶斯算法
机器学习算法
决策树
PyTorch深度学习框架60天进阶学习计划第14天:循环神经网络进阶
今天,我们将深入探讨循环神经网络的进阶内容,包括BiLSTM的工作机制、注意力机制的数学原理,以及
Transform
er编码层的实现。
凡人的AI工具箱
·
2025-03-09 00:03
深度学习
pytorch
学习
人工智能
python
AI编程
1.6 从 GPT-1 到 GPT-3.5:一路的风云变幻
从GPT-1到GPT-3.5:一路的风云变幻人工智能的进步一直是科技领域的一个重要话题,而在自然语言处理(NLP)领域,GPT(GenerativePre-trained
Transform
er)系列模型的发布
少林码僧
·
2025-03-08 23:03
AI大模型应用实战专栏
gpt
gpt-3
使用 DeepSeek 训练属于自己写小说的模型
我们将基于DeepSeek的API和工具,结合HuggingFace的
Transform
ers库,完成模型的训练和部署。
xinxiyinhe
·
2025-03-08 23:02
DeepSeek
人工智能
python
Qwen1.5-7B-实现RAG应用详细步骤
Transform
ers:HuggingFace提供的库,支持加载和运行预训练模型。FAISS:用于向量检索的高效库。GPTQ支持库:如auto-gptq或gptqmodel。
大数据追光猿
·
2025-03-08 23:01
大模型
数据库
AI编程
语言模型
人工智能
深度学习
Unity 文字高度自适应
期望文字有字号限制,输入文字文字后先判断高度是否适用于限制字号,若处于最小字号时高度任不适用,则调整Rect
Transform
的高度。核心代码每次输入文字时先将字号设定为原始字号。
2301_79311694
·
2025-03-08 17:11
unity
论文阅读:Recipe for a General, Powerful, Scalable Graph
Transform
er
RecipeforaGeneral,Powerful,ScalableGraph
Transform
er论文和代码地址1介绍与贡献2GPS模型2.1模型框架图2.2PE和SE2.3GPSlayer:一种MPNN
不会&编程
·
2025-03-08 16:53
图神经网络论文阅读
论文阅读
transformer
深度学习
图神经网络
人工智能
自然语言处理(NLP)领域大语言模型学习目录大全
GPT系列GPT-1(GenerativePre-trained
Transform
er1)模型GPT-1(GenerativePre-trained
Transform
er1)是OpenAI在2018年6
彬彬侠
·
2025-03-08 13:45
大模型
自然语言处理
NLP
大模型
LLM
GPT
BERT
GLM
3.6手写数字识别项目
-通过`
transform
s.Compose`对数据进行预处理,包括转换为张量和归一化。-使用`DataLoader`创建训练和测试数据集的生成器。
不要不开心了
·
2025-03-08 11:33
pytorch
神经网络
人工智能
机器学习
深度学习
深入浅出的理解deepseek类大模型(附运行代码)
深入理解之运行代码:from
transform
ers.models.qwen2importQwen2Config,Qwen2Modelimporttorchdefrun_qwen2():#根据模型需求配置参数
AI人工智能时代
·
2025-03-08 08:47
人工智能
transformer
机器人
深度学习
深度解构:DeepSeek大模型架构与前沿应用的未来探秘
1.DeepSeek大模型的架构设计DeepSeek大模型采用的是基于
Transform
er
威哥说编程
·
2025-03-08 05:15
架构
ai
Reactor框架下的Flux和Mono转换技巧
今天,我们就来深入探讨一下如何通过
transform
()方法来实现Flux和Mono的转换。
t0_54program
·
2025-03-08 02:18
android
个人开发
新型模型架构(参数化状态空间模型、状态空间模型变种)
文章目录参数化状态空间模型状态空间模型变种
Transform
er模型自问世以来,在自然语言处理、计算机视觉等多个领域得到了广泛应用,并展现出卓越的数据表示与建模能力。
三月七꧁ ꧂
·
2025-03-08 00:28
LLM
语言模型
gpt
文心一言
prompt
embedding
AIGC
agi
人工智能基础知识
首先分为两大类:一:机器视觉cv1.特征比较明显2.经典模型:cnn,resnet,deepface,yolov(1-12),vi-
transform
er。缺点:不能解决收听问题。
yzx991013
·
2025-03-07 16:24
人工智能
Bert学习笔记
一、Bert架构BERT使用了双向的
Transform
erGPT使用从左到右的单向信息ELMo把单独训练的从左到右及从右到左的LSTM模型进行合并二、Bert预训练任务2.1遮蔽语言模型MLM任务:随机屏蔽
缓释多巴胺。
·
2025-03-07 09:05
大模型相关知识
语言模型
bert
探索数据仓库自动化:ETL流程设计与实践
ETL(Extract,
Transform
,Load)是指数据抽取、转换和加载,是数据仓库建设的重要步
Echo_Wish
·
2025-03-07 08:31
大数据高阶实战秘籍
数据仓库
自动化
etl
css心跳动画
图标引入CSS代码.icon{animation:bpm1slinear,pulse0.75s1slinearinfinite;}@keyframespulse{from,75%,to{
transform
—Qeyser
·
2025-03-07 07:12
Html
CSS
css
前端
java
YOLOv12改进之A2(区域注意力)
已有研究成果包括:
Transform
er架构:引入了自注意力机制,有效捕捉输入序列中的长距离依赖关系。CBAM模块:提出了通道和空间注意力的结合,显著提升了图像分类和目标检测的性能。
清风AI
·
2025-03-07 00:39
深度学习算法详解及代码复现
深度学习
机器学习
计算机视觉
人工智能
算法
目前市场上的人工智能大模型有哪些?
Google的
Transform
er系列:BERT(Bidirection
国货崛起
·
2025-03-06 19:48
大模型
人工智能
人工智能
自动驾驶---LSTM模型用于轨迹预测
1前言在下面几篇博客中,笔者简单介绍过
Transform
er,
Transform
er的内部结构虽然比较清晰,但对于入门者来说还是复杂了一些。《人工智能---什么是
Transform
er?》
智能汽车人
·
2025-03-06 18:14
自动驾驶
lstm
人工智能
自然语言处理
大模型入门
Transform
er架构的持续演进体现在位置编码改进(如RoPE旋转位置编码)、注意力机制优化(FlashAttention算法提升30%训练速度)以及层级结构创新(深度
24k小善
·
2025-03-06 17:05
AI编程
AI写作
prompt
【Python爬虫】爬取公共交通站点数据
Coordin_
transform
lat:自定义的一个坐标转换库。在这个爬虫项目中,它被用来将高德地图提供
Anchenry
·
2025-03-06 13:00
Python爬虫
python
beautifulsoup
AI语言模型的技术之争:DeepSeek与ChatGPT的架构与训练揭秘
-CSDN博客目录第一章:DeepSeek与ChatGPT的基础概述1.1DeepSeek简介1.2ChatGPT简介第二章:模型架构对比2.1
Transform
er架构:核心相似性2.2模型规模与参数第三章
m0_74825466
·
2025-03-06 06:29
面试
学习路线
阿里巴巴
chatgpt
人工智能
语言模型
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他