E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
TRANSFORM
【AI论文】SongGen:用于文本到歌曲生成的单阶段自回归
Transform
er模型
在本文中,我们提出了SongGen,一个完全开源的单阶段自回归
Transform
er模型,专为可控歌曲生成而设计。
东临碣石82
·
2025-02-28 15:58
人工智能
回归
transformer
transform
er中seq_len参数的设置
在
Transform
er模型中,seq_len(序列长度)是一个关键的超参数,下面从不同方面详细介绍它的具体含义和作用:一、基本定义seq_len表示输入到
Transform
er模型中的序列所允许的最大长度
yuweififi
·
2025-02-28 10:49
transformer
深度学习
人工智能
pytorch基础 nn.embedding
这是许多NLP模型(包括
Transform
er)中的基本组件。
yuweififi
·
2025-02-28 10:49
pytorch
人工智能
nlp
Transform
er 代码剖析2 - 模型训练 (pytorch实现)
一、模型初始化模块参考:项目代码1.1参数统计函数defcount_parameters(model):returnsum(p.numel()forpinmodel.parameters()ifp.requires_grad)遍历模型参数筛选可训练参数统计参数数量返回总数技术解析:numel()方法计算张量元素总数requires_grad筛选需要梯度更新的参数统计结果反映模型复杂度,典型Tran
lczdyx
·
2025-02-28 09:38
Transformer代码剖析
transformer
pytorch
深度学习
人工智能
python
Unity 列表滚动到指定位置
2、主要根据索引计算Content需要设置的高度即(Rect
Transform
的PosY)varsumHeight=targetIndex*(itemHeigh
程序猿多布
·
2025-02-28 08:58
unity
《AI 大模型 ChatGPT 的传奇》
1.4算法层面的跃升1.4.1RNN到
transform
or1.4.2扩散模型diffusion1.4.3跨模态的CLIP框架1.5AIGC的耀眼成果1.5.1AI
武昌库里写JAVA
·
2025-02-28 04:33
面试题汇总与解析
课程设计
spring
boot
vue.js
算法
数据结构
大模型专栏博文汇总和索引
大模型专栏主要是汇总了我在学习大模型相关技术期间所做的一些总结和笔记,主要包括以下几个子专栏:DeepSeek-R1AIGC大模型实践
Transform
er多模态系统视频理解对比学习目标检测目标跟踪图神经网络大模型专栏汇总了以上所有子专栏的论文
Donvink
·
2025-02-28 03:53
大模型
transformer
深度学习
人工智能
语言模型
ELMo ,LM:一串词序列的概率分布probability distribution over sequences of words
Languagemodelisaprobabilitydistributionoversequencesofwords.GPT与ELMo当成特征的做法不同,OpenAIGPT不需要再重新对任务构建新的模型结构,而是直接在
transform
er
强化学习曾小健
·
2025-02-27 22:05
NLP自然语言处理
#
预训练语言模型
DeepSeek应用领域全景解析:驱动产业智能化升级的六大核心方向
本文基于官方技术文档与行业实践案例,深入剖析DeepSeek在六大核心领域的应用突破与商业价值实现二、技术底座:支撑多领域落地的三大创新架构1.
Transform
er-XL增强架构通过引入Multi-HeadLate
量子纠缠BUG
·
2025-02-27 21:32
DeepSeek部署
AI
DeepSeek
人工智能
AI编程
深度学习
Ollama本地私有化部署通义千问大模型Qwen2.5
目录Qwen2.5介绍Qwen2.5新闻Ollama介绍Linux安装Ollama一键安装Ollama手工安装Ollama卸载OllamaOllama运行Qwen2基于
Transform
ers进行推理本文复现环境
ErbaoLiu
·
2025-02-27 20:17
数据分析&大模型
机器学习&大模型
自然语言处理&大模型
大模型
LLM
Qwen2.5
Qwen2
Ollama
救命!论文被知网判定AI生成?别慌!手把手教你3分钟自救
上周有个同学写"
Transform
er模型"
chatpaper001
·
2025-02-27 18:37
人工智能
自然语言处理
深度学习
AIGC
AI写作
unity物体左右摇摆(旋转)
MonoBehaviour{privateboolturnRight;privateboolturnLeft;privatefloatturnDegree=0;voidStart(){if(this.
transform
CallZhang210
·
2025-02-27 18:00
unity
游戏引擎
3种Unity中对象移动的方式
一、使用
Transform
组件publicfloatspeed=3.0f;voidUpdate(){
transform
.position+=newVector3(speed*Time.deltaTime
CallZhang210
·
2025-02-27 18:29
unity
VIT(Vision
Transform
er)【超详细 pytorch实现
CNN的局限性:传统的CNN通过局部卷积核提取特征,虽然可以通过堆叠多层卷积扩大感受野,但仍然依赖于局部信息的逐步聚合,难以直接建模全局依赖关系。ViT的优势:ViT使用自注意力机制(Self-Attention),能够直接捕捉图像中所有patch(图像块)之间的全局关系。这种全局建模能力在处理需要长距离依赖的任务(如图像分类、目标检测)时表现更好。全流程图像预处理+分块图像尺寸标准化,如(224
周玄九
·
2025-02-27 17:54
计算机视觉
transformer
深度学习
人工智能
大语言模型原理与工程实践:
Transform
er 大语言模型预训练
大语言模型原理与工程实践:
Transform
er大语言模型预训练关键词:大语言模型、预训练、
Transform
er、自监督学习、计算资源、数据处理文章目录大语言模型原理与工程实践:
Transform
er
AI天才研究院
·
2025-02-27 16:18
计算
ChatGPT
transformer
大模型核心技术原理:
Transform
er架构详解!
在大模型发展历程中,有两个比较重要点:第一,
Transform
er架构。它是模型的底座,但
Transform
er不等于大模型,但大模型的架构可以基于
Transform
er;第二,GPT。
大模型猫叔
·
2025-02-27 16:13
transformer
架构
深度学习
人工智能
学习
机器学习
算法
自动驾驶之BEVDet
经典主干网络比如resnet,Swin
Transform
er等。neck有==FPN==,PAFPN等。
maxruan
·
2025-02-27 16:13
BEV
自动驾驶
自动驾驶
人工智能
机器学习
【
Transform
e-SVM多特征分类预测】基于
Transform
e-支持向量机多特征分类预测。(可做分类/回归/时序预测,具体私聊),可直接运行。matlab代码,2023b及其以上。1.运行
【
Transform
e-SVM多特征分类预测】基于
Transform
e-支持向量机多特征分类预测。(可做分类/回归/时序预测,具体私聊),可直接运行。matlab代码,2023b及其以上。
智能算法及其模型预测
·
2025-02-27 14:31
支持向量机
分类
回归
用于训练基于pytorch构建的小型字符级语言模型的数据集汇总
前文,我们从零开始基于
transform
er框架在pytorch上构建一个小型字符级语言模型,并编写了完整的python示例,模型是需要训练的,所以在原有代码的基础上,我们寻找一些公开的数据集对模型进行训练
搏博
·
2025-02-27 06:03
大模型
pytorch
语言模型
人工智能
python
学习
机器学习
html css上下对其,html – CSS中SVG的垂直对齐
jsfiddle1–您可以在容器上使用position:relative,并在对象上使用absolute:absolute,如下所示:position:absolute;top:50%;-webkit-
transform
dongyuwu
·
2025-02-27 06:30
html
css上下对其
深度学习的前沿与挑战:从基础到最新进展
深度学习的工作原理深度学习的关键技术1.卷积神经网络(CNN)2.循环神经网络(RNN)3.生成对抗网络(GAN)4.变分自编码器(VAE)5.自注意力机制与
Transform
er深度学习的应用1.计算机视觉
Jason_Orton
·
2025-02-27 03:09
深度学习
人工智能
数据挖掘
机器学习
如何利用GPT创作诗歌与短篇故事赚钱
GenerativePre-trained
Transform
er(GPT)作为一种强大的自然语言处理工具,为普通人提供了创作诗歌和短篇故事的新途径,并能够通过这些创作实现赚钱的机会。
·
2025-02-27 00:08
【STL】7.STL常用算法(1)
STL常用算法(1)前言简介一.遍历算法1.for_each2.
transform
二.查找算法1.find2.find_if3.adjacent_find4.binary_search5.count6.
零零时
·
2025-02-26 23:05
c/c++
算法
c++
开发语言
学习
数据结构
stl
排序算法
AI岗位面试指南:高频文档问题解析与应答策略
一、必问文档类问题与应答模板1.简历深挖类典型问题:"请详细解释简历中提到的「基于
Transform
er的文本生成优化项目」,你如何量化性能提升?"
阿三0812
·
2025-02-26 19:07
ai
人工智能
面试
从零开始:使用PyTorch构建DeepSeek R1模型及其训练详解
DeepSeekR1是一个假设的模型名称,为了演示目的,我们将构建一个基于
Transform
er的简单文本生成模型。
陆鳐LuLu
·
2025-02-26 19:02
pytorch
人工智能
python
css 实现图片3D旋转效果(那些年写过的转圈圈)
css实现图片旋转效果还是很容易的,不说废话直接上,先看下效果实现起来也不复杂,主要用到的css样式有:
transform
-style,
transform
,animation,-webkit-box-reflect
Venus865
·
2025-02-26 18:59
css
前端
DeepSeek API是什么
DeepSeekAPI通常基于先进的大模型,如
Transform
er架构的模型,提供了强大的语言理解和生成能力。
兔兔爱学习兔兔爱学习
·
2025-02-26 18:28
大模型
python
prompt
算法
【深度学习】
Transform
er入门:通俗易懂的介绍
【深度学习】
Transform
er入门:通俗易懂的介绍一、引言二、从前的“读句子”方式三、
Transform
er的“超级阅读能力”四、
Transform
er是怎么做到的?
知识靠谱
·
2025-02-26 07:12
深度学习
深度学习
transformer
人工智能
【百问百答系列】-全面了解
Transform
er(未来发展)
【百问百答系列】-全面了解
Transform
er引言初次接触
Transform
er时,那些复杂的概念和精妙的架构设计,着实让我困惑不已。
什么都想学的阿超
·
2025-02-26 04:51
原理概念
#
深度学习
transformer
深度学习
人工智能
Pytorch:以CIFAR-10分类为例,给出了神经网络的训练流程
importtorchastimporttorchvisionastvimporttorchvision.
transform
sas
transform
sfromtorchvision.
transform
simportToPILImageimporttorch.nnasnnimporttorch.n
Xiao_Ya__
·
2025-02-25 23:49
深度学习
pytorch
pytorch
分类
神经网络
Python微调DeepSeek-R1-Distill-Qwen-1.5B模型:使用
Transform
ers和PyTorch进行训练
前言近年来,基于
Transform
er架构的预训练语言模型如GPT、BERT等已经取得了显著的成果,广泛应用于自然语言处理(NLP)的各个领域。
煤炭里de黑猫
·
2025-02-25 21:02
pytorch
python
人工智能
机器学习
机器学习01
dataframe那样的数据,要进行特征提取,比如字典特征提取,文本特征提取)无量纲化(预处理)归一化标准化降维底方差过滤特征选择主成分分析-PCA降维1.特征工程API实例化转换器对象,转换器类有很多,都是
Transform
er
天行者@
·
2025-02-25 20:53
机器学习
人工智能
深度学习
告别复杂分词:
Transform
ers轻松搞定文本处理
今天这篇文章将带你一起走进一个深受AI界热爱的工具——
Transform
ers库,特别是AutoTokenizer的神奇功能。这个工具可以让你轻松处理文本,节省时间,还能保证高效准确。
星际编程喵
·
2025-02-25 09:08
Python探索之旅
python
算法
机器学习
深度学习
自然语言处理
GPT-2源码实现及GPT-3、GPT-3.5、GPT-4及GPT-5内幕解析(二)
NLP_Matrix_Space5.2GPT-2源码实现逐行解析本节讲解GPT-2源码,gpt2.py是一个使用NumPy实现的代码,在代码中实现了GELU激活函数、softmax函数、层归一化、线性层、前馈神经网络、多头自注意力机制、
Transform
er
段智华
·
2025-02-25 09:35
深入理解
ChatGPT
ChatGPT国内
OpenAI
GPT-3
GPT-4
开源模型应用落地-Qwen1.5-MoE-1/3的激活参数量达到7B模型的性能
但是目前只有HF
transform
ers和vLLM支持该模型。二、术语介绍2.1.混合专家(MoE)架构是一种机器学习模型的结构设计,它将一个复杂的任务分解成多个相对简单的子任务,
开源技术探险家
·
2025-02-25 07:55
开源模型-实际应用落地
#
深度学习
语言模型
自然语言处理
深度学习笔记——常见的
Transform
er位置编码
本文详细介绍3种常见的
Transform
er位置编码——正弦/余弦位置编码(sin/cos)、基于频率的二维位置编码(2DFrequencyEmbeddings)、旋转式位置编码(RoPE)文章目录
Transform
er
好评笔记
·
2025-02-25 01:05
深度学习笔记
深度学习
transformer
人工智能
为什么词向量和权重矩阵dot运算就能得到想要的效果呢?
具体来说,在自然语言处理任务中,这种操作通常出现在如
Transform
er模型中的自注意力机制里。让我们深入探讨一下为什么这种方
cjl30804
·
2025-02-24 15:02
矩阵
线性代数
nlp
Engineering A Large Language Model From Scratch
Atinuke是一种基于
Transform
er的神经网络,通过使用独特的配置来优化各种语
UnknownBody
·
2025-02-24 15:31
语言模型
人工智能
自然语言处理
Transform
er 在RxJava中的使用
Transform
er用途
Transform
er,顾名思义是转换器的意思。
xiaopangcame
·
2025-02-24 15:27
rxjava
rxjava
深度学习(2)-深度学习关键网络架构
关键网络架构深度学习有4种类型的网络架构:密集连接网络、卷积神经网络、循环神经网络和
Transform
er。
yyc_audio
·
2025-02-24 14:26
人工智能
机器学习
深度学习
如何在Java中实现多头注意力机制:从
Transform
er模型入手
如何在Java中实现多头注意力机制:从
Transform
er模型入手大家好,我是微赚淘客系统3.0的小编,是个冬天不穿秋裤,天冷也要风度的程序猿!
省赚客app开发者
·
2025-02-24 14:26
java
transformer
开发语言
transform
ers java_
Transform
er 在RxJava中的使用
Transform
er.jpeg
Transform
er用途
Transform
er,顾名思义是转换器的意思。
欢小颜
·
2025-02-24 14:55
transformers
java
Transform
er大模型实战 教师 学生架构
Transform
er大模型实战教师学生架构作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来近年来,随着深度学习技术的飞速发展
AI智能涌现深度研究
·
2025-02-24 14:19
DeepSeek
R1
&
大数据AI人工智能
Python入门实战
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
Transform
er模型量化Quantization 笔记
模型参数与显存占用计算基础为了详细说明模型的参数数量和每个参数在显存中占用的空间大小,我们以facebookOPT-6.7B模型为例。逐步推理计算过程:1.估计参数总量:OPT-6.7B模型指一个含有大约6.7Billion(67亿)个参数的模型。2.计算单个参数的显存占用:OPT-6.7B模型默认使用Float16,每个参数占用16位(即2字节)的显存。3.计算总显存占用=参数总量×每个参数的显
Foolbird123
·
2025-02-24 13:14
transformer
人工智能
深度学习
如何在Java中设计高效的
Transform
er模型架构
如何在Java中设计高效的
Transform
er模型架构大家好,我是微赚淘客系统3.0的小编,是个冬天不穿秋裤,天冷也要风度的程序猿!
省赚客app开发者
·
2025-02-24 13:43
java
transformer
架构
目前(2025年2月)计算机视觉(CV)领域一些表现优异的深度学习模型
PaLI:这是一个多模态模型,结合了40亿参数的视觉
Transform
er(ViT)和多种大型语言模型(LLM),并在包含100多种语言的100亿图像和文本数据集上进行训练。PaLI在图像描述、视
空空转念
·
2025-02-23 20:18
深度学习系列
计算机视觉
深度学习
人工智能
mysql之规则优化器RBO
文章目录MySQL基于规则的优化(RBO):RBO的核心思想:模式匹配与规则应用RBO的主要优化规则查询重写(QueryRewrite)/查询转换(Query
Transform
ation)子查询优化(SubqueryOptimization
我爱松子鱼
·
2025-02-23 20:44
mysql运行机制
mysql
数据库
【ETL】从理论到实践的数据处理流程及其工具的应用
目录引言一、ETL的基础与工作原理二、ETL过程中的工具选择与实际操作(1)提取(Extract)(2)转换(
Transform
)(3)加载(Load)三、常见的ETL工具四、ETL的未来发展趋势五、总结引言
絆人心
·
2025-02-23 19:10
etl
数据仓库
python
数据分析
数据挖掘
数据库
End-to-End Object Detection with
Transform
ers
End-to-EndObjectDetectionwith
Transform
ers会议:2020ECCV论文:https://arxiv.org/abs/2005.12872代码:https://github.com
M1kk0
·
2025-02-23 18:28
目标检测
计算机视觉
神经网络
24道数据仓库面试八股文(答案、分析和深入提问)整理
回答在数据仓库(DW)中,ODS(OperationalDataStore)层到DW层的ETL(Extract,
Transform
,Load)过程主要包括以下几个步骤:提取(Extract):从ODS层提取原始数据
守护海洋的猫
·
2025-02-23 16:11
数据仓库
面试
职场和发展
python
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他