E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
transformer论文阅读
【
论文阅读
33】Deep learning optoacoustic tomography with sparse data
Deeplearningoptoacoustictomographywithsparsedata论文题目:基于稀疏数据的深度学习光声断层扫描论文链接:Deeplearningoptoacoustictomographywithsparsedata|NatureMachineIntelligence代码链接:GitHub-ndavoudi/sparse_artefact_unet数据链接:Data发
弹伦琴的雷登
·
2024-09-01 18:29
【论文阅读系列】
人工智能
深度学习
论文阅读
图像处理
【HuggingFace
Transformer
s】BertIntermediate 和 BertPooler源码解析
BertIntermediate和BertPooler源码解析1.介绍1.1位置与功能1.2相似点与不同点2.源码解析2.1BertIntermediate源码解析2.2BertPooler源码解析1.介绍1.1位置与功能(1)BertIntermediate位置:位于BertLayer的注意力层(BertSelfAttention)和输出层(BertOutput)之间。功能:它执行一个线性变换(
CS_木成河
·
2024-09-01 17:25
Hugging
Face
深度学习
人工智能
bert
python
大模型
Transformer
在浏览器上使用
transformer
s.js运行(WebGPU)RMBG-1.4进行抠图(背景移除)
在浏览器上使用
transformer
s.js运行(WebGPU)RMBG-1.4进行抠图(背景移除)说明:首次发表日期:2024-08-28官方Github仓库地址:https://github.com
shizidushu
·
2024-09-01 17:55
WebGPU
transformers.js
RMBG-1.4
抠图
LLM-项目详解(一):Chinese-LLaMA-Alpaca【
transformer
s/models/llama/modeling_llama.py文件】
site-packages/
transformer
s/models/llama/modeling_llama.py#coding=utf-8#Copyright2022EleutherAIandtheHuggingFaceInc.team.Allrightsreserved
u013250861
·
2024-08-31 22:57
#
LLM/经典模型
llama
总结:大模型技术栈---算法与原理
word-levelchar-levelsubword-levelBPEWordPieceUniLMSentencePieceByteBPE2.positionencoding绝对位置编码ROPEAliBi相对位置编码
Transformer
-XLT5
lichunericli
·
2024-08-31 22:26
LLM零碎知识
人工智能
自然语言处理
算法
《BERT基础教程:
Transformer
大模型实战》读书笔记
概念BERT,BidirectionalEncoderRepresentationsfrom
Transformer
s,多
Transformer
的双向编码器表示法。
johnny233
·
2024-08-31 19:39
读书笔记
人工智能
深度学习项目实践——QQ聊天机器人(
transformer
)(三)功能实现的方法——NoneBot2插件结构与编写
深度学习项目实践——QQ聊天机器人(
transformer
)(三)功能实现的方法——NoneBot2插件结构与编写在前两节中,我们详细讲解了QQ聊天的原理、QQ机器人的框架与环境配置的流程。
Linductor
·
2024-08-31 18:58
qq聊天机器人项目
机器人
transformer
nonebot
YOLOv9独家改进:一种高效移动应用的卷积加性自注意Vision
Transformer
本文独家改进:轻量化改进之高效移动应用的卷积加性自注意Vision
Transformer
,构建了一个新颖且高效实现方式——卷积加性相似度函数,并提出了一种名为卷积加性标记混合器(CATM)的简化方法来降低计算开销
AI小怪兽
·
2024-08-31 17:28
YOLOv9魔术师
YOLO
transformer
深度学习
开发语言
人工智能
python
自己设计一个
Transformer
模型
Transformer
模型在2017年被Google提出,直接基于self-attention结构,不再依赖于RNN、LSTM或者CNN,是一种Seg2Seg模型。
郑不凡
·
2024-08-31 13:23
transformer
自然语言处理
机器翻译
巴伦射频变器(Balun RF
Transformer
)的常规产品通常包括以下几种类型
1:1高频变压器:用于将平衡和非平衡信号进行转换,通常在信号传输和接收电路中使用,如无线通信设备和各种高频电子设备中。1:4高频变压器:主要用于阻抗匹配和信号传输,能够将低阻抗的平衡信号转换为高阻抗的非平衡信号,广泛应用于射频收发器件和天线系统。双平衡变压器:用于同时处理两个平衡信号的变压器,如应用于差分放大器和差分信号处理电路中。4:1高频变压器:类似于1:4变压器,用于信号匹配和转换,将高阻抗
Hqst88888
·
2024-08-31 08:50
网络
第65期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预训练
Transformer
(GPT)、人工智能生成内容(AIGC)以及大语言模型(LLM)等安全领域应用的知识。
云起无垠
·
2024-08-31 05:26
GPTSecurity
人工智能
网络安全
语言模型
快速使用
transformer
s的pipeline实现各种深度学习任务
目录引言安装情感分析文本生成文本摘要图片分类实例分割目标检测音频分类自动语音识别视觉问答文档问题回答图文描述引言在这篇中文博客中,我们将深入探讨使用
transformer
s库中的pipeline()函数
E寻数据
·
2024-08-31 04:54
huggingface
计算机视觉
nlp
深度学习
人工智能
python
pipeline
transformers
1-pipeline()函数-
transformer
s-python库
pipeline()函数pipeline()函数是
Transformer
s库中最基本的工具。
Transformer
模型用于解决各种NLP任务,
Transformer
s库提供了创建和使用这些模型的功能。
Flora-pi
·
2024-08-31 04:53
人工智能
人工智能
Transformer
模型整体构建的实现
编码器-解码器结构classEncoderDecoder(nn.Module):def__init__(self,encoder,decoder,source_embedding,target_embedding,generator):"""初始化函数中有5个参数,分别是编码器对象,解码器对象,源数据嵌入函数,目标数据嵌入函数,以及输出部分的类别生成器对象"""super(EncoderDecod
好好学习Py
·
2024-08-30 22:14
自然语言处理
transformer
python
人工智能
深度学习
pytorch
nlp
Bert中文预训练模型(Bert-base-chinese)
使用importtorchfrom
transformer
simportBertTokenizer,BertModel#第一步:离线下载#fromtran
好好学习Py
·
2024-08-30 22:14
自然语言处理
bert
人工智能
深度学习
pytorch
python
自然语言处理
论文阅读
瞎记(四) Cascade R-CNN: Delving into High Quality Object Detection 2017
概述在物体检测中1,IOU阈值被用于判定正负样本。在低IOU阈值比如0.5的状态下训练模型经常产生噪音预测,然而检测效果会随着IOU增加而降低。两个主要因素:1.训练时的过拟合,正样本指数消失2.检测器最优IOU与输入假设的不匹配。一个单阶段的物体检测器CascadeR-CNN被提出用于解决这些问题。网络由一个检测序列组成,这些序列训练时会伴随IOU增长从而对FP样本更加有选择性地判别。检测器一个
码大哥
·
2024-08-30 15:58
深度学习
人工智能
Prompt Engineering Concepts
Introduction,ConceptsTextgenerationmodelsgenerationpre-trained
transformer
s,GPTforshort.所以呢,前置知识是
Transformer
Assistants
初梦语雪
·
2024-08-30 06:59
#
NLP
prompt
大模型训练优化方法
本文主要参考HF上的一篇文章:https://huggingface.co/docs/
transformer
s/perf_train_gpu_one,以及笔者在实际训练中的一些经验,给出一些比较实用的方法
少喝冰美式
·
2024-08-30 05:28
人工智能
大语言模型
ai大模型
大模型应用
LLM
大模型训练
计算机技术
大模型训练和推理
文章目录一、NLP基础1.Tokenizer2.positionencoding3.注意力机制与
transformer
架构二、大模型训练1.SFT训练2.RLHF训练3.分布式并行训练技术(1)模型并行
李明朔
·
2024-08-30 01:27
AIGC
深度学习
人工智能
HuggingFace - linux环境 修改下载默认缓存路径
_使用huggingface下载bert保存在哪里怎么看-CSDN博客Howtochangehuggingface
transformer
sdefaultcachedirectory-StackOverflowlinux
如果曾经拥有
·
2024-08-30 01:53
LLM
linux
缓存
人工智能
【多变量输入超前多步预测】基于
Transformer
的光伏功率预测研究(Matlab代码实现)
本文目录如下:目录⛳️赠与读者1概述一、
Transformer
模型概述二、多变量输入三、超前多步预测四、实现步骤五、优势与挑战优势:挑战:六、结论与展望2运行结果3参考文献4Matlab代码、数据⛳️赠与读者做科研
科研_G.E.M.
·
2024-08-29 21:58
transformer
matlab
深度学习
[从0开始AIGC][LLM]:Pre-Norm or Post-Norm?训练效率还是训练效果?
Pre-NormorPost-NormPre-NormorPost-Norm1.什么是Pre-Norm和Post-Norm2.为什么Pre-Norm比Post-Norm易于训练2.1
Transformer
Way_X
·
2024-08-29 05:42
#
从0开始AIGC
AIGC
AIGC深度学习教程:
Transformer
模型中的Position Embedding实现与应用
在进入深度学习领域时,
Transformer
模型几乎是绕不开的话题,而其中的PositionEmbedding更是关键。
玩AI的小胡子
·
2024-08-29 05:10
embedding
transformer
AIGC
人工智能
TPAMI 2024 | TransVG++:基于语言条件视觉
Transformer
的端到端视觉定位
题目:TransVG++:End-to-EndVisualGroundingWithLanguageConditionedVision
Transformer
TransVG++:基于语言条件视觉
Transformer
小白学视觉
·
2024-08-29 00:33
论文解读
IEEE
TPAMI
transformer
深度学习
人工智能
TAPMI
顶刊论文
论文解读
【
论文阅读
】LLM4SGG: Large Language Models for Weakly Supervised Scene Graph Generation
【
论文阅读
】LLM4SGG:LargeLanguageModelsforWeaklySupervisedSceneGraphGenerationabstract由于全监督方法严重依赖昂贵标注,最近弱监督场景图生成
进击的乔洋
·
2024-08-28 19:03
论文阅读
语言模型
人工智能
计算机视觉
论文:Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks
论文:Retrieval-AugmentedGenerationforKnowledge-IntensiveNLPTaskscode:https://github.com/huggingface/
transformer
scode
Ian_Wonder
·
2024-08-28 18:27
论文阅读
【好书分享第十期】大模型应用解决方案_基于ChatGPT和GPT-4等
Transformer
架构的自然语言处理(文末送书)
文章目录前言一、内容简介二、作者简介三、目录四、摘录粉丝福利前言在不到4年的时间里,
Transformer
模型以其强大的性能和创新的思想,迅速在NLP社区崭露头角,打破了过去30年的记录。
屿小夏
·
2024-08-28 14:56
书籍推荐
chatgpt
transformer
架构
大模型
AI
Python深度学习:构建下一代智能系统
为了帮助广大学员更加深入地学习人工智能领域最近3-5年的新理论与新技术,本文讲解注意力机制、
Transformer
模型(BERT、GPT-1/2/3/3.5/4、DETR、ViT、Swin
Transformer
2401_83402415
·
2024-08-28 10:04
python
python
深度学习
开发语言
Transformer模型
目标检测算法
Attention
回归预测|基于鲸鱼优化WOA-
Transformer
-BiLSTM组合模型的数据回归预测Matlab程序多特征输入单输出
回归预测|基于鲸鱼优化WOA-
Transformer
-BiLSTM组合模型的数据回归预测Matlab程序多特征输入单输出文章目录前言时序预测|基于鲸鱼优化WOA-
Transformer
-BiLSTM组合模型的数据时序预测
机器不会学习CL
·
2024-08-28 02:14
时间序列预测
智能优化算法
回归
transformer
matlab
Code Llama: Open Foundation Models for Code
论文阅读
整体介绍CodeLlama发布了3款模型,包括基础模型、Python专有模型和指令跟随模型,参数量分别为7B、13B、34B和70B。这些模型在长达16ktokens的序列上训练。都是基于Llama2。作者针对infilling(FIM)、长上下文、指令专门做了微调long-contextfine-tuning(LCFT).codellama细节CodeLlama模型家族初始化:所有CodeLla
yang_daxia
·
2024-08-27 18:46
大模型
llama
codellama
讲解如何使用RAG(检索增强生成)和LLM(大语言模型)来构建一个法律咨询网站。
2.环境配置安装必要的Python库:pipinstallopenaifaiss-cpusentence-
transformer
sflask二、设计系统架构整个系统将包括以下几个部分:前端:用户输入问题和上传文件的界面
winfredzhang
·
2024-08-27 12:44
语言模型
人工智能
自然语言处理
rag
LLM
OpenAI
深度学习学习经验——变换器(
Transformer
)
变换器(
Transformer
)变换器(
Transformer
)是一种用于处理序列数据的深度学习模型,与循环神经网络(RNN)不同,它不依赖于顺序处理数据,而是依靠一种称为注意力机制(AttentionMechanism
Linductor
·
2024-08-26 19:44
深度学习学习经验
深度学习
学习
transformer
CVPR2024部分研究方向文章梳理(持续更新中)
CVPR2024部分研究方向文章梳理(持续更新中)长尾分布(Long-Tailed)DeiT-LT:DistillationStrikesBackforVision
Transformer
TrainingonLong-TailedDatasets
路漫漫独求索
·
2024-08-26 14:12
计算机视觉
人工智能
深度学习
分类
AI作画
stable
diffusion
【
论文阅读
】Model Stealing Attacks Against Inductive Graph Neural Networks(2021)
摘要Manyreal-worlddata(真实世界的数据)comeintheformofgraphs(以图片的形式).Graphneuralnetworks(GNNs图神经网络),anewfamilyofmachinelearning(ML)models,havebeenproposedtofullyleveragegraphdata(充分利用图数据)tobuildpowerfulapplicat
Bosenya12
·
2024-08-26 12:29
科研学习
模型窃取
论文阅读
图神经网络
模型窃取
神经网络微调技术全解(02)-针对每种微调技术的具体实施示例(含代码)
python复制代码from
transformer
simportBertModel,AdapterConfig,AdapterModel#加载预训练的BERT模型model=BertModel.from_pretrai
技术与健康
·
2024-08-26 11:20
机器学习
神经网络
人工智能
深度学习--
Transformer
和BERT区别详解
Transformer
的概念、作用、原理及应用概念
Transformer
是一种基于注意力机制(AttentionMechanism)的神经网络架构,由Vaswani等人在2017年提出。
Ambition_LAO
·
2024-08-26 08:36
深度学习
从零开始大模型开发与微调:有趣的词嵌入
从最初的词袋模型、隐语义模型,到如今的
Transformer
模型,PLMs在NLP任务中取得了
AGI通用人工智能之禅
·
2024-08-26 08:33
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
【机器学习】机器学习与大模型在人工智能领域的融合应用与性能优化新探索
文章目录引言机器学习与大模型的基本概念机器学习概述监督学习无监督学习强化学习大模型概述GPT-3BERTResNet
Transformer
机器学习与大模型的融合应用自然语言处理文本生成文本分类机器翻译图像识别自动驾驶医学影像分析语音识别智能助手语音转文字大模型性能优化的新探索模型压缩权重剪枝量化知识蒸馏分布式训练数据并行模型并行异步训练高效推理模型裁剪缓存机制专用硬件未来展望跨领域应用智能化系统人
E绵绵
·
2024-08-26 06:25
Everything
人工智能
机器学习
大模型
python
AIGC
应用
科技
小白学大模型——Qwen2理论篇
一、Qwen2架构图二、Qwen2技术修改点
Transformer
ArchitecturewithSwiGLUactivation:不多说,最主流的
transformer
架构,不变。
fan_fan_feng
·
2024-08-25 14:41
大模型
人工智能
自然语言处理
欺诈文本分类微调(六):Lora单卡训练
关于训练器,使用
transformer
s库中提供的Trainer类。2.数据准备2.1加载数据导入要使用的基础包。impor
沉下心来学鲁班
·
2024-08-25 11:27
微调
分类
人工智能
机器学习
语言模型
微调
使用 Hugging Face
Transformer
s 创建文本生成模型
HuggingFace
Transformer
s是一个流行的Python库,它提供了大量预训练的模型以及API来实现各种自然语言处理任务。
Envyᥫᩣ
·
2024-08-25 05:47
人工智能
VIT
论文阅读
: A Image is Worth 16x16 Words
简介在2024年,大家都知道了
transformer
的故事,但是在4年前,CNN和
Transformer
谁才是CV的未来,还没有那么确定。
Undefined游侠
·
2024-08-24 17:37
论文阅读
【
论文阅读
】GLiRA: Black-Box Membership Inference Attack via Knowledge Distillation
摘要While(虽然)DeepNeuralNetworks(DNNs)havedemonstratedremarkableperformanceintasksrelatedtoperception(感知)andcontrol(控制),therearestillseveralunresolvedconcerns(未解决的问题)regardingtheprivacyoftheirtrainingdat
Bosenya12
·
2024-08-24 16:35
模型窃取
科研学习
论文阅读
知识蒸馏
成员推理攻击
黑盒
【
论文阅读
】APMSA: Adversarial Perturbation Against Model Stealing Attacks(2023)
摘要TrainingaDeepLearning(DL)model(训练深度学习模型)requiresproprietarydata(专有数据)andcomputing-intensiveresources(计算密集型资源).Torecouptheirtrainingcosts(收回训练成本),amodelprovidercanmonetizeDLmodelsthroughMachineLearni
Bosenya12
·
2024-08-24 16:04
科研学习
模型窃取
论文阅读
模型窃取
防御
对抗性扰动
Google BERT 算法全面分析
一、什么是BERT算法BERT全称是BidirectionalEncoderRepresentationsfrom
Transformer
s,BERT算法诞生于2018年,从当时开始就引起了AI界尤其是NLP
云点SEO
·
2024-08-24 08:44
外贸推广
谷歌优化
谷歌SEO
算法
百度
python
机器学习
java
informer+TCN+通道注意力机制+SSA时间序列模型预测
它是基于
Transformer
结构的一种改进,主要解决了传统
Transformer
在处理长序列时计算复杂度高的问题。
成为深度学习高手
·
2024-08-23 23:12
算法
机器学习
深度学习
transformer
transformer
s调用llama的方式
transformer
s调用llama的使用方式不同版本llama对应的
transformer
s库版本llama2llama3Meta-Llama-3-8B-InstructMeta-Llama-3-8Bllama3.1Meta-Llama
myccver
·
2024-08-23 13:11
llama
深度学习
pytorch
Transformer
总结(二):架构介绍(从seq2seq谈到
Transformer
架构)
文章目录一、seq2seq应用介绍二、编码器解码器架构2.1流程介绍2.2原理说明三、
Transformer
整体结构和处理流程3.1Attention机制在seq2seq中的引入3.2比较RNN与自注意力
胡牧之.
·
2024-08-23 10:19
Transformer总结
transformer
编码器解码器
深度学习
入门
Conditional Flow Matching: Simulation-Free Dynamic Optimal Transport
论文阅读
笔记
ConditionalFlowMatching:Simulation-FreeDynamicOptimalTransport笔记发现问题连续正规化流(CNF)是一种有吸引力的生成式建模技术,但在基于模拟的最大似然训练中受到了限制。解决问题介绍一种新的条件流匹配(CFM),一种针对CNFs的免模拟训练目标。具有稳定的回归目标,用于扩散模型中的随机流,但享有确定性流模型的有效推断。与扩散模型和CNF目
猪猪想上树
·
2024-08-23 03:06
论文阅读
笔记
AIGC(人工智能生成内容)的底层技术:技术架构、逻辑代码
选择合适的模型架构,如
Transformer
熊群
·
2024-08-22 20:55
AIGC
人工智能
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他