Transformer论文学习第26页

大型语言模型：SBERT — Sentence-BERT

@slavahead一、介绍Transformer在NLP方面取得了进化进步，这已经不是什么秘密了。基于转换器，许多其他机器学习模型已经发展起来。

无水先生·2023-12-20 16:39

大型语言模型：RoBERTa — 一种稳健优化的 BERT 方法

BERT的架构源自Transformer，它在各种下游任务上取得了最先进的结果：语言建模、下一句预测、问答、NER标记等。尽管BERT性能出色，研究人员仍在继续尝试其配置，希望获得更好的指标。

无水先生·2023-12-20 16:39

x3::forward_ast

在BoostSpiritX3中，x3::forward_ast是一个转换器（transformer），用于将解析器（parser）的结果转发给用户自定义的结构。

qq_40178082·2023-12-20 15:20

[Big Bird]论文解读：Big Bird: Transformers for Longer Sequences

文章目录1介绍2模型架构3结果论文：BigBird:TransformersforLongerSequences作者：ManzilZaheer,GuruGuruganesh,AvinavaDubey,JoshuaAinslie

Bigcrab__·2023-12-20 14:30

[FNet]论文实现：FNet：Mixing Tokens with Fourier Transform

MixingTokenswithFourierTransforms作者：JamesLee-Thorp,JoshuaAinslie,IlyaEckstein,SantiagoOntanon时间：20221.介绍transformerencode

Bigcrab__·2023-12-20 14:00

Self-Supervised Masked Convolutional Transformer Block for Anomaly Detection 论文阅读

文章信息发表于：IEEETransactionsonPatternAnalysisandMachineIntelligenceJanuary2024CCFA原文链接：https://ieeexplore.ieee.org/document/10273635代码链接：https://github.com/ristea/ssmctb/Self-SupervisedMaskedConvolutional

何大春·2023-12-20 12:19

【HuggingFace Transformer库学习笔记】基础组件学习：Tokenizer

基础组件——Tokenizer（1）模型加载fromtransformersimportAutoTokenizersen="弱小的我也有大梦想!"

辰阳星宇·2023-12-20 07:23

【深度学习】注意力机制（七）Agent Attention

本文介绍AgentAttention注意力机制，Transformer中的Attention模块可以提取全局语义信息，但是计算量太大，AgentAttention是一种计算非常有效的Attention模块

justld·2023-12-20 07:19

RASP技术相关内容DEMO实现

StringagentArgs,Instrumentationinst)throwsUnmodifiableClassException,IOException{readVersion();inst.addTransformer

强仔fight·2023-12-20 06:05

Transformer注意力机制模型介绍

Self-AttentionataHighLevel)编码器(Encoder)多头注意力机制(TheBeastWithManyHeads)残差神经网络解码器(Decoder)线性(Linear)层和softmax层位置编码总结参考文献前言Transformer

安替-AnTi·2023-12-20 06:28

nlp与cv的发展

Transformer的出现,促进了更高容量模型的建立,为大模型的出现奠定基础.大模型通常具有十亿个以上参数(仅供参考)左边的蓝色是CV领域、右下绿色是NLP、右上蓝色是多模态基础模型(FoundationalModels

卅拓·2023-12-20 01:58

PAMI2023: VLT: Vision-Language Transformer and Query Generation for Referring Segmentation

文章目录1、Abstract2、整体架构3、Spatial-DynamicMulti-ModalFusion4、QueryGenerationModule5、QueryBalanceModule6、MaskDecoder7、MaskedContrastiveLearning8、可视化结果1、Abstract提出了VLT框架，以促进多模态信息之间的深度交互，并增强对视觉语言特征的整体理解。为了应对语

masterleoo·2023-12-20 01:52

基于Swin_Transformer的图像超分辨率系统

1.研究背景与意义项目参考AAAIAssociationfortheAdvancementofArtificialIntelligence研究背景与意义随着科技的不断发展，图像超分辨率技术在计算机视觉领域中变得越来越重要。图像超分辨率是指通过使用计算机算法将低分辨率图像转换为高分辨率图像的过程。这项技术在许多领域都有广泛的应用，包括医学图像处理、监控摄像头、卫星图像处理等。在过去的几十年里，图像超

xuehai996·2023-12-20 00:32

【智慧之窗】AI驱动产品探索

一.初识ChatGPTChatGPT是由OpenAI开发的自然语言处理（NLP）模型，基于GPT（GenerativePre-trainedTransformer）架构。

檀越剑指大厂·2023-12-19 23:27

【论文阅读】BERTopic：采用一个基于类的TF-IDF流程进行神经网络的主题建模

具体来说，BERTopic采用预训练的基于transformer的语言模型来产生文档的嵌入，对这些文档嵌入进行聚类，并最后利用基于类的TF-IDF过程来产生话题的表示。BERT

沐兮Krystal·2023-12-19 22:51

DALL-E 系列：AI绘画背后的惊人真相！！【1个离奇内幕、3个意想不到、5大秘密揭示】

DALL-E系列：AI绘图原理，根据用户给出的描述，生成与描述相匹配的图像DALL-E1dVAETransformerDALL-E2CLIP先验priordecoder（image）DALL-E3论文地址

Debroon·2023-12-19 21:48

NLP之transformer-Task02attention&transformer

本此学习内容由datawhale提供，非常感谢datawhale。学习内容Attention相关原理背景：Attention出现的原因是什么？潜在的答案：基于循环神经网络（RNN）一类的seq2seq模型，在处理长文本时遇到了挑战，而对长文本中不同位置的信息进行attention有助于提升RNN的模型效果。1.什么是seq2seq模型？eq2seq是一种常见的NLP模型结构，全称是：sequenc

曼曼668·2023-12-19 21:17

（2021|ICCV，DINO，ViT，自监督学习，知识蒸馏）自监督视觉 Transformer 的新特性

EmergingPropertiesinSelf-SupervisedVisionTransformers公纵号：EDPJ（添加VX：CV_EDPJ或直接进Q交流群：922230617获取资料）目录0.

EDPJ·2023-12-19 19:51

一文图解 Transformer，小白也看得懂（完整版）

原作者：JayAlammar原链接：https://jalammar.github.io/illustrated-transformer1.导语谷歌推出的BERT模型在11项NLP任务中夺得SOTA结果

Python算法实战·2023-12-19 17:03

The Annotated Transformer 最新翻译

IT斜杆青年·2023-12-19 15:51

Transformer源码（带注释）

代码来源：Transformer代码(源码Pytorch版本)从零解读(Pytorch版本）在up主的注释下增加了一些自己的注释在看Transformer源码前，必须要先从李宏毅/李沐那里把注意力机制/

丸丸丸子w·2023-12-19 14:16

【pytorch】图像运行过程中，保证梯度情况下变换

self.patch_transformer(adv_patch,lab_batch,img_size,do_rotate=True,rand_loc=False)p_img_batch=self.patch_applier

prinTao·2023-12-19 14:29

一点技术细节

14-4:匈牙利算法HungarianAlgorithm_哔哩哔哩_bilibili课件：https://github.com/wangshusen/AdvancedAlgorithms.gitSWintransformer

じんじん·2023-12-19 11:18

【Transformer】ViT and TNT（2）

同济大佬唐宇迪博士终于把【Transformer】入门到精通全套课程分享出来了，最新前沿方向学习笔记VITeg，图片分块，10x10x3的patch通过conv拉成向量，就无缝对接了位置编码可以多种方式

bryant_meng·2023-12-19 08:41

应用Transformer和CNN进行计算机视觉任务各自的优缺点

Transformer和CNN（卷积神经网络）是用于计算机视觉任务的两种不同的深度学习架构，各自具有一些优点和局限性。

BugMaker2002·2023-12-19 08:11

【Transformer】Transformer and BERT（1）

文章目录TransformerBERT太…完整了！

bryant_meng·2023-12-19 08:40

Transformer Decoder的输入

大部分引用参考了既安的https://www.zhihu.com/question/337886108/answer/893002189这篇文章，个人认为写的很清晰，此外补充了一些自己的笔记。弄清楚Decoder的输入输出，关键在于图示三个箭头的位置：以翻译为例：输入：我爱中国输出：ILoveChina因为输入（“我爱中国”）在Encoder中进行了编码，这里我们具体讨论Decoder的操作，也就

可keke·2023-12-19 06:31

【论文阅读笔记】A Recent Survey of Vision Transformers for Medical Image Segmentation

KhanA,RaufZ,KhanAR,etal.ARecentSurveyofVisionTransformersforMedicalImageSegmentation[J].arXivpreprintarXiv

cskywit·2023-12-19 05:51

【论文阅读笔记】Pre-trained Universal Medical Image Transformer

LuoL,ChenX,TangB,etal.Pre-trainedUniversalMedicalImageTransformer[J].arXivpreprintarXiv:2312.07630,2023

cskywit·2023-12-19 05:18

YOLOv8最新改进系列：YOLOv8融合SwinTransformer模块，有效提升小目标检测效果！

AI棒棒牛·2023-12-19 04:20

YOLOV8改进:更换PoolFormer主干网络

Transformer已经在计算机视觉中展现了巨大的潜力，一个常见的观念是视觉Transformer之所

资料汇总笔记·2023-12-19 04:48

GPT-2 模型 Part (3)

Summarization：TransferLearning：MusicGeneration：ResourcesTheGPT2ImplementationfromOpenAICheckoutthepytorch-transformerslibraryfromHuggingFaceinadditiontoGPT2

LittleTreeT·2023-12-18 21:49

AIGC智能创作时代一书总结

FoundationModel大模型：LargeLanguageModel，LLMGAN（2014）、Diffusion（2015）、CLIP（2021）、Seq2Seq（2014）、Attention、Transformer

zhaosuyuan·2023-12-18 20:59

Transformer的学习

文章目录Transformer1.了解Seq2Seq任务2.Transformer整体架构3.Encoder的运作方式4.Decoder的运作方式5.AT与NAT6.Encoder和Decoder之间的互动

鱼儿也有烦恼·2023-12-18 19:48

论文笔记：Bilinear Attention Networks

更精简的论文学习笔记1、摘要多模态学习中的注意力网络提供了一种选择性地利用给定视觉信息的有效方法。然而，学习每一对多模态输入通道的注意力分布的计算成本是非常昂贵的。

hongyuyahei·2023-12-18 17:30

探索人工智能中的语言模型：原理、应用与未来发展

神经网络语言模型：利用深度学习技术，如循环神经网络（RNN）、长短时记忆网络（LSTM）、和最新的Transformer模型。2.应用领域及典型案例自然语言处理：语言

鳗小鱼·2023-12-18 14:48

YOLOv5改进 | SPPF | 将RT-DETR模型AIFI模块和Conv模块结合替换SPPF（全网独家改进）

RT-DETR号称是打败YOLO的检测模型，其作为一种基于Transformer的检测方法，相较于传统的基于卷积的检测方法，提供了更为全面和深入的特征理解，将RT-DETR中的一些先进模块融入到YOLOv5

Snu77·2023-12-18 13:08

Swin-Transformer 在图像识别中的应用

1.卷积神经网络简单介绍图像识别任务主要利用神经网络对图像进行特征提取，最后通过全连接层将特征和分类个数进行映射。传统的网络是利用线性网络对图像进行分类，然而图像信息是二维的，一般来说，图像像素点和周围邻域像素点相关。而线性分类网络将图像强行展平成一维，不仅仅忽略了图像的空间信息，而全连接层会大大增加网络的参数为了更好把握图像像素的空间信息，提出了CNN卷积神经网络，利用卷积核(滤波器)对图像进行

听风吹等浪起·2023-12-18 07:23

图像识别完整项目之Swin-Transformer，从获取关键词数据集到训练的完整过程

0.前言图像分类的大部分经典神经网络已经全部介绍完，并且已经作了测试代码已经全部上传到资源，根据文章名或者关键词搜索即可LeNet：pytorch搭建LeNet网络对CIFAR-10图片分类AlexNet：pytorch搭建AlexNet对花进行分类Vgg：pytorch搭建VGG网络GoogLeNet：pytorch搭建GoogLeNetResNet：ResNet训练CIFAR10数据集，并做图

听风吹等浪起·2023-12-18 07:17

微软提出Control-GPT：用GPT-4实现可控文本到图像生成！

点击下方卡片，关注“CVer”公众号AI/CV重磅干货，第一时间送达点击进入—>【目标检测和Transformer】交流群转载自：机器之心|编辑：小舟、梓文扩散模型虽好，但如何保证生成的图像准确高质量？

Amusi（CVer）·2023-12-18 02:04

文本处理工具doctran（集成LLM和NLP库）

该工具也可以在LangChain框架document_transformers模块内使用。（本质上是对LLM和NLP库的封装）G

hj_caas·2023-12-17 23:04

Inception V3 论文学习记录

原文：RethinkingtheInceptionArchitectureforComputerVision论文同时提出来InceptionV2和InceptionV3，它聚焦在提升模型准确率的前提下，还追求了计算效率和能耗等移动设备上的性能。目标在于充分利用计算效率通用设计原则1.避免过度降维或收缩特征，特别是在网络浅层降维会造成各通道间的相关性信息丢失，仅反映了稠密的信息2.特征越多，收敛越快

砥砺前行的人·2023-12-17 23:32

python unpack原理_Python transformers.Unpack方法代码示例

本文整理汇总了Python中fuel.transformers.Unpack方法的典型用法代码示例。如果您正苦于以下问题：Pythontransformers.Unpack方法的具体用法？

摄影师吴亚轩·2023-12-17 21:36

Windows11安装python模块transformers报错Long Path处理

Windows11安装python模块transformers报错，报错信息如下ERROR:CouldnotinstallpackagesduetoanOSError:[Errno2]Nosuchfileordirectory

!chen·2023-12-17 21:34

深入探讨Chat GPT，难道只有这2点用途？

作为一种先进的人工智能技术，ChatGPT（GenerativePre-trainedTransformer）是近年来在自然语言处理领域中备受关注的重要技术之一。

程序哥聊面试·2023-12-17 20:19

TransXNet：使用双动态令牌混合器学习全局和局部动态以实现视觉识别

AI浩·2023-12-17 18:45

YoloV5改进策略：双动态令牌混合器（D-Mixer）的TransXNet，实现YoloV5的有效涨点

使用D-Mixer作为基本构建块设计了TransXNet，这是一种新型的混合CNN-Transformer视觉主干网络，可提供引人注目的性能。在ImageNet-1K图像分类任务中，T

静静AI学堂·2023-12-17 16:33

Re57：读论文 Mention Memory: incorporating textual knowledge into Transformers through entity mention at

诸神缄默不语-个人CSDN博文目录诸神缄默不语的论文阅读笔记和分类论文名称：MentionMemory:incorporatingtextualknowledgeintoTransformersthroughentitymentionattention

诸神缄默不语·2023-12-17 15:41

【深度学习】注意力机制（六）

注意力机制（二）【深度学习】注意力机制（三）【深度学习】注意力机制（四）【深度学习】注意力机制（五）目录一、MobileVITv1二、MobileVITv2三、DAT（DeformableAttentionTransformer

justld·2023-12-17 14:17

推荐频道

Transformer论文学习