Transformer 第9页

深入理解AIGC背后的核心算法：GAN、Transformer与Diffusion Models

深入理解AIGC背后的核心算法：GAN、Transformer与DiffusionModels前言随着人工智能技术的发展，AIGC（AIGeneratedContent，人工智能生成内容）已经不再是科幻电影中的幻想

忘梓.·2025-01-21 10:36

ATB是什么？

1ATB介绍AscendTransformerBoost加速库（下文简称为ATB加速库）是一款高效、可靠的加速库，基于华为AscendAI处理器，专门为Transformer类模型的训练和推理而设计。

·2025-01-20 17:50

一文看懂llama2（原理&模型&训练）

自从Transformer架构问世以来，大型语言模型（LargeLanguageModels,LLMs）以及AIGC技术的发展速度惊人，它们不仅在技术层面取得了重大突破，还在商业应用、社会影响等多个层面展现出巨大潜力

Qpeterqiufengyi·2025-01-20 07:38

提升YOLOv8性能：用Swin Transformer替换Backbone的详细实现与分析【YOLOv8】

专栏订阅地址：https://blog.csdn.net/mrdeam/category_12804295.html文章目录YOLOv8改进|主干篇|SwinTransformer替换Backbone（

步入烟尘·2025-01-20 05:57

YOLOv8与Transformer：探索目标检测的新架构

YOLOv8与Transformer：探索目标检测的新架构关键词：目标检测，深度学习，YOLOv8，Transformer，计算机视觉，卷积神经网络摘要：目标检测是计算机视觉领域的一项重要任务，其目标是从图像或视频中识别和定位特定对象

AI架构设计之禅·2025-01-20 05:23

使用Python实现LLM的文本生成：风格迁移与内容控制

文章目录引言1.大型语言模型（LLM）概述1.1Transformer架构1.2预训练与微调2.文本生成基础2.1无条件生成2.2条件生成3.风格迁移3.1风格迁移的基本原理3.2使用Python实现风格迁移

二进制独立开发·2025-01-20 02:46

ChatGPT详解

ChatGPT是一款由OpenAI研发和维护的先进的自然语言处理模型（NLP），全名为ChatGenerativePre-trainedTransformer，于2022年11月30日发布。

Loving_enjoy·2025-01-19 23:22

工业场景将成为AI大模型的重要战场！零基础入门AI大模型，看这篇就够了！

随着GPT-4o、Gemini1.5Pro、LLaVA1.6的发布，基于Transformer架构和海量数据训练的多模态大模型再次点燃通用人工智能（AGI），其对文本、图像等多模态输入的支持和强大的理解能力也象征着人工智能迈向通用人工智能

大模型扬叔·2025-01-19 20:29

Pytorch详解-模型模块(RNN,CNN,FNN,LSTM,GRU,TCN,Transformer)

Pytorch详解-模型模块Module¶meterModule初认识forward函数ParameterPytorch中的权重、参数和超参数Module容器-ContainersSequentialModuleListModuleDictParameterList&ParameterDict常用网络层LSTM输入和输出GRUConvolutionalLayers卷积层的基本概念常见的卷积

qq742234984·2025-01-19 13:24

厉害了，LSTM+Transformer王炸创新，精准度又高了！

【LSTM+Transformer】作为一种混合深度学习模型，近年来在学术界和工业界都受到了极大的关注。

马拉AI·2025-01-19 12:48

ChatGPT原理及其应用场景

ChatGPT的原理及应用场景一、ChatGPT的原理ChatGPT，全名ChatGenerativePre-trainedTransformer，是OpenAI研发的一款聊天机器人程序，其背后依托的是人工智能技术和自然语言处理

编程小郭·2025-01-19 11:47

第二课堂笔记——大语言模型

pipinstalltransformers==4.37.0-U用于安装或更新Python的transformers库到特定版本4.37.0。‌

skna_·2025-01-19 06:26

深度学习-45-大型语言模型LLM之本地化部署运行自己的大模型

2.4LLM的结构2.4.1Transformer2.4.2Prompts2.4.3FineTuning3本地跑大模型3.1Ollama运行开源LLM3.1.1启动并运行3.1.2使用api访问3.1.3

皮皮冰燃·2025-01-19 04:58

ChatGPT大模型极简应用开发-目录

引言要理解ChatGPT，了解其背后的Transformer架构和GPT技术一路的演进则变得非常必要。

uncle_ll·2025-01-18 20:55

nlp培训重点-3

importjsonimportreimportosimporttorchimportrandomimportloggingfromtorch.utils.dataimportDataset,DataLoaderfromcollectionsimportdefaultdictfromtransformersimportBertT

heine162·2025-01-18 18:24

LLMs，即大型语言模型

LLMs的核心架构是Transformer，其关键在于自注意力机制，使得模型能够同时对输入的所有位置进行“关注”，从而更好地捕捉长距离的语义依赖关系。

maopig·2025-01-18 17:52

第79期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。

云起无垠·2025-01-18 17:22

第60期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。

云起无垠·2025-01-18 17:22

全新 Hopper 架构的Transformer 引擎有什么特点？

Transformer引擎是全新Hopper架构的一部分，将显著提升AI性能和功能，并助力在几天或几小时内训练大型模型。

扫地的小何尚·2025-01-18 17:50

BERT详解

1.背景结构1.1基础知识BERT（BidirectionalEncoderRepresentationsfromTransformers）是谷歌提出，作为一个Word2Vec的替代者，其在NLP领域的

comli_cn·2025-01-18 17:18

1.4走向不同：GPT 与 BERT 的选择——两大NLP模型的深度解析

走向不同：GPT与BERT的选择——两大NLP模型的深度解析在自然语言处理（NLP）领域，GPT（GenerativePretrainedTransformer）和BERT（BidirectionalEncoderRepresentationsfromTransformers

少林码僧·2025-01-18 16:12

第83期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。

云起无垠·2025-01-18 16:11

NVIDIA Hopper 架构深入

主要新功能包括：2.新的transformer引擎结合使用软件和定制

RZer·2025-01-18 16:40

使用神经网络拟合6项参数

使用神经网络拟合6项参数1.数据预处理1.1添加参数解析1.2数据预处理逻辑1.3数据归一化及划分1.4数据标签处理逻辑1.5数据转torch2.定义model2.1CNN_LSTM2.2Transformer3

Andrew_Xzw·2025-01-18 15:06

【大模型LoRa微调】Qwen2.5 Coder 指令微调【代码已开源】

~~~https://github.com/LFF8888/FF-Studio-Resources第001个文件哦~一、引言：大语言模型与指令微调1.1大语言模型发展简史随着深度学习的飞速发展，特别是Transformer

FF-Studio·2025-01-18 07:31

Transformer 架构对比：Dense、MoE 与 Hybrid-MoE 的优劣分析

1.LLM基础架构类型DenseTransformerMoE(MixtureofExperts)TransformerHybrid-MoETransformer2.Transformer按照编码方式分类单向自回归模型

XianxinMao·2025-01-18 05:21

第78期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。

·2025-01-18 05:13

【YOLOv8改进- Backbone主干】YOLOv8更换主干网络之ConvNexts，纯卷积神经网络，更快更准，，降低参数量！

YOLOv8有效改进系列及项目实战目录包含卷积，主干注意力，检测头等创新机制以及各种目标检测分割项目实战案例专栏链接:YOLOv8基础解析+创新改进+实战案例介绍摘要视觉识别的“咆哮20年代”开始于视觉Transformer

YOLO大师·2025-01-18 02:59

第81期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。

·2025-01-18 01:02

第83期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。

·2025-01-18 00:26

Time-LLM ：超越了现有时间序列预测模型的学习器

福安德信息科技·2025-01-17 23:38

注意力池化层：从概念到实现及应用

多头注意力机制（MultiheadAttention）是Transformer模型的核心，它通过多个注意力头来捕捉序列中不同部分之间的关系。

专业发呆业余科研·2025-01-17 21:39

LTX-Video 高效视频生成模型，一键处理图片&文字

LTX-Video是由Lightricks在2024年开发的一种视频生成模型，这种模型采用了transformer和Video-VAE技术，能够高效生成高分辨率视频。

·2025-01-17 20:21

第79期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。

·2025-01-17 19:08

深度定制：Embedding与Reranker模型的微调艺术

微调过程可以使用不同的库和框架来实现，例如sentence-transformers库，它提供了便捷的API来调整Embeddin

从零开始学习人工智能·2025-01-17 15:22

开源人工智能模型框架：探索与实践

通过对多个主流开源框架，如TensorFlow、PyTorch、Keras、Detectron2、OpenCV、HuggingFaceTransformers、AllenNLP、MindSpore和Fastai

CodeJourney.·2025-01-17 12:27

如何学习Transformer架构

Transformer架构自提出以来，在自然语言处理领域引发了革命性的变化。作为一种基于注意力机制的模型，Transformer解决了传统序列模型在并行化和长距离依赖方面的局限性。

fydw_715·2025-01-17 10:07

pip install transformers教程

直接pipinstalltransformers会报错，报错内容如下：Collectingsafetensors>=0.3.1(fromtransformers)Usingcachedsafetensors

养一只Trapped_beast·2025-01-17 09:26

北大新模型FAN：新型神经网络架构，填补周期性特征建模空白

然而，传统的神经网络模型，如多层感知器（MLP）和Transformer，在周期性建模方面却存在明显不足。

海森大数据·2025-01-17 07:11

MiniMax开源，突破传统Transformer架构，震撼业界

国产大模型市场再掀巨浪，传统Transformer架构或许将不再是唯一选择。

·2025-01-17 01:18

从RNN到Transformer：生成式AI技术演变与未来展望

从传统的递归神经网络（RNN）到革命性的Transformer架构，本文将全面剖析这一技术发展历程。

非著名架构师·2025-01-17 00:42

211本硕二战腾讯大模型算法岗，已凉......

八股，双向transformerencoder结构，

AI大模型入门·2025-01-16 21:47

手撕Transformer -- Day2 -- Embdding

手撕Transformer–Day2–Embdding目录手撕Transformer--Day2--EmbddingTransformer网络结构图代码Part1库函数Part2实现嵌入以及位置编码，作为一个类

小菜鸟博士·2025-01-16 21:45

一起学Hugging Face Transformers（8）- 使用Transformers 库制作一个简易问答系统

HuggingFaceTransformers库是一个强大的工具，它提供了许多预训练的自然语言处理模型，简化了构建问答系统的过程。本文将介绍如何使用Huggi

做个天秤座的程序猿·2025-01-16 17:35

Hugging Face Transformers 库学习提纲

文章目录前言一、[基础概念](https://blog.csdn.net/kljyrx/article/details/139984730)二、[环境准备](https://blog.csdn.net/kljyrx/article/details/140006571)三、库的基本使用四、高级应用五、实践案例六、生态系统和工具七、社区与资源八、进阶学习总结前言HuggingFaceTransform

做个天秤座的程序猿·2025-01-16 17:05

不科学上网使用Hugging Face的Transformers库

参考ProgramSynthesiswithCodeGen—ROCmBlogs(amd.com)HF-Mirror-Huggingface镜像站https://huggingface.co/docs/transformers

109702008·2025-01-16 16:02

BART&BERT

BART和BERT都是基于Transformer架构的预训练语言模型。

Ambition_LAO·2024-09-16 07:02

季风泯灭的季节·2024-09-16 04:13

轻量级模型解读——轻量transformer系列

文章目录1、DeiT2、ConViT3、Mobile-Former4、MobileViTTransformer是2017谷歌提出的一篇论文，最早应用于NLP领域的机器翻译工作，Transformer解读

lishanlu136·2024-09-16 01:18

探索创新科技： Lite-Mono - 简约高效的小型化Mono框架

探索创新科技：Lite-Mono-简约高效的小型化Mono框架Lite-Mono[CVPR2023]Lite-Mono:ALightweightCNNandTransformerArchitectureforSelf-SupervisedMonocularDepthEstimation

杭律沛Meris·2024-09-15 21:38

推荐频道

Transformer

深入理解AIGC背后的核心算法：GAN、Transformer与Diffusion Models

ATB是什么？

一文看懂llama2（原理&模型&训练）

提升YOLOv8性能：用Swin Transformer替换Backbone的详细实现与分析【YOLOv8】

YOLOv8与Transformer：探索目标检测的新架构

使用Python实现LLM的文本生成：风格迁移与内容控制

ChatGPT详解

工业场景将成为AI大模型的重要战场！零基础入门AI大模型，看这篇就够了！

Pytorch详解-模型模块(RNN,CNN,FNN,LSTM,GRU,TCN,Transformer)

厉害了，LSTM+Transformer王炸创新，精准度又高了！

ChatGPT原理及其应用场景

第二课堂笔记——大语言模型

深度学习-45-大型语言模型LLM之本地化部署运行自己的大模型

ChatGPT大模型极简应用开发-目录

nlp培训重点-3

LLMs，即大型语言模型

第79期 | GPTSecurity周报

第60期 | GPTSecurity周报

全新 Hopper 架构的Transformer 引擎有什么特点？

BERT详解

1.4走向不同：GPT 与 BERT 的选择——两大NLP模型的深度解析

第83期 | GPTSecurity周报

NVIDIA Hopper 架构深入

使用神经网络拟合6项参数

【大模型LoRa微调】Qwen2.5 Coder 指令微调【代码已开源】

Transformer 架构对比：Dense、MoE 与 Hybrid-MoE 的优劣分析

第78期 | GPTSecurity周报

【YOLOv8改进- Backbone主干】YOLOv8更换主干网络之ConvNexts，纯卷积神经网络，更快更准，，降低参数量！

第81期 | GPTSecurity周报

第83期 | GPTSecurity周报

Time-LLM ：超越了现有时间序列预测模型的学习器

注意力池化层：从概念到实现及应用

LTX-Video 高效视频生成模型，一键处理图片&文字

第79期 | GPTSecurity周报

深度定制：Embedding与Reranker模型的微调艺术

开源人工智能模型框架：探索与实践

如何学习Transformer架构

pip install transformers教程

北大新模型FAN：新型神经网络架构，填补周期性特征建模空白

MiniMax开源，突破传统Transformer架构，震撼业界

从RNN到Transformer：生成式AI技术演变与未来展望

211本硕二战腾讯大模型算法岗，已凉......

手撕Transformer -- Day2 -- Embdding

一起学Hugging Face Transformers（8）- 使用Transformers 库制作一个简易问答系统

Hugging Face Transformers 库学习提纲

不科学上网使用Hugging Face的Transformers库

BART&BERT

AI大模型的架构演进与最新发展

轻量级模型解读——轻量transformer系列

探索创新科技： Lite-Mono - 简约高效的小型化Mono框架