Transformer 第8页

第81期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。

·2025-01-18 01:02

第83期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。

·2025-01-18 00:26

Time-LLM ：超越了现有时间序列预测模型的学习器

福安德信息科技·2025-01-17 23:38

注意力池化层：从概念到实现及应用

多头注意力机制（MultiheadAttention）是Transformer模型的核心，它通过多个注意力头来捕捉序列中不同部分之间的关系。

专业发呆业余科研·2025-01-17 21:39

LTX-Video 高效视频生成模型，一键处理图片&文字

LTX-Video是由Lightricks在2024年开发的一种视频生成模型，这种模型采用了transformer和Video-VAE技术，能够高效生成高分辨率视频。

·2025-01-17 20:21

第79期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。

·2025-01-17 19:08

深度定制：Embedding与Reranker模型的微调艺术

微调过程可以使用不同的库和框架来实现，例如sentence-transformers库，它提供了便捷的API来调整Embeddin

从零开始学习人工智能·2025-01-17 15:22

开源人工智能模型框架：探索与实践

通过对多个主流开源框架，如TensorFlow、PyTorch、Keras、Detectron2、OpenCV、HuggingFaceTransformers、AllenNLP、MindSpore和Fastai

CodeJourney.·2025-01-17 12:27

如何学习Transformer架构

Transformer架构自提出以来，在自然语言处理领域引发了革命性的变化。作为一种基于注意力机制的模型，Transformer解决了传统序列模型在并行化和长距离依赖方面的局限性。

fydw_715·2025-01-17 10:07

pip install transformers教程

直接pipinstalltransformers会报错，报错内容如下：Collectingsafetensors>=0.3.1(fromtransformers)Usingcachedsafetensors

养一只Trapped_beast·2025-01-17 09:26

北大新模型FAN：新型神经网络架构，填补周期性特征建模空白

然而，传统的神经网络模型，如多层感知器（MLP）和Transformer，在周期性建模方面却存在明显不足。

海森大数据·2025-01-17 07:11

MiniMax开源，突破传统Transformer架构，震撼业界

国产大模型市场再掀巨浪，传统Transformer架构或许将不再是唯一选择。

·2025-01-17 01:18

从RNN到Transformer：生成式AI技术演变与未来展望

从传统的递归神经网络（RNN）到革命性的Transformer架构，本文将全面剖析这一技术发展历程。

非著名架构师·2025-01-17 00:42

211本硕二战腾讯大模型算法岗，已凉......

八股，双向transformerencoder结构，

AI大模型入门·2025-01-16 21:47

手撕Transformer -- Day2 -- Embdding

手撕Transformer–Day2–Embdding目录手撕Transformer--Day2--EmbddingTransformer网络结构图代码Part1库函数Part2实现嵌入以及位置编码，作为一个类

小菜鸟博士·2025-01-16 21:45

一起学Hugging Face Transformers（8）- 使用Transformers 库制作一个简易问答系统

HuggingFaceTransformers库是一个强大的工具，它提供了许多预训练的自然语言处理模型，简化了构建问答系统的过程。本文将介绍如何使用Huggi

做个天秤座的程序猿·2025-01-16 17:35

Hugging Face Transformers 库学习提纲

文章目录前言一、[基础概念](https://blog.csdn.net/kljyrx/article/details/139984730)二、[环境准备](https://blog.csdn.net/kljyrx/article/details/140006571)三、库的基本使用四、高级应用五、实践案例六、生态系统和工具七、社区与资源八、进阶学习总结前言HuggingFaceTransform

做个天秤座的程序猿·2025-01-16 17:05

不科学上网使用Hugging Face的Transformers库

参考ProgramSynthesiswithCodeGen—ROCmBlogs(amd.com)HF-Mirror-Huggingface镜像站https://huggingface.co/docs/transformers

109702008·2025-01-16 16:02

BART&BERT

BART和BERT都是基于Transformer架构的预训练语言模型。

Ambition_LAO·2024-09-16 07:02

季风泯灭的季节·2024-09-16 04:13

轻量级模型解读——轻量transformer系列

文章目录1、DeiT2、ConViT3、Mobile-Former4、MobileViTTransformer是2017谷歌提出的一篇论文，最早应用于NLP领域的机器翻译工作，Transformer解读

lishanlu136·2024-09-16 01:18

探索创新科技： Lite-Mono - 简约高效的小型化Mono框架

探索创新科技：Lite-Mono-简约高效的小型化Mono框架Lite-Mono[CVPR2023]Lite-Mono:ALightweightCNNandTransformerArchitectureforSelf-SupervisedMonocularDepthEstimation

杭律沛Meris·2024-09-15 21:38

解决BERT模型bert-base-chinese报错（无法自动联网下载）

二、网站google-bert(BERTcommunity)Thisorganizationismaintainedbythetransformerstea

搬砖修狗·2024-09-15 13:47

车载以太网之SOME/IP

发展历程AUTOSAR4.0-完成宝马SOME/IP消息的初步集成；AUTOSAR4.1-支持SOME/IP-SD及其发布/订阅功能；AUTOSAR4.2-添加transformer用于序列化以及其他相关优化

IT_码农·2024-09-15 10:20

基于深度学习的农作物病害检测

基于深度学习的农作物病害检测利用卷积神经网络（CNN）、生成对抗网络（GAN）、Transformer等深度学习技术，自动识别和分类农作物的病害，帮助农业工作者提高作物管理效率、减少损失。

SEU-WYL·2024-09-15 06:51

多模态Transformer之文本与图像联合建模 - Transformer教程

大家好，今天我们来聊聊一个既前沿又有趣的话题——多模态Transformer，特别是文本与图像的联合建模。

shandianfk_com·2024-09-14 22:52

transformer架构(Transformer Architecture)原理与代码实战案例讲解

transformer架构(TransformerArchitecture)原理与代码实战案例讲解关键词：Transformer,自注意力机制,编码器-解码器,预训练,微调,NLP,机器翻译作者：禅与计算机程序设计艺术

AI架构设计之禅·2024-09-14 16:47

多模态大模型微调Qwen-VL微调及日志

%pipinstallmodelscope-U%pipinstalltransformersacceleratetiktoken-U%pipinstalleinopstransformers_stream_generator-U

Messi^·2024-09-14 15:10

英伟达（NVIDIA）B200架构解读

H100芯片是一款高性能AI芯片，其中的TransformerEngine是专门用于加速Transformer模型计算的核心部件。

weixin_41205263·2024-09-14 14:31

大规模语言模型的书籍分享，从零基础入门到精通非常详细收藏我这一篇就够了

第一点是可拓展的训练架构与学习范式:Transformer架构能够拓展到百亿、千亿甚至万亿参数规模，并且将预训练任务统一为预测下一个词这一通用学习范式;第二点是对于数据质量与数据规模的重视:不同于BERT

黑客-雨·2024-09-13 10:05

QLoRa使用教程

https://huggingface.co/docs/peft/main/en/developer_guides/quantization案例11.4bit量化+LoRaimporttorchfromtransformersimportBitsAndBytesConfigconfig

云帆@·2024-09-13 03:12

【Tools】大模型中的BERT概念

摇来摇去摇碎点点的金黄伸手牵来一片梦的霞光南方的小巷推开多情的门窗年轻和我们歌唱摇来摇去摇着温柔的阳光轻轻托起一件梦的衣裳古老的都市每天都改变模样方芳《摇太阳》BERT（BidirectionalEncoderRepresentationsfromTransformers

音乐学家方大刚·2024-09-12 19:26

Transformer模型：WordEmbedding实现

前言最近在学Transformer，学了理论的部分之后就开始学代码的实现，这里是跟着b站的up主的视频记的笔记，视频链接：19、Transformer模型Encoder原理精讲及其PyTorch逐行实现

Galaxy.404·2024-09-12 17:42

【Vidu发布】中国首个长时长、高一致性、高动态性Video AI大模型

该模型采用生数科技团队原创的Diffusion与Transformer融合的架构U-ViT。

叶锦鲤·2024-09-12 13:44

论文翻译：arxiv-2022 Ignore Previous Prompt: Attack Techniques For Language Models

AttackTechniquesForLanguageModelshttps://arxiv.org/pdf/2211.09527忽略之前的提示：针对语言模型的攻击技术文章目录忽略之前的提示：针对语言模型的攻击技术摘要1引言摘要基于Transformer

CSPhD-winston-杨帆·2024-09-12 12:14

【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人

系列篇章No.文章1【Qwen部署实战】探索Qwen-7B-Chat：阿里云大型语言模型的对话实践2【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人3【Qwen2部署实战

寻道AI小兵·2024-09-12 06:09

论文学习笔记 VMamba: Visual State Space Model

当前的视觉模型如卷积神经网络（CNNs）和视觉Transformer（ViTs）在处理大规模视觉任务时展现出良好的表现，但都存在各自的局限性。

Wils0nEdwards·2024-09-11 23:47

《自然语言处理 Transformer 模型详解》

一、引言在自然语言处理领域，Transformer模型的出现是一个重大的突破。

黑色叉腰丶大魔王·2024-09-11 21:02

深度学习速通系列:LoRA微调是什么

它的核心思想是在不改变预训练模型权重的前提下，通过在模型的Transformer层中引入可训练的低秩矩阵来实现模型的微调。这种方法可以显著减少训练参数的数量，从而降低对计算资源的需求。

Ven%·2024-09-11 11:47

大模型LLM面试常见算法题-包括Attention和Transformer常见面试题

大模型：位置编码有哪些？介绍LoRA与QLoRARAG和微调的区别是什么？哪些因素会导致LLM的偏见？什么是思维链（CoT）提示？Tokenizer的实现方法及原理解释一下大模型的涌现能力？解释langchainAgent的概念langchain有哪些替代方案？RLHF完整训练过程是什么？为什么RLHF的效果这么好?RLHF使用的训练数据是什么样的?RAG和微调的区别是什么？有了解过什么是稀疏微调

剑圣土豆·2024-09-10 15:57

gpt-2语言模型训练

针对你要用到的字段信息进行处理，然后把需要处理的数据丢给模型去训练，这个模型我是直接从GPT2的网站下载下来的依赖的必要文件截图如下：二、具体代码样例实现：importosimportpandasaspdfromtransformersimportGPT2Tokenizer

谷隐凡二·2024-09-10 09:48

论文笔记—NDT-Transformer: Large-Scale 3D Point Cloud Localization using the Normal Distribution Transfor

论文笔记—NDT-Transformer:Large-Scale3DPointCloudLocalizationusingtheNormalDistributionTransformRepresentation

入门打工人·2024-09-10 03:09

深度解析：从概念到变革——Transformer大模型的前世今生以及大模型预备知识讲解[知存科技]

深度解析：从概念到变革——Transformer大模型的前世今生点击：知存科技相关课程推荐知存科技是全球领先的存内计算芯片企业。针对AI应用场景，在全球率先商业化量产基于存内计算技术的神经网络芯片。

汀、人工智能·2024-09-10 02:00

AI科学家：从理论到实践的科研自动化革命

近日，SakanaAI公司，由Transformer架构的创造者之一LlionJones创立，宣布了一项令人震惊的进展——首个完全自动化的科研平台，名为“TheAIScientist”。

海森大数据·2024-09-09 22:26

揭秘GLM-130B爆火秘诀：颠覆性自回归填空和二维位置编码的训练黑科技

1.模型架构简介GLM-130B是基于Transformer架构的双语（中文和英文）语言模型，拥有1300亿个参数。

大多_C·2024-09-09 15:34

conda进行transformers安装

首先建立新环境condacreate-nmyenvpython=3.8安装numpy和pytorchcondainstallnumpycondainstallpytorchtorchvisiontorchaudiocpuonly-cpytorch-cconda-forge其余的一些环境配置huggingface_hub0.16.4py_0huggingfaceimportlib-metadata6

大多_C·2024-09-09 15:04

Transformer、BERT、GPT、T5、LLM（大语言模型），以及它们在实际行业中的运用

我们重点讨论以下几个主流模型框架：Transformer、BERT、GPT、T5、LLM（大语言模型），以及它们在实际行业中的运用。

Funhpc_huachen·2024-09-08 17:38

深度学习特征提取魔改版太强了！发文香饽饽！

目前比较常见的深度学习特征提取方法有基于transformer、基于CNN、基于LSTM以及基于GAN，都发展的比较成熟。但为了追求更快速、准确、鲁棒的特征点提取，研究者们开始致力于改进深度

深度之眼·2024-09-08 17:03

探索POSTECH-CVLab的Point Transformer: 重塑3D点云处理的新篇章

探索POSTECH-CVLab的PointTransformer:重塑3D点云处理的新篇章在计算机视觉和深度学习领域中，3D点云处理是一个至关重要的环节，因为它能够帮助我们理解复杂环境中的三维结构。

尤琦珺Bess·2024-09-08 11:23

多模态大模型：技术原理与实战 ChatGPT的诞生

1.1.1早期人工智能1.1.2机器学习时代1.1.3深度学习的崛起1.2自然语言处理的演进1.2.1基于规则的方法1.2.2统计机器学习方法1.2.3深度学习在NLP中的应用1.3大语言模型的出现1.3.1Transformer

AI大模型应用之禅·2024-09-08 10:51

推荐频道

Transformer

第81期 | GPTSecurity周报

第83期 | GPTSecurity周报

Time-LLM ：超越了现有时间序列预测模型的学习器

注意力池化层：从概念到实现及应用

LTX-Video 高效视频生成模型，一键处理图片&文字

第79期 | GPTSecurity周报

深度定制：Embedding与Reranker模型的微调艺术

开源人工智能模型框架：探索与实践

如何学习Transformer架构

pip install transformers教程

北大新模型FAN：新型神经网络架构，填补周期性特征建模空白

MiniMax开源，突破传统Transformer架构，震撼业界

从RNN到Transformer：生成式AI技术演变与未来展望

211本硕二战腾讯大模型算法岗，已凉......

手撕Transformer -- Day2 -- Embdding

一起学Hugging Face Transformers（8）- 使用Transformers 库制作一个简易问答系统

Hugging Face Transformers 库学习提纲

不科学上网使用Hugging Face的Transformers库

BART&BERT

AI大模型的架构演进与最新发展

轻量级模型解读——轻量transformer系列

探索创新科技： Lite-Mono - 简约高效的小型化Mono框架

解决BERT模型bert-base-chinese报错（无法自动联网下载）

车载以太网之SOME/IP

基于深度学习的农作物病害检测

多模态Transformer之文本与图像联合建模 - Transformer教程

transformer架构(Transformer Architecture)原理与代码实战案例讲解

多模态大模型微调Qwen-VL微调及日志

英伟达（NVIDIA）B200架构解读

大规模语言模型的书籍分享，从零基础入门到精通非常详细收藏我这一篇就够了

QLoRa使用教程

【Tools】大模型中的BERT概念

Transformer模型：WordEmbedding实现

【Vidu发布】中国首个长时长、高一致性、高动态性Video AI大模型

论文翻译：arxiv-2022 Ignore Previous Prompt: Attack Techniques For Language Models

【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人

论文学习笔记 VMamba: Visual State Space Model

《自然语言处理 Transformer 模型详解》

深度学习速通系列:LoRA微调是什么

大模型LLM面试常见算法题-包括Attention和Transformer常见面试题

gpt-2语言模型训练

论文笔记—NDT-Transformer: Large-Scale 3D Point Cloud Localization using the Normal Distribution Transfor

深度解析：从概念到变革——Transformer大模型的前世今生以及大模型预备知识讲解[知存科技]

AI科学家：从理论到实践的科研自动化革命

揭秘GLM-130B爆火秘诀：颠覆性自回归填空和二维位置编码的训练黑科技

conda进行transformers安装

Transformer、BERT、GPT、T5、LLM（大语言模型），以及它们在实际行业中的运用

深度学习特征提取魔改版太强了！发文香饽饽！

探索POSTECH-CVLab的Point Transformer: 重塑3D点云处理的新篇章

多模态大模型：技术原理与实战 ChatGPT的诞生