Transformers:

DeepSeek使用中的问题及解决方案（部分）

严格按照官方文档的版本要求安装依赖，例如：condacreate-ndeepseekpython=3.9condaactivatedeepseekpipinstalltorch==2.0.1transformers

WeiLai1112·2025-02-20 07:17

LLM论文笔记 14: The Impact of Positional Encoding on Length Generalization in Transformers

Arxiv日期：2023.12.15机构：McGillUniversity/IBM/Facebook/ServiceNow关键词长度泛化位置编码CoT核心结论1.decoder-only中不显式使用位置编码（NoPE）可以提高长度泛化性能2.（证明了）decoder-onlytransformer如果NoPE同时具备绝对APE和RPE的能力3.暂存器（cot）对于长度泛化和任务相关，同时关注短期和

Zhouqi_Hua·2025-02-20 07:15

Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention

本文是LLM系列文章，针对《LeaveNoContextBehind:EfficientInfiniteContextTransformerswithInfini-attention》的翻译。不让任何上下文掉队：无限关注的高效无限上下文Transformer摘要1引言2方法3实验4相关工作5结论摘要这项工作介绍了一种将基于Transformer的大型语言模型（LLM）扩展到具有有限内存和计算的无限

UnknownBody·2025-02-20 05:00

Python库 - transformers

transformers库是由HuggingFace开发的一个非常流行的Python库，用于自然语言处理（NLP）任务。

司南锤·2025-02-19 03:28

【NLP-04】tranformers库保姆级使用教程---以BERT模型为例

安装要安装一个非常轻量级的Transformers库，您可以执行以下步骤：1、打开终端或命令提示符。

云天徽上·2025-02-19 03:28

采用分布式部署deepseek

软件依赖：安装必要的库和工具，如PyTorch、Transformers等。特别地，对于分布式训练，还需要安装torch.distributed或者类似的库支持，例如Horo

慧香一格·2025-02-19 02:14

使用 HuggingFace 库进行本地嵌入向量生成

pipinstallsentence-transformers!pipi

qq_37836323·2025-02-13 09:50

【深度学习】常见模型-BERT（Bidirectional Encoder Representations from Transformers）（双向编码器表示）

BERT（BidirectionalEncoderRepresentationsfromTransformers）BERT是什么？BERT是Google在2018年推出的NLP（自然语言处理）模型，全称BidirectionalEncoderRepresentationsfromTransformers（双向编码器表示）。BERT采用Transformer结构，并使用双向（Bidirectiona

IT古董·2025-02-11 02:06

动手学图神经网络（12）：MovieLens上的链接回归

环境设置使用pip安装pyg-lib、pytorch_geometric、sentence_transformers、fuzzywuzzy、captum等。

段智华·2025-02-08 11:07

AI学习指南HuggingFace篇-项目实战：情感分析系统

HuggingFace的Transformers库提供了强大的工具，使得情感分析变得简单高效。

俞兆鹏·2025-02-08 10:25

使用一个大语言模型对另一个大语言模型进行“调教”

以下是基于搜索结果整理的详细步骤和方法：1.准备工作安装必要的库•Transformers：用于加载和训练模型。•Datasets：用于处理数据集。

大霸王龙·2025-02-07 03:25

Transformers解决RuntimeError: element 0 of tensors does not require grad and does not have a grad_fn

在使用Transformers启动梯度检查点时，即：model.gradient_checkpointing_enable()时，会报错RuntimeError:element0oftensorsdoesnotrequiregradanddoesnothaveagrad_fn

怎么这么多名字都被占了·2025-02-05 18:06

『大模型笔记』视觉语言模型解释

2.开源视觉语言模型概览3.如何找到合适的视觉语言模型MMMUMMBench4.技术细节5.使用变压器(transformers)运用视觉语言模型6.使用TRL微调视觉语言模型二.参考文章一.视觉语言模型解析视觉语言模型是一类能够同时从图像和文本中学习

AI大模型前沿研究·2025-02-03 05:40

AI模型升级版0.02

我们将使用HuggingFace的transformers库和torch库来实现这个目标。

pps-key·2025-02-03 02:51

pytorch基于 Transformer 预训练模型的方法实现词嵌入（tiansz/bert-base-chinese）

以下是一个完整的词嵌入（WordEmbedding）示例代码，使用modelscope下载tiansz/bert-base-chinese模型，并通过transformers加载模型，获取中文句子的词嵌入

纠结哥_Shrek·2025-02-01 15:05

Open WebUI应用实践

FormerlyOllamaWebUI)(github.com)Tutorial|OpenWebUIOpenWebUITip:OpenWebUI、Ollama、Helm、ChromaDB、RAG、Pipelines、sentence-transformers

孙将帼·2025-01-30 20:38

Transformers库的模板困境：apply_chat_template的版本变迁与解决方案

目录问题现状低版本（4.43及以下）的简便方式高版本的报错问题原因分析旧版本的实现逻辑新版本的变化解决办法问题现状在使用Transformers库中的tokenizer处理模型输入时，我们经常需要将输入文本格式化为模型可以理解的格式

Gaffey大杂烩·2025-01-28 22:02

Transformer架构和Transformers 库和Hugging Face

Transformer架构和HuggingFace之间的关系非常紧密，HuggingFace是推动Transformer架构普及和应用的重要力量。以下是两者的关系及其具体联系：1.Transformer架构背景:Transformer是由Google在2017年提出的革命性架构，基于自注意力机制（Self-Attention），解决了传统RNN和CNN在处理长序列数据时的局限性。特点:并行计算能力

大哥喝阔落·2025-01-28 04:50

Hugging Face Transformers and Meta Llama

HuggingFaceTransformersandMetaLlama1.Transformers1.1.`src/transformers/models`1.2.

Yongqiang Cheng·2025-01-27 00:02

论文阅读笔记（9）——《A Practical Survey on Faster and Lighter Transformers》

1Abstract2Introductionrecurrentneuralnetworks(RNNs)longshort-termmemory(LSTM)networksequencetosequenceframeworkinter-attentionrelativeeffectivecontextlength(RECL)Transformer3TransformerA.EncoderB.Deco

StriveQueen·2025-01-26 08:32

Python 装饰器详解：@staticmethod 与 @classmethod 的区别与用法：中英双语

缘由：今天在看Huggingface的源码的时候，https://github.com/huggingface/transformers/blob/v4.47.1/src/transformers/models

阿正的梦工坊·2025-01-25 16:28

Gradio + *Transformers*** 实现带记忆功能的对话系统完整代码示例

以下是一个使用Gradio+Transformers实现带记忆功能的对话系统完整代码示例，无需额外数据库依赖：importgradioasgrimportnumpyasnpfromtransformersimportAutoTokenizer

大霸王龙·2025-01-23 03:42

第二课堂笔记——大语言模型

pipinstalltransformers==4.37.0-U用于安装或更新Python的transformers库到特定版本4.37.0。‌

skna_·2025-01-19 06:26

深度定制：Embedding与Reranker模型的微调艺术

微调过程可以使用不同的库和框架来实现，例如sentence-transformers库，它提供了便捷的API来调整Embeddin

从零开始学习人工智能·2025-01-17 15:22

pip install transformers教程

直接pipinstalltransformers会报错，报错内容如下：Collectingsafetensors>=0.3.1(fromtransformers)Usingcachedsafetensors-0.5.2.tar.gz(66kB)Installingbuilddependencies...doneGettingrequirementstobuildwheel...donePrepar

养一只Trapped_beast·2025-01-17 09:26

一起学Hugging Face Transformers（8）- 使用Transformers 库制作一个简易问答系统

文章目录前言一、环境准备二、数据准备三、模型选择与加载四、构建问答系统五、模型评估与优化六、部署问答系统七、实际案例分析总结参考资料前言问答系统是一种能够自动回答用户问题的人工智能应用，在许多领域具有重要的应用价值，如客户服务、教育和医疗等。HuggingFaceTransformers库是一个强大的工具，它提供了许多预训练的自然语言处理模型，简化了构建问答系统的过程。本文将介绍如何使用Huggi

做个天秤座的程序猿·2025-01-16 17:35

Hugging Face Transformers 库学习提纲

文章目录前言一、[基础概念](https://blog.csdn.net/kljyrx/article/details/139984730)二、[环境准备](https://blog.csdn.net/kljyrx/article/details/140006571)三、库的基本使用四、高级应用五、实践案例六、生态系统和工具七、社区与资源八、进阶学习总结前言HuggingFaceTransform

做个天秤座的程序猿·2025-01-16 17:05

不科学上网使用Hugging Face的Transformers库

参考ProgramSynthesiswithCodeGen—ROCmBlogs(amd.com)HF-Mirror-Huggingface镜像站https://huggingface.co/docs/transformers

109702008·2025-01-16 16:02

【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人

系列篇章No.文章1【Qwen部署实战】探索Qwen-7B-Chat：阿里云大型语言模型的对话实践2【Qwen2部署实战】Qwen2初体验：用Transformers打造智能聊天机器人3【Qwen2部署实战

寻道AI小兵·2024-09-12 06:09

conda进行transformers安装

首先建立新环境condacreate-nmyenvpython=3.8安装numpy和pytorchcondainstallnumpycondainstallpytorchtorchvisiontorchaudiocpuonly-cpytorch-cconda-forge其余的一些环境配置huggingface_hub0.16.4py_0huggingfaceimportlib-metadata6

大多_C·2024-09-09 15:04

【计算机视觉前沿研究热点顶会】ECCV 2024中Mamba有关的论文

MambaIR：状态空间模型图像恢复的简单基线近年来，图像恢复技术取得了长足的进步，这在很大程度上归功于现代深度神经网络的发展，如CNN和Transformers。

平安顺遂事事如意·2024-09-07 08:17

【人工智能】Transformers之Pipeline（十三）：填充蒙版（fill-mask）

目录一、引言二、填充蒙版（fill-mask）2.1概述2.2技术原理2.2.1BERT模型的基本概念2.2.2BERT模型的工作原理2.2.3BERT模型的结构2.2.4BERT模型的应用2.2.5BERT模型与Transformer的区别和联系2.3应用场景2.4pipeline参数2.4.1pipeline对象实例化参数2.4.2pipeline对象使用参数2.4.3pipeline返回参数

LDG_AGI·2024-09-06 02:02

Azure和Transformers的详细解释

AzureAI是微软提供的人工智能(AI)解决方案的集合，旨在帮助开发人员、数据科学家和企业轻松构建和部署智能应用程序。以下是对AzureAI各个方面的详细解释：AzureAI主要组件AzureCognitiveServices（认知服务）：计算视觉：包括图像识别、物体检测、人脸识别以及图像标注等。语音服务：包括语音识别、语音合成、说话人识别和语音翻译等。语言理解服务：包括文本分析、语言翻译、情感

漫天飞舞的雪花·2024-09-04 09:04

【深度学习 transformer】使用pytorch 训练transformer 模型,hugginface 来啦

它由几个关键组件组成：Transformers：这是一个基于PyTorch的库，提供了各种预训练的NLP模型，如BERT、GPT、RoBERTa、DistilBERT等。

东华果汁哥·2024-09-04 06:39

【HuggingFace Transformers】BertIntermediate 和 BertPooler源码解析

BertIntermediate和BertPooler源码解析1.介绍1.1位置与功能1.2相似点与不同点2.源码解析2.1BertIntermediate源码解析2.2BertPooler源码解析1.介绍1.1位置与功能(1)BertIntermediate位置：位于BertLayer的注意力层（BertSelfAttention）和输出层（BertOutput）之间。功能：它执行一个线性变换（

CS_木成河·2024-09-01 17:25

在浏览器上使用transformers.js运行（WebGPU）RMBG-1.4进行抠图（背景移除）

在浏览器上使用transformers.js运行（WebGPU）RMBG-1.4进行抠图（背景移除）说明：首次发表日期：2024-08-28官方Github仓库地址：https://github.com

shizidushu·2024-09-01 17:55

LLM-项目详解（一）：Chinese-LLaMA-Alpaca【transformers/models/llama/modeling_llama.py文件】

u013250861·2024-08-31 22:57

快速使用transformers的pipeline实现各种深度学习任务

目录引言安装情感分析文本生成文本摘要图片分类实例分割目标检测音频分类自动语音识别视觉问答文档问题回答图文描述引言在这篇中文博客中，我们将深入探讨使用transformers库中的pipeline()函数

E寻数据·2024-08-31 04:54

1-pipeline()函数-transformers-python库

pipeline()函数pipeline()函数是Transformers库中最基本的工具。Transformer模型用于解决各种NLP任务，Transformers库提供了创建和使用这些模型的功能。

Flora-pi·2024-08-31 04:53

大模型训练优化方法

本文主要参考HF上的一篇文章：https://huggingface.co/docs/transformers/perf_train_gpu_one，以及笔者在实际训练中的一些经验，给出一些比较实用的方法

少喝冰美式·2024-08-30 05:28

论文：Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks

Retrieval-AugmentedGenerationforKnowledge-IntensiveNLPTaskscode:https://github.com/huggingface/transformerscode:https://github.com/huggingface/transformers

Ian_Wonder·2024-08-28 18:27

欺诈文本分类微调（六）：Lora单卡训练

关于训练器，使用transformers库中提供的Trainer类。2.数据准备2.1加载数据导入要使用的基础包。impor

沉下心来学鲁班·2024-08-25 11:27

使用 Hugging Face Transformers 创建文本生成模型

文本生成是自然语言处理中的一个重要任务，在聊天机器人、自动写作等领域有着广泛的应用。HuggingFaceTransformers是一个流行的Python库，它提供了大量预训练的模型以及API来实现各种自然语言处理任务。本文将详细介绍如何使用HuggingFaceTransformers库来创建一个简单的文本生成模型，并且展示如何使用该模型生成新的文本。文本生成是自然语言处理中的一项重要技术，可以

Envyᥫᩣ·2024-08-25 05:47

transformers调用llama的方式

transformers调用llama的使用方式不同版本llama对应的transformers库版本llama2llama3Meta-Llama-3-8B-InstructMeta-Llama-3-8Bllama3.1Meta-Llama

myccver·2024-08-23 13:11

chatGLM-6B部署报错quantization_kernels_parallel.so‘ (or one of its dependencies). Try using the full pat

chatglm2时候报错：FileNotFoundError:Couldnotfindmodule'C:\Users\Administrator\.cache\huggingface\modules\transformers_modules

FL1623863129·2024-03-20 14:25

【学习总结】Python transformers AutoTokenizer encode 出现的 101 和 102

1.代码展示：fromtransformersimportAutoTokenizer,AutoModelmodel_name="bert-base-chinese"tokenizer=AutoTokenizer.from_pretrained(model_name)model=AutoModel.from_pretrained(model_name)print(len(tokenizer.voca

爱学习的小道长·2024-03-14 14:10

深度学习踩坑记录（持续更新）

目录4060显卡cuda版本异常transformers初始化TrainingArguments时output_dir指定问题4060显卡cuda版本异常环境：torch1.11.0+cu113程序报错

芒果不茫QAQ·2024-03-13 15:39

beam search原理与常见实现，与直接sample的区别

BeamSearch与直接Sample的区别1.确定性与随机性2.结果多样性3.性能与效率4.应用场景常见的BeamSearch实现1.TensorFlow库2.PyTorch库3.HuggingFace的Transformers

samoyan·2024-03-11 13:11

聊聊transformers库；微软推出ZeRO++技术：优化大型AI模型训练时间和成本

AI新闻微软推出ZeRO++技术：优化大型AI模型训练时间和成本摘要：据报道，微软研究人员最近发布了一项名为ZeRO++的新技术，旨在优化训练大型AI模型时常遇到的数据传输成本和带宽限制问题，可大幅减少训练时间和成本。ZeRO++建立在现有的ZeRO传输技术基础上，并通过提供增强的通信策略来提高训练效率并降低成本。通过对权重进行量化，ZeRO++可以减少参数通信量，同时保持训练精度。为了最小化通信

go2coding·2024-02-20 17:05

Transformers中的Beam Search高效实现

来自：纸鱼AI目前Github上的大部分实现均针对于单个样本的beamsearch，而本文主要介绍了针对单个样本和批量样本的beamsearch实现。本文代码可以点击“查看原文”找到BeamSearch的原理设输入序列为，输出序列为，我们需要建模如下概率分布：（公式向右滑动）在执行解码时，我们有几种选词方案，第一种则是穷举所有可能序列，这种成本过大无法承受。如果每一步都选择概率最大的词，这种解码方

zenRRan·2024-02-15 08:13

推荐频道