E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Transformers:
【Qwen2部署实战】Qwen2初体验:用
Transformers
打造智能聊天机器人
系列篇章No.文章1【Qwen部署实战】探索Qwen-7B-Chat:阿里云大型语言模型的对话实践2【Qwen2部署实战】Qwen2初体验:用
Transformers
打造智能聊天机器人3【Qwen2部署实战
寻道AI小兵
·
2024-09-12 06:09
AI大模型Qwen系列探索实践
人工智能
AIGC
语言模型
AI编程
Qwen
conda进行
transformers
安装
首先建立新环境condacreate-nmyenvpython=3.8安装numpy和pytorchcondainstallnumpycondainstallpytorchtorchvisiontorchaudiocpuonly-cpytorch-cconda-forge其余的一些环境配置huggingface_hub0.16.4py_0huggingfaceimportlib-metadata6
大多_C
·
2024-09-09 15:04
conda
【计算机视觉前沿研究 热点 顶会】ECCV 2024中Mamba有关的论文
MambaIR:状态空间模型图像恢复的简单基线近年来,图像恢复技术取得了长足的进步,这在很大程度上归功于现代深度神经网络的发展,如CNN和
Transformers
。
平安顺遂事事如意
·
2024-09-07 08:17
顶刊顶会论文合集
计算机视觉
论文笔记
目标跟踪
ECCV
Mamba
状态空间模型
人工智能
【人工智能】
Transformers
之Pipeline(十三):填充蒙版(fill-mask)
目录一、引言二、填充蒙版(fill-mask)2.1概述2.2技术原理2.2.1BERT模型的基本概念2.2.2BERT模型的工作原理2.2.3BERT模型的结构2.2.4BERT模型的应用2.2.5BERT模型与Transformer的区别和联系2.3应用场景2.4pipeline参数2.4.1pipeline对象实例化参数2.4.2pipeline对象使用参数2.4.3pipeline返回参数
LDG_AGI
·
2024-09-06 02:02
Pipeline
人工智能
机器学习
计算机视觉
python
时序数据库
大数据
自然语言处理
Azure和
Transformers
的详细解释
AzureAI是微软提供的人工智能(AI)解决方案的集合,旨在帮助开发人员、数据科学家和企业轻松构建和部署智能应用程序。以下是对AzureAI各个方面的详细解释:AzureAI主要组件AzureCognitiveServices(认知服务):计算视觉:包括图像识别、物体检测、人脸识别以及图像标注等。语音服务:包括语音识别、语音合成、说话人识别和语音翻译等。语言理解服务:包括文本分析、语言翻译、情感
漫天飞舞的雪花
·
2024-09-04 09:04
azure
microsoft
python
【深度学习 transformer】使用pytorch 训练transformer 模型,hugginface 来啦
它由几个关键组件组成:
Transformers
:这是一个基于PyTorch的库,提供了各种预训练的NLP模型,如BERT、GPT、RoBERTa、DistilBERT等。
东华果汁哥
·
2024-09-04 06:39
深度学习-文本分类
深度学习
transformer
pytorch
【HuggingFace
Transformers
】BertIntermediate 和 BertPooler源码解析
BertIntermediate和BertPooler源码解析1.介绍1.1位置与功能1.2相似点与不同点2.源码解析2.1BertIntermediate源码解析2.2BertPooler源码解析1.介绍1.1位置与功能(1)BertIntermediate位置:位于BertLayer的注意力层(BertSelfAttention)和输出层(BertOutput)之间。功能:它执行一个线性变换(
CS_木成河
·
2024-09-01 17:25
Hugging
Face
深度学习
人工智能
bert
python
大模型
Transformer
在浏览器上使用
transformers
.js运行(WebGPU)RMBG-1.4进行抠图(背景移除)
在浏览器上使用
transformers
.js运行(WebGPU)RMBG-1.4进行抠图(背景移除)说明:首次发表日期:2024-08-28官方Github仓库地址:https://github.com
shizidushu
·
2024-09-01 17:55
WebGPU
transformers.js
RMBG-1.4
抠图
LLM-项目详解(一):Chinese-LLaMA-Alpaca【
transformers
/models/llama/modeling_llama.py文件】
site-packages/
transformers
/models/llama/modeling_llama.py#coding=utf-8#Copyright2022EleutherAIandtheHuggingFaceInc.team.Allrightsreserved
u013250861
·
2024-08-31 22:57
#
LLM/经典模型
llama
快速使用
transformers
的pipeline实现各种深度学习任务
目录引言安装情感分析文本生成文本摘要图片分类实例分割目标检测音频分类自动语音识别视觉问答文档问题回答图文描述引言在这篇中文博客中,我们将深入探讨使用
transformers
库中的pipeline()函数
E寻数据
·
2024-08-31 04:54
huggingface
计算机视觉
nlp
深度学习
人工智能
python
pipeline
transformers
1-pipeline()函数-
transformers
-python库
pipeline()函数pipeline()函数是
Transformers
库中最基本的工具。Transformer模型用于解决各种NLP任务,
Transformers
库提供了创建和使用这些模型的功能。
Flora-pi
·
2024-08-31 04:53
人工智能
人工智能
大模型训练优化方法
本文主要参考HF上的一篇文章:https://huggingface.co/docs/
transformers
/perf_train_gpu_one,以及笔者在实际训练中的一些经验,给出一些比较实用的方法
少喝冰美式
·
2024-08-30 05:28
人工智能
大语言模型
ai大模型
大模型应用
LLM
大模型训练
计算机技术
论文:Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks
Retrieval-AugmentedGenerationforKnowledge-IntensiveNLPTaskscode:https://github.com/huggingface/transformerscode:https://github.com/huggingface/
transformers
Ian_Wonder
·
2024-08-28 18:27
论文阅读
欺诈文本分类微调(六):Lora单卡训练
关于训练器,使用
transformers
库中提供的Trainer类。2.数据准备2.1加载数据导入要使用的基础包。impor
沉下心来学鲁班
·
2024-08-25 11:27
微调
分类
人工智能
机器学习
语言模型
微调
使用 Hugging Face
Transformers
创建文本生成模型
文本生成是自然语言处理中的一个重要任务,在聊天机器人、自动写作等领域有着广泛的应用。HuggingFaceTransformers是一个流行的Python库,它提供了大量预训练的模型以及API来实现各种自然语言处理任务。本文将详细介绍如何使用HuggingFaceTransformers库来创建一个简单的文本生成模型,并且展示如何使用该模型生成新的文本。文本生成是自然语言处理中的一项重要技术,可以
Envyᥫᩣ
·
2024-08-25 05:47
人工智能
transformers
调用llama的方式
transformers
调用llama的使用方式不同版本llama对应的
transformers
库版本llama2llama3Meta-Llama-3-8B-InstructMeta-Llama-3-8Bllama3.1Meta-Llama
myccver
·
2024-08-23 13:11
llama
深度学习
pytorch
chatGLM-6B部署报错quantization_kernels_parallel.so‘ (or one of its dependencies). Try using the full pat
chatglm2时候报错:FileNotFoundError:Couldnotfindmodule'C:\Users\Administrator\.cache\huggingface\modules\
transformers
_modules
FL1623863129
·
2024-03-20 14:25
环境配置
深度学习
【学习总结】Python
transformers
AutoTokenizer encode 出现的 101 和 102
1.代码展示:fromtransformersimportAutoTokenizer,AutoModelmodel_name="bert-base-chinese"tokenizer=AutoTokenizer.from_pretrained(model_name)model=AutoModel.from_pretrained(model_name)print(len(tokenizer.voca
爱学习的小道长
·
2024-03-14 14:10
AI
python
学习
AI编程
深度学习踩坑记录(持续更新)
目录4060显卡cuda版本异常
transformers
初始化TrainingArguments时output_dir指定问题4060显卡cuda版本异常环境:torch1.11.0+cu113程序报错
芒果不茫QAQ
·
2024-03-13 15:39
深度学习
人工智能
beam search原理与常见实现,与直接sample的区别
BeamSearch与直接Sample的区别1.确定性与随机性2.结果多样性3.性能与效率4.应用场景常见的BeamSearch实现1.TensorFlow库2.PyTorch库3.HuggingFace的
Transformers
samoyan
·
2024-03-11 13:11
LLM
面试
transformer
面试
聊聊
transformers
库; 微软推出ZeRO++技术:优化大型AI模型训练时间和成本
AI新闻微软推出ZeRO++技术:优化大型AI模型训练时间和成本摘要:据报道,微软研究人员最近发布了一项名为ZeRO++的新技术,旨在优化训练大型AI模型时常遇到的数据传输成本和带宽限制问题,可大幅减少训练时间和成本。ZeRO++建立在现有的ZeRO传输技术基础上,并通过提供增强的通信策略来提高训练效率并降低成本。通过对权重进行量化,ZeRO++可以减少参数通信量,同时保持训练精度。为了最小化通信
go2coding
·
2024-02-20 17:05
AI日报
人工智能
microsoft
深度学习
Transformers
中的Beam Search高效实现
来自:纸鱼AI目前Github上的大部分实现均针对于单个样本的beamsearch,而本文主要介绍了针对单个样本和批量样本的beamsearch实现。本文代码可以点击“查看原文”找到BeamSearch的原理设输入序列为,输出序列为,我们需要建模如下概率分布:(公式向右滑动)在执行解码时,我们有几种选词方案,第一种则是穷举所有可能序列,这种成本过大无法承受。如果每一步都选择概率最大的词,这种解码方
zenRRan
·
2024-02-15 08:13
算法
python
深度学习
机器学习
搜索引擎
flan_t5的使用
https://huggingface.co/docs/
transformers
/model_doc/flan-t5
hehui0921
·
2024-02-13 09:36
huggingface
langchain
【HuggingFace】
Transformers
-BertAttention逐行代码解析
本文基于HuggingFace的2.6.0版本的
Transformers
包进行解析,不同版本间略有差异,但无伤大雅。
Taylor不想被展开
·
2024-02-12 17:32
Python
Transformer
深度学习
自然语言处理
transformer
计算机视觉
phpy :PHP 与 Python 互调用库,为 PHP 引入 Python 生态,PHP 也可以写 AI 了
包括当下非常流行的PyTorch、
transformers
、TensorFlow等AI库,以及Numpy、Pandas、Scikit等科学计算库,还可以使用PyQt、wxPython等图形界面库。
·
2024-02-11 17:07
phppythonai开发
transformers
之agent
HuggingFace发布了TransformersAgent,一种利用自然语言从精选工具集合中选择工具并完成各种任务的代理。此举使其与LangChain作为构建企业通用人工智能(AGI)应用程序的新兴框架直接竞争,因为它很像LangChain工具和代理。什么是TransformersAgents?简单来说它在转换器之上提供了一个自然语言API:定义了一组精选工具并设计了一个代理来解释自然语言并使
月疯
·
2024-02-10 13:07
【NLP】
深度学习
transformers
重要组件(模型与分词器)
1、模型:fromtransformersimportAutoModelcheckpoint="distilbert-base-uncased-finetuned-sst-2-english"model=AutoModel.from_pretrained(checkpoint)除了像之前使用AutoModel根据checkpoint自动加载模型以外,我们也可以直接使用模型对应的Model类,例如B
月疯
·
2024-02-10 13:06
【NLP】
人工智能
Temporal Fusion
Transformers
for Interpretable Multi-horizon Time Series Forecasting
摘要多步(尺度)预测通常包含一个复杂的输入组合——包括静态(即时不变)协变量、已知的未来输入,以及其他仅在过去观察到的外生时间序列——没有任何关于它们如何与目标相互作用的先验信息。几种深度学习方法已经被提出,但它们通常是“黑盒”模型,并不能阐明它们如何使用实际场景中出现的全部输入。在本文中,我们介绍了时间融合变压器(TFT)——一种新的基于注意的架构,它结合了高性能的多步预测和对时间动态的可解释的
AyyB
·
2024-02-09 23:30
【Transformer-Hugging Face 05/10】 使用 AutoClass 加载预训练实例
作为
Transformers
核心理念的一部分,使库易于、简单且灵活地使用,它会AutoClass从给定的检查点自动推断并加载正确的架构。该from_pretrained()
无水先生
·
2024-02-09 20:26
NLP高级和ChatGPT
人工智能
transformer
深度学习
人工智能
Elasticsearch:通过 ingest pipeline 对大型文档进行分块
这个交互式笔记本将:将模型sentence-
transformers
__all-minilm-
Elastic 中国社区官方博客
·
2024-02-08 11:11
Elasticsearch
AI
Elastic
elasticsearch
大数据
搜索引擎
全文检索
python
人工智能
Elasticsearch:使用 LangChain 文档拆分器进行文档分块
使用Elasticsearch嵌套密集向量支持这个交互式笔记本将:将模型“sentence-
transformers
__all-minilm-l6-v2”从HuggingFace加载到ElasticsearchMLNode
Elastic 中国社区官方博客
·
2024-02-08 11:38
Elasticsearch
AI
Elastic
langchain
elasticsearch
大数据
搜索引擎
全文检索
人工智能
GPT-3 训练自己的数据教程详解
安装依赖库:确保你安装了必要的Python库,包括
transformers
、torch等。
mqdlff_python
·
2024-02-08 06:30
gpt-3
python
人工智能
GPT-3
MogaNet:高效的多阶门控聚合网络
文章目录摘要1、简介2、相关工作2.1、视觉
Transformers
2.2、ViT时代的卷积网络3、从多阶博弈论交互的角度看表示瓶颈4、方法论4.1、MogaNet概述4.2、多阶门控聚合4.3、通过通道聚合进行多阶特征重新分配
AI浩
·
2024-02-08 04:27
网络
人工智能
计算机视觉
51-18 视频理解串讲— MViTv2:Improved Multiscale Vision
transformers
for Classification and Detection 论文精读
今天要读的论文MViTv2仍然来自FacebookAI。论文和代码地址论文名称:MViTv2:ImprovedMultiscaleVisionTransformersforClassificationandDetection论文地址:https://arxiv.org/abs/2112.01526代码地址:https://github.com/facebookresearch/mvit首先咱们来看
深圳季连AIgraphX
·
2024-02-07 13:59
AutoGPT
自动驾驶大模型
transformer
自动驾驶
智慧城市
人工智能
gpt-3
使用deepspeed继续训练LLAMA
目录1.数据训练配置2.模型载入3.优化器设置4.DeepSpeed设置5.DeepSpeed初始化6.模型训练LLAMA模型子结构:1.数据训练配置利用PyTorch和
Transformers
库创建数据加载器
samoyan
·
2024-02-05 13:58
pytorch
llama
“erfinv_vml_cpu“ not implemented for ‘Half‘
在复现qwen-vl的qlora的时候报错,"erfinv_vml_cpu"notimplementedfor'Half',具体原因是这个文件里的.cache/huggingface/modules/
transformers
_modules
wkk15903468980
·
2024-02-04 12:55
java
前端
linux
End-to-End Object Detection with
Transformers
(DETR)
总结:这篇文档介绍了一个基于transformer和双分配匹配损失的新型目标检测系统(DETR)。传统的目标检测方法使用间接方法进行目标预测,而DETR将目标检测视为直接的集合预测问题,简化了检测流程,并减少了手动设计的组件。文档还提到了该方法在COCO数据集上的测试结果和与其他方法的比较。问题:1.目标检测的现代方法通常是基于什么样的初始猜测进行预测?目标检测的现代方法通常是基于对图像中可能存在
TJMtaotao
·
2024-02-04 07:35
目标检测
目标跟踪
人工智能
User开源模型ChatGLM3-6B如何使用?
建议使用`
transformers
`库的`4.30.2`版本,以及`torch`库的`2.0`或更高版本以获得最佳的推理性能【17†source】。2.
qq_20984273
·
2024-02-04 06:48
python
【文本到上下文 #8】NLP中的变形金刚:解码游戏规则改变者
在本期中,我们将重点介绍一项重塑NLP格局的突破性创新:
Transformers
。
无水先生
·
2024-02-03 20:22
NLP高级和ChatGPT
人工智能
自然语言处理
人工智能
CogView:通过
Transformers
完成文本到图像的生成
1TitleCogView:MasteringText-to-ImageGenerationviaTransformers(MingDing,ZhuoyiYang,WenyiHong,WendiZheng,ChangZhouz,DaYin,JunyangLinz,XuZou,ZhouShao,HongxiaYang,JieTang)2ConclusionThisstudyproposesCogVi
umbrellazg
·
2024-02-03 19:47
Cogview
大模型LORA微调总结
source和target构建input_ids和labels标签补齐构建训练器LORA模型推理模型加载多batch推理构建lora微调推理合并模型权重大模型微调总结模型加载使用deepspeedmodel=
transformers
.AutoModelForCausalLM
江小皮不皮
·
2024-02-03 15:48
深度学习
人工智能
LoRA
大模型
微调
internlm7B
【论文阅读笔记】Taming
Transformers
for High-Resolution Image Synthesis
TamingTransformersforHigh-ResolutionImageSynthesis记录前置知识AbstractIntroductionRelatedWorkMethodLearninganEffectiveCodebookofImageConstituentsforUseinTransformersLearningtheCompositionofImageswithTransfo
LuH1124
·
2024-02-03 09:45
论文阅读笔记
论文阅读
transformer
cnn
图像生成
【工程记录】ChatGLM3-6B 部署的详细教程(Windows)
1.环境配置Github地址:ChatGLM3作者注释:
transformers
库版本推荐为4.30.2,torch推荐使用2.0及以上的版本,以获得最佳的推理性能。为了防止依赖之间的版本冲突,
LZXCyrus
·
2024-02-02 20:30
工程记录
windows
人工智能
语言模型
自然语言处理
AIGC
nlp
深度学习
Transformer 自然语言处理(三)
原文:NaturalLanguageProcessingwithTransformers译者:飞龙协议:CCBY-NC-SA4.0第八章:使
transformers
在生产中更高效在之前的章节中,您已经看到了
绝不原创的飞龙
·
2024-02-01 12:59
人工智能
gpt
人工智能
【Transformer 】 Hugging Face手册 (01/10)
Transformers
提供API和工具,可轻松下载和训练最先进的预训练模型。使用预训练模型可以降低计算成本和碳足迹,并节省从头开始训练模型所需的时间和资源。这些模型
无水先生
·
2024-01-31 19:42
NLP高级和ChatGPT
人工智能
transformer
深度学习
人工智能
【问题解决】| 对于代码访问
transformers
库报错,无法正常下载模型及其参数的问题
对于访问Transformer库的问题考虑用科学上网,直接进行下载把模型提前下好后放到本地但是如果能用第一种方式会好很多,但是实际中可能会遇到如下问题报这个错,原因是未开启科学上网OSError:Wecouldn'tconnectto'https://huggingface.co'toloadthisfile,couldn'tfinditinthecachedfilesanditlookslike
Qodicat
·
2024-01-31 13:44
Solve
Problems
问题解决
python
transform
使用 Pegasus-t5 预训练模型遇到问题解决
问题&解决需要手动把tokenizer相关文件进行调整到当前文件夹下,并修改data_utils中fengshen的地址
transformers
版本降低为4.29.1否则会找不到vocabdemo代码fromtransformersimportPegasusF
be_humble
·
2024-01-31 07:28
人工智能
语言模型
自然语言处理
huggingface 的trainer训练框架优势
Transformers
库写了了一个trans
be_humble
·
2024-01-31 07:57
人工智能
深度学习
python
anaconda虚拟环境添加第三方的库tensorbordX,torchvision,tqdm,opencv-python,pillow,tensorflow,keras
系列文章目录一、conda新建配置python3.8的虚拟环境,安装torch-cuda1.8,torchtext0.9.0,huggingface的
transformers
库anaconda虚拟环境添加第三方的库系列文章目录前言一
LinlyZhai
·
2024-01-29 18:00
python
opencv
pillow
使用Bert报错:Bert输出为字符串
1、解决办法参考:通过CCproxy配置内网linux服务器_ccproxy-CSDN博客按照解决办法1,重新下载
transformers
,仍然报错2、解决办法在网上查找资料后发现,这和tranformers
wwqily
·
2024-01-29 16:13
bert
人工智能
深度学习
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他