E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
embedding微调
大模型实战营Day4 XTuner大模型单卡低成本
微调
实战
FINETUNE简介LLM下游应用中,增量预训练和指令跟随是经常会用到的两种
微调
模式指令跟随
微调
使用场景:让模型学会对话模板,根据人类指令进行对话训练数据:高质量的对话,问答数据为什么需要指令
微调
?
流浪德意志
·
2024-01-14 17:37
LLM
人工智能
深度学习
大模型
InternLM
大模型实战营Day4 作业
基础作业:构建数据集,使用XTuner
微调
InternLM-Chat-7B模型,让模型学习到它是你的智能小助手,效果如下图所示,本作业训练出来的模型的输出需要将不要葱姜蒜大佬替换成自己名字或昵称!
流浪德意志
·
2024-01-14 17:35
LLM
python
大模型
langchain
InternLM
人工智能
通俗的讲解RAG技术以及与
微调
的对比
ThisarticlewilldiscussoneofthemostapplicableusesofLanguageLearningModels(LLMs)inenterpriseuse-case,RetrievalAugmentedGeneration(“RAG”).RAGisthebiggestbusinessuse-caseofLLMs,anditwillbeincreasinglyimpo
放飞自我的Coder
·
2024-01-14 17:39
RAG
LLM
大模型
微调
及生态简单介绍
大模型大模型生态OpenAI大模型生态:全球开源大模型性能评估榜单中文语言模型——ChatGLM基于ChatGLM的多模态⼤模型大模型
微调
LLM⼤语⾔模型⼀般训练过程为什么需要
微调
高效
微调
技术⽅法概述⾼
天天写点代码
·
2024-01-14 16:38
人工智能
chatgpt
自然语言处理
AIGC
NLP论文解读:无需模板且高效的语言
微调
模型(下)
id=6o5ZEtqP2g02PERFECT:无需Patterns和Verbalizer的
微调
模型这个模型主要包含三个部分:1)无需pattern的任务描述,使用了一
NLP论文解读
·
2024-01-14 15:40
【AIGC】Controlnet:基于扩散模型的文生图的可控性
https://arxiv.org/pdf/2302.05543.pdf摘要冻结了stablediffusion的预训练模型并重用它的预训练编码层神经网络结构与零初始化卷积层连接,从零开始逐渐增加参数,并确保
微调
过程中不会有噪声影响
资料加载中
·
2024-01-14 15:18
pytorch
深度学习
AIGC
Controlnet
【AIGC】IP-Adapter:文本兼容图像提示适配器,用于文本到图像扩散模型
直接
微调
预训练模型也是一种行之有效的方法,但是需要消耗大量计算资源。并且存在模型兼容性问题。在本文中,我们介绍了IP-Adapter,
资料加载中
·
2024-01-14 15:45
深度学习
pytorch
AIGC
IPAdapter
transformer的输入到输出(维度以及矩阵计算)
基本的transformer模型框架本期以翻译为一个例子讲述他的训练过程:从输入文本开始:x=早上好y=goodmorningencode部分:inputs的输入(可以是字也可以是词):x=早上好经过
embedding
NLPnoproble
·
2024-01-14 14:01
transformer
深度学习
人工智能
[书生·浦语大模型实战营]——XTuner 大模型单卡低成本
微调
1.Finetune简介在未经过
微调
的pretrainedLLM中,模型只会尽量去拟合你的输入,也就是说模型并没有意识到你在提问,因此需要
微调
来修正。
不是吧这都有重名
·
2024-01-14 14:45
人工智能
[论文精读]Hi-GCN: A hierarchical graph convolution network for graph
embedding
learning of brain network
论文原文:Hi-GCN:Ahierarchicalgraphconvolutionnetworkforgraph
embedding
learningofbrainnetworkandbraindisordersprediction-ScienceDirect
夏莉莉iy
·
2024-01-14 13:03
论文精读
embedding
人工智能
深度学习
学习
机器学习
图像处理
图论
go调用python3:go-python3包的使用
zhuanlan.zhihu.com/p/150253406https://blog.csdn.net/skyztttt/article/details/8115086https://poweruser.blog/
embedding
-python-in-go
xxx_undefined
·
2024-01-14 13:43
golang
golang
python
InternLM第4次课笔记
XTuner大模型单卡低成本
微调
实战1Finetune介绍2XTuner介绍XTuner中
微调
的技术:38GB显卡玩转LLM4动手实战环节https://github.com/InternLM/tutorial
Jamiechoi
·
2024-01-14 12:55
笔记
InternLM第3节课笔记
基于InternLM和LangChain搭建你的知识库1大模型开发范式LLM局限性:时效性、专业能力有限、定制化成本高RAG(检索、增强、生成)外挂知识库
微调
2LangChain简介LangChain核心组成模块
Jamiechoi
·
2024-01-14 12:17
笔记
【深度学习:Foundation Models】基础模型完整指南
基础模型背后的5项人工智能原理根据大量数据进行预训练自我监督学习过度拟合
微调
和快速工程(适应性强)广义的基础模型的用例基础模型的类型计算机视觉基础模型计算机视觉基础模型的示例多模式基础模型多模式基础模型示例生成对抗网络
jcfszxc
·
2024-01-14 10:14
深度学习知识专栏
深度学习
人工智能
重读VIT:深入探索细节与影响
文本中的每个词(token)我们都通过
embedding
把它表示成了向量的形式。训练任务:在Bert中,我们同时做2个训练任务:NextSentencePred
liiiiiiiiiiiiike
·
2024-01-14 10:38
深度学习
算法
计算机视觉
图像处理
DreamBooth:个性化的文本到图像扩散模型
文章目录一、DreamBooth简介二、Dreambooth的思想三、DreamBooth的整体损失函数一、DreamBooth简介DreamBooth是一种
微调
文生图扩散模型的方法,最大的特点是Subject-Driven
丁希希哇
·
2024-01-14 07:29
AIGC阅读学习
计算机视觉
人工智能
算法
AIGC
Xtuner大模型
微调
Xtuner大模型
微调
一、课程笔记文档链接:https://github.com/InternLM/tutorial/blob/main/xtuner/README.md视频链接:https://www.bilibili.com
yestolife123
·
2024-01-14 06:43
人工智能
Whisper: openAI开源准确率最高的通用语言语音识别
当扩大到68万小时的多语言和多任务监督时,生成的模型可以很好地泛化到标准基准,而且通常可以与之前的全监督结果相竞争,但在zero-shot识别设置中,无需进行任何
微调
。
智慧医疗探索者
·
2024-01-14 04:11
音视频处理
whisper
语音识别
人工智能
高效
微调
大型预训练模型的Prompt Learning方法
目录前言1promptlearning简介2promptlearning步骤2.1选择模型2.2选择模板(Template)2.3Verbalizer的构建3PromptLearning训练策略3.1Prompting组织数据,优化参数3.2增加SoftPrompts,冻结模型,优化Prompt嵌入3.3使用Prompted数据进行预训练,再Zero-shotInference。结论前言近年来,自
cooldream2009
·
2024-01-14 04:29
AI技术
大模型基础
NLP知识
prompt
大模型
微调
用通俗易懂的方式讲解:大模型
微调
方法总结
大家好,今天给大家分享大模型
微调
方法:LoRA,Adapter,Prefix-tuning,P-tuning,Prompt-tuning。
机器学习社区
·
2024-01-14 03:03
大模型
自然语言
CV
大模型
多模态
Langchain
chatgpt
语言模型
模型微调
OpenAI ChatGPT-4开发笔记2024-06:最简
Embedding
Embedding
embedding
直译是:嵌入。和实际意思有些差距。其实就是把文本转换为向量表示的过程。用“向量化”更直接,但这又和tensor有点儿混。它是变成向量的一个过程。
aiXpert
·
2024-01-14 01:59
笔记
embedding
人工智能
大模型实战笔记04——XTuner 大模型单卡低成本
微调
实战
大模型实战笔记04——XTuner大模型单卡低成本
微调
实战1、Finetune简介2、XTuner3、8GB显存玩转LLM4、动手实战环节注:笔记内容均为截图课程视频地址:https://www.bilibili.com
等风来随风飘
·
2024-01-14 00:44
书生浦语大模型实战
笔记
大模型在广告ctr预估中的应用
背景预训练大模型在ctr预估方面取得了不错的效果,但是应用大模型方面还主要停留在提取离线预训练,然后使用大模型的打分结果或者中间的
embedding
向量,这种级联的应用方式相对灵活方便。
WitsMakeMen
·
2024-01-13 22:09
深度学习
人工智能
机器学习
LLM
广告
【InternLM 大模型实战】第三课
基于InternLM和LangChain搭建你的知识库大模型开发范式RAG(检索增强生成)FINETUNE(
微调
)LangChain简介构建向量数据库加载源文件文档分块文档向量化搭建知识库助手构建检索问答链
卖小麦←_←
·
2024-01-13 21:14
AI
大模型
python
python
人工智能
语言模型
【InternLM 大模型实战】第四课
XTuner大模型单卡低成本
微调
实战FINETUNE简介指令跟随
微调
增量预训练
微调
LoRA&QLoRAXTuner简介功能亮点适配多种生态适配多种硬件8GB显卡玩转LLMFlashAttentionDeepSpeedZeRO
卖小麦←_←
·
2024-01-13 21:07
AI
大模型
python
人工智能
机器学习
深度学习
李铁一个
微调
起到关键作用,把用废前锋变成宝!
相信不少球迷都知道在过去的十年里,我们的中国足球出现了一个场声势浩大的“洋务运动”。大量资金流入联赛,而我们的俱乐部在获得资金之后,开始疯狂地请大牌外援和外教。一时间让我们的中超联赛变成了星光熠熠的土豪联赛。我们的球迷在看台上看球有时候都会恍惚,看着球场上奔跑的世界一流球星,再看看场边指挥的大牌外教,仿佛置身欧洲联赛。可以说这场“洋务运动”让我们的球迷享受到了福利,但是很可惜对于我们中国足球的发展
枫桥落夜
·
2024-01-13 21:03
03-19 早起干啥
第二天,稍
微调
整了状态,明显起的来一点了,还主动打电话叫了对方。第三天,又是没有早睡,早起又是很艰难的起来的。第四天,关了一个又一个闹钟,终于还是早起失败了。
Judy喵
·
2024-01-13 20:23
从头开始构建大语言模型(LLM)
从最初的设计和创建到对通用语料库的预训练,一直到针对特定任务进行
微调
。构建大语言模型课程内容包括:从
这就是编程
·
2024-01-13 19:41
语言模型
人工智能
自然语言处理
【LangChain学习之旅】—(7) 调用模型:使用OpenAI API还是
微调
开源Llama2/ChatGLM?
【LangChain学习之旅】—(7)调用模型:使用OpenAIAPI还是
微调
开源Llama2/ChatGLM?
之墨_
·
2024-01-13 19:47
人工智能
NLP
langchain
大模型
LLM
Vicuna云端实践
简介Vicuna是开源领域最强最著名的大语言模型,是UC伯克利大学的研究人员联合其它几家研究机构共同推出的一系列基于LLaMA
微调
的大语言模型。
皮皮姑娘
·
2024-01-13 19:37
大语言模型
语言模型
人工智能
机器学习
YOLOv4剪枝【附代码】
本项目只是负责把框架搭建起来,没有进行重训练的
微调
或者去研究应该剪哪里比较好,需要自己去研究YOLOv4代码参考:Pytorch搭建自己的YoloV4目标检测平台(Bubbliiiing深度学习教程)_
爱吃肉的鹏
·
2024-01-13 19:35
计算机视觉
剪枝
人工智能
yolov5剪枝复现
剪枝完成后对模型进行
微调
回复
epic_Lin
·
2024-01-13 19:02
深度学习
计算机视觉
YOLOV7剪枝流程
YOLOV7剪枝流程1、训练1)划分数据集进行训练前的准备,按正常的划分流程即可2)修改train.py文件第一次处在参数列表里添加剪枝的参数,正常训练时设置为False,剪枝后
微调
时设置为Trueparser.add_argument
云雨、
·
2024-01-13 19:31
Yolo算法使用
YOLO
剪枝
人工智能
ROS无人机开发常见错误
如果ChannelMonitor可以识别出遥控各通道的值,再检查上方横滚/俯仰/水平/油门四个通道的
微调
是否在中点(即遥控器摇杆自然回中的情况下,地面站显
南京超维空间智能科技有限公司
·
2024-01-13 18:20
ROS
常见
知识点总结
无人机
ROS
XTuner 大模型单卡低成本
微调
实战
XTuner大模型单卡低成本
微调
实战Finetune简介增量预训练
微调
指令跟随
微调
LoRAXTuner介绍功能亮点8GB显存玩转LLMFlashAttentionDeepSpeedZeRO上手操作平台激活环境
微调
参考教程
桑_榆
·
2024-01-13 17:16
MMLab实战训练营
人工智能
深度学习
机器学习
书生.浦语大模型实战一
从专用模型到通用大模型数据书生.万卷1.0文本图像-文本视频数据OpenDataLab开放平台图像:ImageNettokens语料:WikiQA音频视频:MovieNet3D模型预训练
微调
增量续训使用场景
时空摆渡者
·
2024-01-13 16:12
人工智能
人工智能
大模型
书生.浦语大模型LangChain实战
例如通过
微调
模型(Finetune)来适应专业领域知识,但这种方式对技术要求较高,属于计算密集型,很难灵活使用。
时空摆渡者
·
2024-01-13 16:37
langchain
深入浅出完整解析Stable Diffusion(SD)核心基础知识
2023.10.06最新消息,本文已经发布StableDiffusionV1-2系列的完整模型
微调
训练教程和对应的LoRA模型训练教程,并增加对StableDiffusion
微调
训练与LoRA训练的解读与思考
u013250861
·
2024-01-13 15:19
VLM
人工智能
XTuner 大模型单卡低成本
微调
原理
文章目录Finetune简介增量预训练
微调
指令跟随
微调
微调
原理XTuner
微调
框架XTuner数据引擎XTuner
微调
的优化策略动手实战Finetune简介
微调
模式:增量预训练
微调
使用场景:让基座模型学习到一些新知识
爱科研的瞌睡虫
·
2024-01-13 13:20
人工智能
算法
llama
深度学习
语言模型
大模型实战训练营笔记(1)
a.书生万卷/opendatalab:数据系统b.预训练:对于大多数学习者来说应该不太需要c.
微调
增量
微调
+有监督
微调
d.评测e.部署f.智
崖7046
·
2024-01-13 13:03
笔记
第一节课笔记——书生·浦语大模型实战营
浦语大模型全链路开源体系,做个笔记,也算给训练营打个广告,毕竟让本菜鸡免费学习~~书生·浦语大模型1.大模型系列2.大模型性能全链路开源体系0.开源体系介绍这里部署和评测的位置应该换一换~1.数据2.预训练重点关注预训练和
微调
的区别
weixin_52626049
·
2024-01-13 13:03
语言模型
【InternLM 大模型实战】第一课
书生·浦语大模型全链路开源体系前言环境背景开源历程开源模型应用从模型到应用全链条开源开放体系数据预训练
微调
高效
微调
框架XTuner评测OpenCompass开源评测平台架构部署LMdeploy大模型部署的全流程解决方案智能体轻量级智能体框架
卖小麦←_←
·
2024-01-13 13:02
大模型
深度学习
人工智能
[书生·浦语大模型实战营]——基于 InternLM 和 LangChain 搭建你的知识库
通过单一的代码库,它支持在拥有数千个GPU的大型集群上进行预训练,并在单个GPU上进行
微调
,同时实现了卓越的性能优化。在1024个GPU上训练时,InternLM可以实现近90%的加速效率。
不是吧这都有重名
·
2024-01-13 13:00
openmmlab系列
langchain
linux
python
人工智能
【书生·浦语】大模型实战营——第四课笔记
vd_source=5d94ee72ede352cb2dfc19e4694f7622本次视频的内容分为以下四部分:目录
微调
简介
微调
会使LLM在具体的领域中输出更好的
Horace_01
·
2024-01-13 13:27
笔记
人工智能
python
语言模型
深度学习
【书生·浦语】大模型实战营——第四课作业
教程文档:https://github.com/InternLM/tutorial/blob/main/xtuner/self.md基础作业需要构建数据集,
微调
模型,让其明白自己的弟位(OvO!)
Horace_01
·
2024-01-13 13:23
语言模型
深度学习
人工智能
python
Multimodal Transformer for Unaligned Multimodal Language Sequences
未对齐多模态语言序列的多模态变换器文章信息研究目的研究背景研究内容研究方法1.总体架构2.CrossmodalAttention3.CrossmodalTransformer4.Conv1D5.Positional
Embedding
6
鱼儿也有烦恼
·
2024-01-13 12:01
多模态
深度学习
深度学习
多模态
2024 1.6~1.12 周报
这可以包括使用模型作为特征提取器,
微调
模型,或使用模型的部分作为初始化。找到目
shengMio
·
2024-01-13 12:59
周报
深度学习
机器学习
新书速览|从零开始大模型开发与
微调
:基于PyTorch与ChatGLM
详细讲解大模型基本理论、算法、程序实现与应用实战,揭示大模型开发与
微调
技术1本书内容大模型是深度学习自然语言处理皇冠上的一颗明珠,也是当前AI和NLP研究与产业中最重要的方向之一。
全栈开发圈
·
2024-01-13 11:59
pytorch
人工智能
python
Phi-2小语言模型QLoRA
微调
教程
前言就在不久前,微软正式发布了一个27亿参数的语言模型——Phi-2。这是一种文本到文本的人工智能程序,具有出色的推理和语言理解能力。同时,微软研究院也在官方X平台上声称:“Phi-2的性能优于其他现有的小型语言模型,但它足够小,可以在笔记本电脑或者移动设备上运行”。微软通过时下一些如BigBenchHard(BBH)、常识推理(PIQA、WinoGrande、ARCeasy和Challenge、
羽星_s
·
2024-01-13 10:28
语言模型
人工智能
自然语言处理
QLoRA
Phi-2
大语言模型LLM的原理,bert、GPT、GLM三者的对比
本次任务:1、大语言模型原理、2、演示1:单一文档摘要、3、演示2:多文档+langchain摘要4、演示3:
微调
训练本地知识库:美食、菜谱大模型....一、大语言模型介绍:主要、技术依赖:transformer
金城武555
·
2024-01-13 10:49
计算机视觉cv-base
语言模型
bert
gpt
自然语言处理
chatgpt
上一页
12
13
14
15
16
17
18
19
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他