E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
指令集微调
【InternLM 大模型实战】第一课
书生·浦语大模型全链路开源体系前言环境背景开源历程开源模型应用从模型到应用全链条开源开放体系数据预训练
微调
高效
微调
框架XTuner评测OpenCompass开源评测平台架构部署LMdeploy大模型部署的全流程解决方案智能体轻量级智能体框架
卖小麦←_←
·
2024-01-13 13:02
大模型
深度学习
人工智能
[书生·浦语大模型实战营]——基于 InternLM 和 LangChain 搭建你的知识库
通过单一的代码库,它支持在拥有数千个GPU的大型集群上进行预训练,并在单个GPU上进行
微调
,同时实现了卓越的性能优化。在1024个GPU上训练时,InternLM可以实现近90%的加速效率。
不是吧这都有重名
·
2024-01-13 13:00
openmmlab系列
langchain
linux
python
人工智能
【书生·浦语】大模型实战营——第四课笔记
vd_source=5d94ee72ede352cb2dfc19e4694f7622本次视频的内容分为以下四部分:目录
微调
简介
微调
会使LLM在具体的领域中输出更好的
Horace_01
·
2024-01-13 13:27
笔记
人工智能
python
语言模型
深度学习
【书生·浦语】大模型实战营——第四课作业
教程文档:https://github.com/InternLM/tutorial/blob/main/xtuner/self.md基础作业需要构建数据集,
微调
模型,让其明白自己的弟位(OvO!)
Horace_01
·
2024-01-13 13:23
语言模型
深度学习
人工智能
python
2024 1.6~1.12 周报
这可以包括使用模型作为特征提取器,
微调
模型,或使用模型的部分作为初始化。找到目
shengMio
·
2024-01-13 12:59
周报
深度学习
机器学习
高通常用
指令集
(网上摘录)
*#06#-IMEInumberTheInternationalMobileEquipmentIdentityorIMEIisanumber,usuallyunique,toidentify3GPP(i.e.,GSM,UMTSandLTE)andiDENmobilephones,aswellassomesatellitephones.Itisusuallyfoundprintedinsidethe
加菲猫Jack
·
2024-01-13 12:52
警惕国外对RISC-V 技术采取的限制
比如MIPS
指令集
在我成功收购后,欧美集体转入Arm的开发,在技术路线上设置重重壁垒。(Arm是
指令集
,是Android和Apple生态系统中所有现代智能手机使用的CPU架构。
CIb0la
·
2024-01-13 12:11
risc-v
linux
运维
新书速览|从零开始大模型开发与
微调
:基于PyTorch与ChatGLM
详细讲解大模型基本理论、算法、程序实现与应用实战,揭示大模型开发与
微调
技术1本书内容大模型是深度学习自然语言处理皇冠上的一颗明珠,也是当前AI和NLP研究与产业中最重要的方向之一。
全栈开发圈
·
2024-01-13 11:59
pytorch
人工智能
python
浅析ARMv8体系结构:A64
指令集
相对地址模式伪指令加载与存储指令的变种不同位宽的加载与存储指令多字节内存加载和存储指令基地址偏移量模式前变基模式后变基模式跳转指令返回指令比较并跳转指令其它指令内存独占访问指令异常处理指令内存屏障指令相关参考A64指令编码格式A64
指令集
中每条指令的宽度为
Aspiresky
·
2024-01-13 11:15
#
Arm体系结构
linux
服务器
Phi-2小语言模型QLoRA
微调
教程
前言就在不久前,微软正式发布了一个27亿参数的语言模型——Phi-2。这是一种文本到文本的人工智能程序,具有出色的推理和语言理解能力。同时,微软研究院也在官方X平台上声称:“Phi-2的性能优于其他现有的小型语言模型,但它足够小,可以在笔记本电脑或者移动设备上运行”。微软通过时下一些如BigBenchHard(BBH)、常识推理(PIQA、WinoGrande、ARCeasy和Challenge、
羽星_s
·
2024-01-13 10:28
语言模型
人工智能
自然语言处理
QLoRA
Phi-2
大语言模型LLM的原理,bert、GPT、GLM三者的对比
本次任务:1、大语言模型原理、2、演示1:单一文档摘要、3、演示2:多文档+langchain摘要4、演示3:
微调
训练本地知识库:美食、菜谱大模型....一、大语言模型介绍:主要、技术依赖:transformer
金城武555
·
2024-01-13 10:49
计算机视觉cv-base
语言模型
bert
gpt
自然语言处理
chatgpt
书生·浦语大模型实战营-学习笔记1
目录书生·浦语大模型全链路开源体系数据集预训练
微调
评测部署多智能体视频地址:(1)书生·浦语大模型全链路开源体系开源工具github:https://github.com/InternLM/InternLM
Kinno酱
·
2024-01-13 07:37
大模型
学习
笔记
人工智能
自然语言处理
chatgpt
domain adapation
使用sourcedata训练一个模型,然后使用targetdata
微调
该模型。注
闪闪发亮的小星星
·
2024-01-13 06:46
李宏毅机器学习课程学习笔记
人工智能
P122 神经网络压缩Network compression-purning
在边缘设备上跑时,模型太大,跑不动、purn:删减删减以后,正确率有影响会下降为解决这个问题,进行
微调
,每次只减一点参数,重复多次。使得最后修剪后的模型跟原来的模型差别不大。
闪闪发亮的小星星
·
2024-01-13 06:07
李宏毅机器学习课程学习笔记
神经网络
人工智能
深度学习
关于lora的理解
参考:【OpenLLM007】大模型炼丹术之小参数撬动大模型-万字长文全面解读PEFT参数高效
微调
技术-知乎(zhihu.com)图解大模型
微调
系列之:大模型低秩适配器LoRA(原理篇)-知乎(zhihu.com
wozwdaqian
·
2024-01-13 04:39
深度学习
人工智能
通义千问Qwen-72B-Chat基于PAI的低代码
微调
部署实践
作者:熊兮、求伯、一耘引言通义千问-72B(Qwen-72B)是阿里云研发的通义千问大模型系列的720亿参数规模模型。Qwen-72B的预训练数据类型多样、覆盖广泛,包括大量网络文本、专业书籍、代码等。Qwen-72B-Chat是在Qwen-72B的基础上,使用对齐机制打造的基于大语言模型的AI助手。阿里云人工智能平台PAI是面向开发者和企业的机器学习/深度学习平台,提供AI开发全链路服务。快速开
阿里云大数据AI技术
·
2024-01-13 03:52
ai
Mixtral 8X7B MoE模型基于PAI的
微调
部署实践
是面向开发者和企业的机器学习/深度学习平台,提供了对于Mixtral8x7B模型的全面支持,开发者和企业用户可以基于PAI-快速开始(PAI-QuickStart)轻松完成Mixtral8x7B模型的
微调
和部署
阿里云大数据AI技术
·
2024-01-13 03:50
人工智能
实战案例:chatglm3 基础模型多轮对话
微调
chatglm3发布了,这次还发了base版本的模型,意味着我们可以基于这个base模型去自由地做SFT了。本项目实现了基于base模型的SFT。base模型https://huggingface.co/THUDM/chatglm3-6b-base由于模型较大,建议离线下载后放在代码目录,以"./chatglm3-6b-base"的路径进行调用。技术交流群前沿技术资讯、算法交流、求职内推、算法竞赛
机器学习社区
·
2024-01-13 02:46
机器学习
chatgpt
人工智能
大模型
langchain
AIGC
这应该是最全的大模型训练与
微调
关键技术梳理
是否希望深入探索LLaMA、ChatGLM等模型的
微调
技术,进一步优化参数和使用不同
微调
方式?现在我带大家领略大模型训练与
微调
进阶之路,拓展您的技术边界!
机器学习社区
·
2024-01-13 02:46
大模型
自然语言
大模型
langchain
chatgpt
人工智能
AIGC
达摩研究院Paraformer-large模型已支持windows
FunASR提供了便捷的脚本和教程,支持预训练好的模型的推理与
微调
。FunASR开源了大量在工业数据上预训练模型,用户可以在模型许可协议下自由使用、复制、修改和分享FunASR模型。
AI 研习所
·
2024-01-13 01:14
AIGC
人工智能
大模型
AIGC
人工智能
大模型PEFT技术原理(一):BitFit、Prefix Tuning、Prompt Tuning
随着预训练模型的参数越来越大,尤其是175B参数大小的GPT3发布以来,让很多中小公司和个人研究员对于大模型的全量
微调
望而却步,近年来研究者们提出了各种各样的参数高效迁移学习方法(Parameter-efficientTransferLearning
wshzd
·
2024-01-13 00:29
ChatGPT
笔记
prompt
人工智能
LLM之长度外推(二)| Self-Extend:无需
微调
的自扩展大模型上下文窗口
论文链接:https://simg.baai.ac.cn/paperfile/a34ae7f4-f0ce-4f8f-b8f2-e8e4d84bbee5.pdf目前大模型基本都采用transformer结构,而transformer中attention机制的计算复杂度与序列长度呈平方关系,因此大模型在训练时候通常会设置固定的上下文窗口,而且也不会太大,比如GPT-4支持32K上下文,但这会限制大模型
wshzd
·
2024-01-13 00:28
ChatGPT
笔记
chatgpt
大模型关于Lora论文集合
EfficientFine-tuningofLanguageModelsviaResidualLearning》ChainofLoRA(COLA),这是一种受Frank-Wolfe算法启发的迭代优化框架,旨在弥合LoRA和全参数
微调
之间的差距
致Great
·
2024-01-13 00:48
自然语言处理
大模型
LangChain+glm3原理解析及本地知识库部署搭建
前期准备:在部署LangChain之前,需要先下载chatglm3模型,如何下载可以查看我的上一篇文章chatglm3本地部署本地知识库和
微调
的区别:知识库是使用向量数据库存储数据,可以外挂,作为LLM
牛像话
·
2024-01-12 19:29
langchain
embedding
深度学习
chatgpt
跟着美食去旅行——马来西亚美食
马来西亚珍多冰,是一种以椰酱、绿色细面条和椰糖做成的美味刨冰,在酷热的天气下吃一碗,格外消暑椰浆饭是一道传统的马来西亚经典菜肴,得名于其烹饪方法,就是用椰浆烹煮米饭,再加上香兰叶略
微调
整,为米饭赋予扑鼻的清香沙爹肉串是马来西亚的传统美食
吃喝玩乐吧
·
2024-01-12 18:09
用通俗易懂的方式讲解:对 embedding 模型进行
微调
,我的大模型召回效果提升了太多了
在外挂知识库的过程中,embedding模型的召回效果直接影响到大模型的回答效果,因此,在许多场景下,我们都需要
微调
我们的embedding模型来提高我们的召回效果。
Python算法实战
·
2024-01-12 17:30
大模型理论与实战
大模型
embedding
LLM
多模态
大模型
评估LLM在细胞数据上的实用性(2)-细胞层面的评估
微调
阶段
tzc_fly
·
2024-01-12 17:27
单细胞多组学分析
人工智能
羊驼2:开放的基础和
微调
聊天模型--Llama 2论文阅读
论文地址:https://arxiv.org/pdf/2307.09288.pdfd代码地址:GitHub-facebookresearch/llama-recipes:ExamplesandrecipesforLlama2model问答用了多少个gpu?这篇文档中使用了3.3MGPU小时的计算,使用的硬件类型是A100-80GB,可以扩展到2000个GPU,但这些计算的功耗估计并不包括互连或非G
andeyeluguo
·
2024-01-12 17:59
AI笔记
人工智能
Qt QSpinBox
微调
框控件
文章目录1属性和方法1.1值1.2步长1.3循环1.4加速1.5前缀和后缀1.6信号和槽2实例2.1布局2.2代码实现
微调
框,允许用户按照一定的步长,来增加或减少其中显示的数值修改
微调
框数值的方式包括:
theRavensea
·
2024-01-12 16:44
Qt
#
控件
qt
开发语言
c++
RAG 详解
RAG还是
微调
?如何评估RAG?
javastart
·
2024-01-12 12:07
aigc
大模型
langchain
人工智能
AIGC
chatgpt
原创 | 一文读懂ChatGPT中的强化学习
创建者将监督学习和强化学习相结合来
微调
ChatGPT,强化学
javastart
·
2024-01-12 12:07
aigc
大模型
人工智能
chatgpt
AIGC
【深度学习:视觉基础模型】视觉基础模型 (VFM) 解释
SegGPTMicrosoft'sVisualChatGPT视觉基础模型的应用视觉基础模型的好处可视化基础模型的挑战与考虑因素解决视觉人工智能中与伦理、公平和偏见相关的问题保护隐私、合规性和数据安全成本管理
微调
可视
jcfszxc
·
2024-01-12 09:23
深度学习知识专栏
深度学习
人工智能
数据驱动下的LLM优化:如何从数据集中发掘最大价值?
来源,公众号:芝士AI吃鱼本文聚焦于通过使用精心策划的数据集对LLM进行
微调
,以提升其建模性能。具体来说,本文强调了涉及修改、使用或操纵数据集进行基于指令的
微调
的策略,而不是改变模型架构或训练算法。
wwlsm_zql
·
2024-01-12 09:50
人工智能
英特尔:对RISC-V,我是认真的
长期以来,芯片设计企业通过向英特尔、Arm支付许可费用,获得X86、Arm等专用ISA(
指令集
)的授权,并在此基础上设计芯片产品或提供芯片设计服务。
英特尔开发人员专区
·
2024-01-12 08:50
开发者分享
risc-v
arm开发
与 x86、ARM 三分天下,全球“开花”的 RISC-V 如何成为中国最受欢迎芯片架构?...
关注、星标公众号,精彩内容每日送达来源:网络素材2010年,加州大学伯克利分校的研究团队开始了一项新的探索项目:希望创建一个全新的开源
指令集
架构,这个架构具有易于理解的简洁
指令集
,并且能够提供高性能和低功耗的性能
Hack电子
·
2024-01-12 08:19
arm开发
risc-v
架构
RISC-V是如何与X86、ARM三分天下
目录1.行业CPU
指令集
格局2.汽车中的RISC-V进展2.1国际进展2.2国内进展3.小结2023年3月2日,在平头哥牵头举办的玄铁RISC-V生态大会上,工程院院士倪光南表示,基于RISC-V模块化
CyberSecurity_zhang
·
2024-01-12 08:46
闲言碎语
risc-v
国产芯片
汽车芯片
6.3、SDN在云计算中的应用
技术解决两大挑战三、SDN云计算解决方案3.1、SDN云计算解决方案之控制平面openflow协议3.1.1、流表项内容3.1.1.1、匹配字段3.1.1.2、优先级3.1.1.3、计数器3.1.1.4、
指令集
网运少年
·
2024-01-12 07:55
网络
云
云计算
GPT Understands, Too
1.介绍传统fine-tune(使用训练数据来
微调
模型参数),GPT在自然语言理解任务上未能取得很好的效果,关于NLU任务的一种新方法P-tuning,采用可训练的连续的promptembeddings
Tsukinousag
·
2024-01-12 06:23
大语言模型参数
微调
过程(附完整代码)
这是一个金融领域大模型
微调
的具体代码执行过程,具体代码可以详见git仓库。
抓个马尾女孩
·
2024-01-12 05:23
深度学习
语言模型
深度学习
今日最佳AI论文5篇:高效
微调
、图生3D、AI Agent、大模型ChatGPT、图学习
本文整理了2023年1月9日发表在ArXiv上的AI论文中最热门的TOP5。论文热度排序、论文标签、中文标题、推荐理由和论文摘要由AI论文推荐智能体赛博马良-AI论文解读达人(saibomaliang.com)提供。如需查看其他最热论文,欢迎移步saibomaliang.com^_^TOP1Dr2Net:DynamicReversibleDual-ResidualNetworksforMemory
夕小瑶
·
2024-01-12 05:13
人工智能
chatgpt
大模型
【通义千问】大模型Qwen GitHub开源工程学习笔记(5)-- 模型的
微调
【全参数
微调
】【LoRA方法】【Q-LoRA方法】
微调
大表哥汽车人
·
2024-01-12 05:05
学习
笔记
人工智能
语言模型
LoRA
模型微调
Qwen
推荐一款手机端黑科技自动化脚本
本篇文章将为大家推荐这款iOS端的自动化应用,快捷指令App,可以通过它创建快捷指令及自动化
指令集
合,快速来完成来各种任
AirPython
·
2024-01-12 03:01
VUE常用的自定义指令
v-directives基于vue的自定义
指令集
合,包含复制粘贴指令v-copy长按指令v-longpress输入框防抖指令v-debounce禁止表情及特殊字符v-emoji图片懒加载v-LazyLoad
无名之辈程序媛
·
2024-01-12 03:55
vue自定义指令
vue
前端
pytorch11:模型加载与保存、finetune迁移训练
序列化与反序列化概念1.2pytorch中的序列化与反序列化1.3模型保存的两种方法1.4模型加载两种方法二、断点训练2.1断点保存代码2.2断点恢复代码三、finetune3.1迁移学习3.2模型的迁移学习3.2模型
微调
步骤
慕溪同学
·
2024-01-12 03:14
Pytorch
深度学习
pytorch
人工智能
神经网络
【扩散模型】11、Stable Diffusion | 使用 Diffusers 库来看看 Stable Diffusion 的结构
文章目录一、什么是StableDiffusion二、Diffusers库三、
微调
、引导、条件生成3.1
微调
3.2引导3.3条件生成四、StableDiffusion4.1以文本为条件生成4.2无分类器的引导
呆呆的猫
·
2024-01-12 01:13
stable
diffusion
恋爱多年我却恐婚,现在面前有一瓶,去除恐婚水要不要喝?
有解药,我有什么不敢喝,有解药我有什么逮什么喝这道题是比yesorno复杂的多的题想问一下现场,已婚的劳驾举举手了,本来都是生龙活虎的人,怎么都开始循循善诱了呢(转场说)跟大家一起把视角稍
微调
换过来导演大人打扰一下怕垮怕丢人
林糖糖
·
2024-01-12 01:25
java 基础
java两大核心机制(1)JVM(JavaVirtualMachine),java虚拟机JVM是一个虚拟的计算机,具有
指令集
并使用不同的存储区域。负责执行指令,管理数据,内存,寄存器。
月下醉美人
·
2024-01-12 00:12
ARM汇编指令
:8bitsHalfword:16bits(2byte)Word:32bits(4byte)Doubleword:64-bits(8byte)(Cortex-A处理器)大部分ARMcore提供:ARM
指令集
Omedetou。
·
2024-01-11 22:22
arm开发
汇编
ADB获取手机基础数据信息
blog.csdn.net/u013379032/article/details/106568983上简单地对PerfDog的使用方式进行了介绍,该工具对应用并没有多大的要求,因此估摸着大多数的应用都是通过ADB
指令集
进行获取的
Edward.W
·
2024-01-11 22:40
ADB系列
【计算机组成原理】-指令系统
1.2CISC到RISCCISC叫做复杂
指令集
系统计算机,因为当时的计算机指令
13KB
·
2024-01-11 22:06
计算机组成原理复习
java
开发语言
计算机外设
上一页
13
14
15
16
17
18
19
20
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他