E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
LLaMA-3
用Python微调DeepSeek R1
Python库和框架微调大语言模型需要用到以下Python库和框架:unsloth:这个库可太厉害了,它能让像
Llama-3
、Mistral、Phi-4和Gemma2这些大语言模型的微调速度提高2倍,内存使用减少
爱喝白开水a
·
2025-04-05 12:00
python
开发语言
人工智能
langchain
AI大模型
DeepSeek
R1
微调DeepSeek
LLMs之
Llama-3
:基于Colab平台(免费T4-GPU)利用LLaMA-Factory的GUI界面(底层采用unsloth优化框架【加速训练5~30倍+减少50%的内存占用】)对
llama-3
LLMs之
Llama-3
:基于Colab平台(免费T4-GPU)利用LLaMA-Factory的GUI界面(底层采用unsloth优化框架【加速训练5~30倍+减少50%的内存占用】)对llama-3-
一个处女座的程序猿
·
2025-03-07 09:41
NLP/LLMs
成长书屋
大语言模型
unsloth
LLaMA-3
LoRA
自编大模型系列之 01 使用 Python 从头构建 LLaMA 3 编写您自己的十亿参数LLM(教程含源码)
现在
LLaMA-3
已经发布,我们将以更简单的方式重新创建它。我们不会在本博客中使用GPU,但您至少需要17GB的RAM,因为我们将加载一些大小超过15GB的文件。
知识大胖
·
2025-02-27 10:33
NVIDIA
GPU和大语言模型开发教程
python
llama
开发语言
大模型是如何蒸馏像Qwen-7B,
Llama-3
这种小模型的?
1.Qwen-7B和
Llama-3
的所属公司Qwen-7B:属于阿里巴巴,是“通义千问”系列的开源模型,由阿里云团队研发。
闫哥大数据
·
2025-02-26 03:12
大模型
llama
人工智能
用 Unsloth 微调 LLaMA 3 8B
用Unsloth微调LLaMA38B今年4月份,Meta公司发布了功能强大的大型语言模型(LLM)
Llama-3
,为从事各种NLP任务的开发人员提供了功能强大可以在普通机器上运行的开源LLM。
liugddx
·
2024-08-25 08:05
AI
微调
大模型
llama
离线 AI:使用 Termux 从源代码在 Android 手机/Waydroid 上构建 Ollama
Android手机/WaydroidTermux的终端命令相同推荐文章《在自己笔记本上使用
Llama-3
生成PowerPoint—幻灯片自动化的第一步》权重1,本地类、ppt类《如何微调NLLB-200
知识大胖
·
2024-08-23 17:32
NVIDIA
GPU和大语言模型开发教程
人工智能
智能手机
ollama
termux
waydroid
上一页
1
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他