E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
minimind
MiniMind
:低成本、高效能,平民级大模型训练神器
MiniMind
:平民级大模型训练神器背景与目标:降低大模型训练门槛传统的大模型训练通常需要大量的显卡资源和计算能力,这对大多数开发者来说是一个巨大的挑战。
·
2025-06-06 10:02
【2025版】普通人也能训练自己的AI大模型!从零基础到精通,精通收藏这篇就够了!
项目“
MiniMind
”上线即爆火,狂揽8.9k星标,技术圈直呼:“这才是AI民主化的未来!”一、逆袭:3块钱+2小时,训练一个AI大模型?你以为训练AI需要天价算力、专业团队?
狂野帅哥
·
2025-04-08 15:10
人工智能
ai
aigc
MiniMind
:完全从 0 训练自己的大模型
是B站UP主近在远方的远开源的一个微型语言模型,改进自DeepSeek-V2、Llama3结构,项目包含整个数据处理、pretrain、sft、dpo的全部阶段,包含混合专家(MoE)模型。其目标是把上手LLM的门槛无限降低,直接从0开始训练一个极其轻量的语言模型,最低仅需2G显卡即可推理训练!
三花AI
·
2025-03-22 15:49
三花AI
人工智能
LLM大模型
MiniMind
:3小时完全从0训练一个仅有26M的小参数GPT,最低仅需2G显卡即可推理训练!
MiniMind
:3小时完全从0训练一个仅有26M的小参数GPT,最低仅需2G显卡即可推理训练!
哈罗·沃德
·
2025-03-22 15:19
LLM
gpt
minimind
2学习:(1)训练
1、数据下载参考:https://github.com/jingyaogong/
minimind
/tree/master2、预训练训练6个epochspythontrain_pretrain.py--epochs6
溯源006
·
2025-03-22 14:47
minimind学习
学习
深度学习
生成模型
MiniMind
数据集分类:tokenizer训练集:这个数据集用于训练分词器(tokenizer),是文本处理中的一个重要步骤。它可以帮助模型更好地理解文本数据的结构。Pretrain数据:这是用于预训练模型的数据集,它可以帮助模型学习语言的基本结构和特征。SFT数据:SFT(SupervisedFine-Tuning)数据集,用于监督式微调,可以提高模型在特定任务上的性能。DPO数据1和DPO数据2:这两个数
亚伯拉罕·黄肯
·
2025-03-22 14:46
大模型
人工智能
LLMs之
minimind
:
minimind
源码解读(pretrain.py)——实现基于Transformer架构的大规模语言模型预训练及wandb监控—支持余弦退火学习率调度/分布式预训练/自动混
LLMs之
minimind
:
minimind
源码解读(pretrain.py)——实现基于Transformer架构的大规模语言模型预训练及wandb监控—支持余弦退火学习率调度/分布式预训练/自动混合精度优化
一个处女座的程序猿
·
2025-03-22 14:43
NLP/LLMs
CaseCode
transformer
minimind
预训练
上一页
1
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他