E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
acm初级训练
大模型推理框架:从理论到实践的全面解析
然而,深度学习模型的
训练
和推理过程往往涉及大量数据和复杂计算,传统的计算框架难以满足需求。因此,大模型推理框架应运而生,成为解决这一问题的关键。
百度_开发者中心
·
2025-03-22 19:23
人工智能
大模型
自然语言处理
回归任务
训练
--MNIST全连接神经网络(Mnist_NN)
importtorchimportnumpyasnpimportloggingfromtorch.utils.dataimportTensorDataset,DataLoaderfromtorch.utils.dataimportDataLoader#配置日志logging.basicConfig(level=logging.INFO,format='%(asctime)s-%(levelname
豆芽819
·
2025-03-22 18:10
深度学习框架PyTorch
pytorch
深度学习
人工智能
机器学习
回归
《南京日报》专题报道 | 耘瞳科技“工业之眼”加码“中国智造”
在江宁开发区,机器人已不再是科幻电影里的遥远想象,他们就像人类的“同事”,在工地上忙着贴砖、刷墙、搬运、检测;在体育
训练
场上帮助运动员矫正姿势;在医院里帮助医生发现帕金森早期征兆,在智慧工厂里与人类分工协作
耘瞳科技
·
2025-03-22 17:04
科技
大规异构集群 混合并行分布式
训练
系统,解决算力不均衡问题 HETHUB
视频教程在这:3.2大规模异构集群,混合并行分布式系统,解释算力不均衡问题HETHUB_哔哩哔哩_bilibili一、大规模异构集群出现的原因:同一种GPU数量有限难以构建大规模集群:
训练
大规模模型依赖于大量的计算资源
爱串门的小马驹
·
2025-03-22 16:29
万卡大规模集群大模型训练
异构集群
大规模集群
分布式
大模型训练
MiniMind:完全从 0
训练
自己的大模型
其目标是把上手LLM的门槛无限降低,直接从0开始
训练
一个极其轻量的语言模型,最低仅需2G显卡即可推理
训练
!
三花AI
·
2025-03-22 15:49
三花AI
人工智能
LLM大模型
MiniMind:3小时完全从0
训练
一个仅有26M的小参数GPT,最低仅需2G显卡即可推理
训练
!
MiniMind:3小时完全从0
训练
一个仅有26M的小参数GPT,最低仅需2G显卡即可推理
训练
!
哈罗·沃德
·
2025-03-22 15:19
LLM
gpt
minimind2学习:(1)
训练
1、数据下载参考:https://github.com/jingyaogong/minimind/tree/master2、预
训练
训练
6个epochspythontrain_pretrain.py--epochs6
溯源006
·
2025-03-22 14:47
minimind学习
学习
深度学习
生成模型
Stacking算法:集成学习的终极武器
1.Stacking算法原理探秘Stacking算法的核心思想是
训练
多个不同的基模型,并将它们的预测结果作为新模型的输入特征,以此来
civilpy
·
2025-03-22 14:16
算法
集成学习
机器学习
MiniMind
数据集分类:tokenizer
训练
集:这个数据集用于
训练
分词器(tokenizer),是文本处理中的一个重要步骤。它可以帮助模型更好地理解文本数据的结构。
亚伯拉罕·黄肯
·
2025-03-22 14:46
大模型
人工智能
直方图梯度提升:大数据时代的极速决策引擎
但当数据量突破百万级时,传统梯度提升树(GBDT)面临三大致命瓶颈:
训练
耗时剧增:每个特征的分割点计算都需要全量数据排序内存消耗爆炸:存储排序后的特征值需要额外空间处理效率低下:无法有效利用现代CPU的多核特性而梯度提升决策树
万事可爱^
·
2025-03-22 14:14
大数据
机器学习
深度学习
直方图梯度提升
GBDT
算法
【集成学习】:Stacking原理以及Python代码实现
总体来说,stacking集成算法主要是一种基于“标签”的学习,有以下的特点:用法:模型利用交叉验证,对
训练
集进行预测,从而实现二次学习优点:可以结合不同的模型缺点:增加了时间开销,容
Geeksongs
·
2025-03-22 14:14
机器学习
python
机器学习
深度学习
人工智能
算法
LLMs之minimind:minimind源码解读(pretrain.py)——实现基于Transformer架构的大规模语言模型预
训练
及wandb监控—支持余弦退火学习率调度/分布式预
训练
/自动混
LLMs之minimind:minimind源码解读(pretrain.py)——实现基于Transformer架构的大规模语言模型预
训练
及wandb监控—支持余弦退火学习率调度/分布式预
训练
/自动混合精度优化
一个处女座的程序猿
·
2025-03-22 14:43
NLP/LLMs
CaseCode
transformer
minimind
预训练
初级
:数组与字符串面试题深度剖析
一、引言在Java开发中,数组和字符串是最常用的数据结构之一。面试官通过相关问题考察候选人对数组和字符串的理解和运用能力,以及在实际开发中解决相关问题的经验。本文将深入剖析常见的数组与字符串面试题,结合实际开发场景,帮助读者全面掌握这些知识点。二、数组面试题:如何对数组进行初始化和遍历?答案:数组的初始化可以使用直接初始化、动态初始化等方式。遍历数组可以使用传统的for循环、增强型for循环(fo
佩奇的技术笔记
·
2025-03-22 14:42
Java面试小册
java
DeepSpeed-Chat:Reward Model【奖励模型】
但是,RM和SFT微调之间存在几个关键差异:
训练
数据差异:对于SFT微调,数据是查询(query)和答案(answer)拼接在一起。
u013250861
·
2025-03-22 13:31
#
LLM/训练
RL/强化学习
排序
强化学习
【人工智能】大模型的幻觉问题:DeepSeek 的解决策略与实践
本文深入探讨了幻觉问题的成因,包括
训练
数据的偏差、推理过程中的过度泛化以及缺乏外部验证机制。以DeepSeek系列模型为研究对象,我们分析了其在解
蒙娜丽宁
·
2025-03-22 13:29
Python杂谈
人工智能
人工智能
从零搭建Pytorch模型教程(七)单机多卡和多机多卡
训练
前言本文主要介绍单机多卡
训练
和多机多卡
训练
的实现方法和一些注意事项。其中单机多卡
训练
介绍两种实现方式,一种是DP方式,一种是DDP方式。
AI大模型探索者
·
2025-03-22 12:50
pytorch
人工智能
python
transformer
深度学习
ai
机器学习
PyTorch基础知识讲解(一)完整
训练
流程示例
文章目录Tutorial1.数据处理2.网络模型定义3.损失函数、模型优化、模型
训练
、模型评价4.模型保存、模型加载、模型推理Tutorial大多数机器学习工作流程涉及处理数据、创建模型、优化模型参数和保存
训练
好的模型
苏雨流丰
·
2025-03-22 12:20
机器学习
pytorch
人工智能
python
机器学习
深度学习
yolov8实战第七天——pyqt5-yolov8实现车牌识别系统(参考论文(约7000字)+环境配置+完整部署代码+代码使用说明+
训练
好的模型)
基于pyqt5-yolov8实现车牌识别系统,包括图片车牌识别,视频车牌识别,视频流车牌识别。效果展示(图片检测,检测到的内容添加到历史记录):效果展示(视频检测,视频车辆只会添加一条记录,下文更多实际应用中的优化策略):新增功能:批量图片检测(2024/5/7更新代码)
学术菜鸟小晨
·
2025-03-22 11:48
yolov8实战100天
python
YOLO
pyqt5
车牌识别
毕业设计
论文
TensorFlow和Pytorch在功能上的区别以及优势
优点是性能优化更高效,适合大规模分布式
训练
和生产环境部署。缺点是调试相对复杂,因为计算图的构建和运行是分离的。PyTorch:使用动态计算图(DynamicGraph)。
Honeysea_70
·
2025-03-22 10:09
#
算法
tensorflow
pytorch
人工智能
Pytorch使用手册-DCGAN 指南(专题十四)
我们将
训练
一个生成对抗网络(GAN),在给它展示大量真实名人照片后,它能够生成新的“名人”图片。
AI专题精讲
·
2025-03-22 08:43
Pytorch入门到精通
pytorch
人工智能
python
蓝桥杯动态规划实战:从数字三角形到砝码称重
适合人群:蓝桥杯备考生|算法竞赛入门者|DP学习实践者目录一、我的动态规划入门之路1.数字三角形:经典DP首战告捷2.砝码称重:背包问题的变形二、蓝桥杯高频算法考点三、蓝桥杯DP专项
训练
题四、备考建议一
藍海琴泉
·
2025-03-22 06:22
蓝桥杯
动态规划
职场和发展
【AI大模型应用开发】【RAG评估】0. 综述:一文了解RAG评估方法、工具与指标
微信公众号也可搜【同学小张】本站文章一览:前面我们学习了RAG的基本框架并进行了实践,我们也知道使用它的目的是为了改善大模型在一些方面的不足:如
训练
数据不全、无垂直领域数据、容易出现幻觉等。
同学小张
·
2025-03-22 05:43
大模型
人工智能
笔记
经验分享
gpt
agi
AIGC
【论文阅读】PERSONALIZE SEGMENT ANYTHING MODEL WITH ONE SHOT
PERSONALIZESEGMENTANYTHINGMODELWITHONESHOT原文摘要研究背景与问题:SAM是一个基于大规模数据预
训练
的强大提示框架,推动了分割领域的发展。
s1ckrain
·
2025-03-22 04:42
计算机视觉
论文阅读
计算机视觉
人工智能
DeepSeek-R1核心技术深度解密:动态专家网络与多维注意力融合的智能架构实现全解析
DeepSeek-R1智能架构核心技术揭秘:从动态路由到分布式
训练
的完整实现指南一、DeepSeek-R1架构设计原理1.1动态专家混合系统DeepSeek-R1采用改进型MoE(MixtureofExperts
Coderabo
·
2025-03-22 04:41
DeepSeek
R1模型企业级应用
架构
DeepSeek-R1
【入门
初级
篇】布局类组件的使用(4):模板布局组件
【入门
初级
篇】布局类组件的使用(4):模板布局组件视频要点(1)模板布局组件的使用介绍:定义静态数据源,定义模板,预览效果点击访问myBuilder产品运营平台CSDN站内资源下载myBuilder交流请加微信
#六脉神剑
·
2025-03-22 04:09
低代码
myBuilder
产品运营
【入门
初级
篇】报表基础操作与功能介绍
【入门
初级
篇】报表的基本操作与功能介绍视频要点(1)报表组件的创建(2)指标组件的使用:一级、二级指标操作演示(3)表格属性设置介绍(4)图表属性设置介绍(5)报表预览:绑定静态数据(6)介绍myBuilder
#六脉神剑
·
2025-03-22 04:09
低代码
myBuilder
产品运营
【入门
初级
篇】布局类组件的使用(3):单据详情布局
【入门
初级
篇】布局类组件的使用(3):单据详情布局视频要点(1)表单详情布局结束:行容器+表格增加布局边距(2)页签布局的使用点击访问myBuilder产品运营平台CSDN站内资源下载myBuilder
#六脉神剑
·
2025-03-22 04:39
低代码
产品运营
myBuilder
知汇云创myBuilder产品发布
【入门
初级
篇】产品介绍v2·前言Hello,大家好,今天给大家介绍一下myBuilder渐进式低代码IDE软件。
#六脉神剑
·
2025-03-22 04:39
低代码
【入门
初级
篇】窗体的基本操作与功能介绍
【入门
初级
篇】窗体的基本操作与功能介绍视频要点(1)窗体的使用场景介绍:模式对话框(2)窗体的创建与设计(3)窗体动态标题设置(4)向窗体添加组件以及相关操作介绍(5)窗体属性编辑介绍(6)窗体数据的使用
#六脉神剑
·
2025-03-22 04:38
低代码
代码随想录算法
训练
营第八天| 344 反转字符串、541 反转字符串II
这两天开的是字符串专题,我准备在做题的时候用C++做一遍,再用C做一遍,因为一直刷leetcode用的都是C++,导致C的基础太薄弱了,之后工作中有可能用到C,相当于再复习复习一、Leetcode344反转字符串题目链接:Leetcode344反转字符串这道题很简单,这才是真正的简单题voidreverseString(char*s,intsSize){intleft=0,right=sSize-
Anjoubecoding
·
2025-03-22 04:33
算法
数据结构
c++
c语言
leetcode
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析
随着深度学习技术的飞速发展,通过构建和
训练
神经网络模型,手写数字识别的精度已经可以达到99%以上。
快撑死的鱼
·
2025-03-22 02:45
Python算法精解
python
深度学习
开发语言
《今日AI-人工智能-编程日报》-源自2025年3月21日
最新发布的AI编程模型(如Claude3.7、Sonnet3.7)在
初级
开发评估中表现优异,得分率超过60%,部分模型甚至在全球程序员排名中位列前0.1%。
小亦编辑部
·
2025-03-21 22:16
人工智能
【AI 天才研究院】从 MoE 架构到 AGI:DeepSeek 将给未来带来哪些影响?
FP8低精度
训练
:DeepSeek采用了FP8
AI天才研究院
·
2025-03-21 22:40
DeepSeek
R1
&
大数据AI人工智能大模型
人工智能
架构
agi
DeepSeek
解析稳定率达99.99%!合合信息“大模型加速器2.0”助力AI打破“幻觉”
训练
数据是影响大模型“认知能力”的关键要素,近期,上海合合信息科技股份有限公司(简称“合合信息”)TextIn“大模型加速器2.0”版本正式上线,基于领先的智能文档处理技术,对复杂文档的版式、布局和元素进行精准解析及结构化处理
·
2025-03-21 21:56
算法大数据人工智能图表表格
适合阅读源码的 Java 优质开源框架、库盘点(
初级
友好项目、中级进阶项目、高级深入项目)
一、
初级
友好项目1、JUnit5基本介绍:JUnit5是单元测试框架,代码简洁,适合学习测试驱动开发(TDD)和设计模式GitHub地址:https://github.com/junit-team/junit5
我命由我12345
·
2025-03-21 21:02
Java
-
项目
java
开源
开发语言
java-ee
spring
boot
spring
intellij-idea
LoadRunner 11 性能测试全面教程
教程详细介绍LR11的组件功能、脚本开发、场景设置、测试执行、结果分析、性能指标监测、故障诊断以及自动化测试等,提供从
初级
到高级的完整学习路径。
金融先生-Frank
·
2025-03-21 19:19
【深度学习】DeepSeek模型介绍与部署
为了实现高效推理和成本效益的
训练
,DeepSeek-V3采用了多头潜在注意力(MLA)和DeepSeekMoE架构,这些架构在DeepSeek-V2中得到了充分验证。
Nerous_
·
2025-03-21 19:15
深度学习
深度学习
人工智能
【nnUnetv2】Code复现
相反的,把重心放在:预处理(resampling和normalization)、
训练
(loss,optimizer设置、数据增广)、推理(patch-based策略、test-time-augmentations
是Winky啊
·
2025-03-21 18:35
#
项目nnUnet
人工智能
深度学习
决策树算法及其python实例
每个内部节点表示在属性上的一个测试,每个分支代表一个测试输出,每个叶节点代表一种类别二、决策树的构造1、决策树的构造步骤输入:
训练
集D={(21,11),(z2,32),
m0_74831463
·
2025-03-21 17:57
算法
决策树
python
大模型在冠心病风险预测及临床方案制定中的应用研究
国内外研究现状1.3研究方法与创新点二、大模型预测冠心病风险原理与方法2.1数据收集与预处理2.1.1数据来源2.1.2数据清洗与整理2.2特征工程2.2.1特征提取2.2.2特征选择与优化2.3模型选择与
训练
LCG元
·
2025-03-21 17:27
围术期危险因子
预测模型研究
人工智能
机器学习
python
目标检测中归一化的目的?
这使得模型在
训练
和推理时能够处理任意尺寸的图像,而不需要关心图像的具体像素尺寸。2.位置和尺寸的相对性归一化后的坐标和尺寸是相对于图像尺寸的,而不是绝对像素值。这种相对性使得
林语微光
·
2025-03-21 14:37
kaggle
目标检测
目标跟踪
人工智能
关于神经网络中的正则化
神经网络
训练
中的正则化正则化(Regularization)是神经网络
训练
中的一个关键技术,主要用于防止模型过拟合(overfitting),提高泛化能力。1.为什么需要正则化?
文弱_书生
·
2025-03-21 14:07
乱七八糟
神经网络
人工智能
深度学习
一、大语言模型微调 vs. 大语言模型应用
一、大语言模型微调vs.大语言模型应用1.微调(Fine-Tuning)的含义与特点定义与作用微调指在预
训练
好(通用)的基础模型上,通过在特定领域或任务的数据集上进一步
训练
来调整模型参数,使其在该领域任务中获得更优表现
AI Echoes
·
2025-03-21 13:54
深度学习
人工智能
deepseek
机器学习
算法
ollama 基本使用教程
目录1.安装OllamamacOS或LinuxWindows(WSL2)2.基础命令启动与停止更新Ollama3.模型管理下载预
训练
模型运行模型查看已安装模型删除模型从Modelfile创建自定义模型4
海上彼尚
·
2025-03-21 12:17
AI
ai
前端
Hugging Face预
训练
GPT微调ChatGPT(微调入门!新手友好!)
HuggingFace预
训练
GPT微调ChatGPT(微调入门!新手友好!)在实战中,⼤多数情况下都不需要从0开始
训练
模型,⽽是使⽤“⼤⼚”或者其他研究者开源的已经
训练
好的⼤模型。
y江江江江
·
2025-03-21 10:31
机器学习
大模型
gpt
chatgpt
Open-Sora - 为所有人实现高效的视频制作大众化
Open-Sora更多AI开源软件:发现分享好用的AI工具、AI开源软件、AI模型、AI变现-小众AI这是一款开源的SOTA(State-of-the-Art)视频生成模型,仅用20万美元(224张GPU)就能
训练
出商业级
小众AI
·
2025-03-21 10:57
AI开源
音视频
人工智能
AI编程
机器学习课堂4线性回归模型+特征缩放
一、实验2-2,线性回归模型,计算模型在
训练
数据集和测试数据集上的均方根误差代码:#2-2线性回归模型importpandasaspdimportnumpyasnpimportmatplotlib.pyplotasplt
木尘152132
·
2025-03-21 09:17
机器学习
线性回归
python
风控算法(一)——数据测试
确定样本(对齐样本与时间,去除假样本)——确定特征(确认目前特征)——数据信息(返回的数据字典、收费方式、底层数据:特征、分数)——数据清洗(缺失值替换)——数据
训练
形成报告。
月亮月亮要去太阳
·
2025-03-21 09:15
机器学习
人工智能
2024年CSP-J认证 CCF信息学奥赛C++ 中小学
初级
组 第一轮真题-完善程序题解析
2024CCF认证第一轮(CSP-J)真题三、完善程序题第一题判断平方数问题:给定一个正整数n,判断这个数是不是完全平方数,即存在一个正整数x使得x的平方等于n试补全程序#include#includeusingnamespacestd;boolisSquare(intnum){inti=(1);intbound=(2);for(;i>n;if(isSquare(n)){cout<
小兔子编程
·
2025-03-21 08:12
NOI
CSP-J信息学奥赛
c++判断平方数
c++汉诺塔
2024CSP-J真题
2024CSP初级真题
2024CSP-J真题解析
中小学信奥真题
c++真题解析
Adam-mini:深度学习内存效率新突破
在
训练
十亿参数级别的大语言模型(LLM)时,Adam-mini实现了49.6%的吞吐量提升,并减少了33%的
XianxinMao
·
2025-03-21 08:42
人工智能
深度学习
人工智能
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他