E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
多GPU并行训练
MiniMind:完全从 0
训练
自己的大模型
其目标是把上手LLM的门槛无限降低,直接从0开始
训练
一个极其轻量的语言模型,最低仅需2G显卡即可推理
训练
!
三花AI
·
2025-03-22 15:49
三花AI
人工智能
LLM大模型
MiniMind:3小时完全从0
训练
一个仅有26M的小参数GPT,最低仅需2G显卡即可推理
训练
!
MiniMind:3小时完全从0
训练
一个仅有26M的小参数GPT,最低仅需2G显卡即可推理
训练
!
哈罗·沃德
·
2025-03-22 15:19
LLM
gpt
minimind2学习:(1)
训练
1、数据下载参考:https://github.com/jingyaogong/minimind/tree/master2、预
训练
训练
6个epochspythontrain_pretrain.py--epochs6
溯源006
·
2025-03-22 14:47
minimind学习
学习
深度学习
生成模型
Stacking算法:集成学习的终极武器
1.Stacking算法原理探秘Stacking算法的核心思想是
训练
多个不同的基模型,并将它们的预测结果作为新模型的输入特征,以此来
civilpy
·
2025-03-22 14:16
算法
集成学习
机器学习
MiniMind
数据集分类:tokenizer
训练
集:这个数据集用于
训练
分词器(tokenizer),是文本处理中的一个重要步骤。它可以帮助模型更好地理解文本数据的结构。
亚伯拉罕·黄肯
·
2025-03-22 14:46
大模型
人工智能
直方图梯度提升:大数据时代的极速决策引擎
但当数据量突破百万级时,传统梯度提升树(GBDT)面临三大致命瓶颈:
训练
耗时剧增:每个特征的分割点计算都需要全量数据排序内存消耗爆炸:存储排序后的特征值需要额外空间处理效率低下:无法有效利用现代CPU的多核特性而梯度提升决策树
万事可爱^
·
2025-03-22 14:14
大数据
机器学习
深度学习
直方图梯度提升
GBDT
算法
【集成学习】:Stacking原理以及Python代码实现
总体来说,stacking集成算法主要是一种基于“标签”的学习,有以下的特点:用法:模型利用交叉验证,对
训练
集进行预测,从而实现二次学习优点:可以结合不同的模型缺点:增加了时间开销,容
Geeksongs
·
2025-03-22 14:14
机器学习
python
机器学习
深度学习
人工智能
算法
LLMs之minimind:minimind源码解读(pretrain.py)——实现基于Transformer架构的大规模语言模型预
训练
及wandb监控—支持余弦退火学习率调度/分布式预
训练
/自动混
LLMs之minimind:minimind源码解读(pretrain.py)——实现基于Transformer架构的大规模语言模型预
训练
及wandb监控—支持余弦退火学习率调度/分布式预
训练
/自动混合精度优化
一个处女座的程序猿
·
2025-03-22 14:43
NLP/LLMs
CaseCode
transformer
minimind
预训练
DeepSpeed-Chat:Reward Model【奖励模型】
但是,RM和SFT微调之间存在几个关键差异:
训练
数据差异:对于SFT微调,数据是查询(query)和答案(answer)拼接在一起。
u013250861
·
2025-03-22 13:31
#
LLM/训练
RL/强化学习
排序
强化学习
【人工智能】大模型的幻觉问题:DeepSeek 的解决策略与实践
本文深入探讨了幻觉问题的成因,包括
训练
数据的偏差、推理过程中的过度泛化以及缺乏外部验证机制。以DeepSeek系列模型为研究对象,我们分析了其在解
蒙娜丽宁
·
2025-03-22 13:29
Python杂谈
人工智能
人工智能
【软件架构系列:一文读懂数据流体系结构风格】
二、数据流体系结构风格的类型(一)批处理风格(二)连续数据流风格三、数据流体系结构风格的特点(一)数据驱动一切(二)模块化与可复用性强(三)易于
并行
处理四、数据流体系结构风格的优势(一)维护轻松(二)扩展容易
youngerwang
·
2025-03-22 12:52
学习笔记
软件系统架构
系统架构
架构风格
数据流体系结构风格
从零搭建Pytorch模型教程(七)单机
多
卡和
多
机
多
卡
训练
前言本文主要介绍单机
多
卡
训练
和
多
机
多
卡
训练
的实现方法和一些注意事项。其中单机
多
卡
训练
介绍两种实现方式,一种是DP方式,一种是DDP方式。
AI大模型探索者
·
2025-03-22 12:50
pytorch
人工智能
python
transformer
深度学习
ai
机器学习
PyTorch基础知识讲解(一)完整
训练
流程示例
文章目录Tutorial1.数据处理2.网络模型定义3.损失函数、模型优化、模型
训练
、模型评价4.模型保存、模型加载、模型推理Tutorial大多数机器学习工作流程涉及处理数据、创建模型、优化模型参数和保存
训练
好的模型
苏雨流丰
·
2025-03-22 12:20
机器学习
pytorch
人工智能
python
机器学习
深度学习
Python连接StarRocks全流程实践: SQL文件调用与Pandas混合优化
文章目录一环境准备与连接方法1.安装核心依赖库2.连接字符串配置3.
多
模式连接验证二SQL文件调用与动态执行1.外部SQL文件结构设计2.Python动态加载执行三Pandas混合使用技巧1.查询结果直接转
ToreanonyTang
·
2025-03-22 12:19
python
sql
pandas
数据库
开发语言
GPU
计算的历史与CUDA编程入门
GPU
计算的历史与CUDA编程入门背景简介
GPU
计算的历史可以追溯到早期的
并行
计算研究,如今已发展成为计算机科学中的一个重要分支。
己见明
·
2025-03-22 12:49
GPU计算
CUDA
C
数据并行性
CUDA程序结构
向量加法内核
yolov8实战第七天——pyqt5-yolov8实现车牌识别系统(参考论文(约7000字)+环境配置+完整部署代码+代码使用说明+
训练
好的模型)
基于pyqt5-yolov8实现车牌识别系统,包括图片车牌识别,视频车牌识别,视频流车牌识别。效果展示(图片检测,检测到的内容添加到历史记录):效果展示(视频检测,视频车辆只会添加一条记录,下文更多实际应用中的优化策略):新增功能:批量图片检测(2024/5/7更新代码)
学术菜鸟小晨
·
2025-03-22 11:48
yolov8实战100天
python
YOLO
pyqt5
车牌识别
毕业设计
论文
kafka 的 message 包括哪些信息
当magic的值为1的时候,会在magic和crc32之间
多
一个字节的数据:attributes(保存一些相关属性,比如是否压缩、压缩格式等等);如果magic的值为0,那么不存在attributes
weixin-80213251
·
2025-03-22 11:47
javaweb
java
kafka
hadoop
GTC 2025 中文在线解读
作为
GPU
计算领域的基石,CUDA通过其编程语言、编译器、运行时环境及核心库
扫地的小何尚
·
2025-03-22 11:17
人工智能
NVIDIA
GPU
深度学习
机器学习
TensorFlow和Pytorch在功能上的区别以及优势
优点是性能优化更高效,适合大规模分布式
训练
和生产环境部署。缺点是调试相对复杂,因为计算图的构建和运行是分离的。PyTorch:使用动态计算图(DynamicGraph)。
Honeysea_70
·
2025-03-22 10:09
#
算法
tensorflow
pytorch
人工智能
无人机4G双链路技术分析!
2.
多
模通信模块与协议支持集成双SIM卡或eSIM,兼容多运营商网络,支持
多
频段(如LTE-FDD/TDD)。需适配通信协议(如TCP/IP优化、QoS保障),确保数据完整性。3.数据分流与聚合数据分
云卓SKYDROID
·
2025-03-22 10:08
无人机
云卓科技
科普
遥控器
高科技
链路
【北上广深杭大厂AI算法面试题】计算机视觉篇...如何解决
多
尺度问题?
【北上广深杭大厂AI算法面试题】计算机视觉篇…如何解决
多
尺度问题?【北上广深杭大厂AI算法面试题】计算机视觉篇…如何解决
多
尺度问题?
努力毕业的小土博^_^
·
2025-03-22 10:07
AI算法题库
人工智能
算法
计算机视觉
深度学习
神经网络
稳定运行的以Microsoft Azure SQL database数据库为数据源和目标的ETL性能变差时提高性能方法和步骤
提高以MicrosoftAzureSQLDatabase为数据源和目标的ETL性能需要综合考虑数据库查询优化、数据加载策略、
并行
处理、资源管理等方面。通过合适的索引、查询优化、批量处理、增量加
weixin_30777913
·
2025-03-22 09:56
etl
azure
etl
云计算
数据库
golang是如何回收goroutine的
然而,一个程序如果产生许多这样生命周期很短的goroutine,那将会花费相当
多
的时间来创建和销毁它们。2.生命周
double12gzh
·
2025-03-22 09:54
golang
golang
压差/风量机电一体化系统-空气流向管理系统-SKLX 空气流向控制器-实现空气流向自动化控制和精细化管理
空气流向管理系统配置产品SKGL空气流向管理主机SKLX空气流向控制器SKFL风量/风压探测器SKJG压差探测器SKYC/T微压差探测器SKYC/K联动控制器SKGD手动控制器SKFQ电动执行器电动压差动态调节阀电动
多
工况定风量阀
2408_89743128
·
2025-03-22 09:53
空气流向管控系统
网络
人工智能
性能优化
运维
科技
能源
AI工具如何改变编程学习?Trae IDE与Claude 3.5的实践案例
今天,咱们就来好好聊聊AI工具,特别是TraeIDE和Claude3.5这两个工具,在学习FastAPI和构建知识图谱的时候有
多
厉害,还有它们对编程行业会有什么影响。
黑金IT
·
2025-03-22 08:45
AI智能
AI编程
fasttify
人工智能
学习
ide
Pytorch使用手册-DCGAN 指南(专题十四)
我们将
训练
一个生成对抗网络(GAN),在给它展示大量真实名人照片后,它能够生成新的“名人”图片。
AI专题精讲
·
2025-03-22 08:43
Pytorch入门到精通
pytorch
人工智能
python
Python实战:开发经典猜拳游戏(石头剪刀布)
基础知识点与代码实现1.游戏逻辑与流程2.代码分步实现2.1导入必要模块2.2定义游戏规则函数2.3生成计算机选择2.4判断胜负逻辑2.5主循环与交互3.代码运行效果示例第二部分:功能扩展与优化1.添加计分系统2.支持
多
轮游戏与退出选择
藍海琴泉
·
2025-03-22 06:23
游戏
蓝桥杯动态规划实战:从数字三角形到砝码称重
适合人群:蓝桥杯备考生|算法竞赛入门者|DP学习实践者目录一、我的动态规划入门之路1.数字三角形:经典DP首战告捷2.砝码称重:背包问题的变形二、蓝桥杯高频算法考点三、蓝桥杯DP专项
训练
题四、备考建议一
藍海琴泉
·
2025-03-22 06:22
蓝桥杯
动态规划
职场和发展
策略模式详解:实现灵活多样的支付方式
多
支付方式的实现:策略模式详解策略模式(StrategyPattern)是一种行为设计模式,它定义了一系列算法,并将每个算法封装起来,使它们可以互换使用。策略模式使得算法可以独立于使用它的客户端变化。
Dong雨
·
2025-03-22 05:50
策略模式
java
原创LabVIEW与台达EtherCAT运动控制卡完整测试程序代码
可实现单轴、
多
轴运动控制。
LabVIEW热爱者
·
2025-03-22 05:50
labview
【AI大模型应用开发】【RAG评估】0. 综述:一文了解RAG评估方法、工具与指标
微信公众号也可搜【同学小张】本站文章一览:前面我们学习了RAG的基本框架并进行了实践,我们也知道使用它的目的是为了改善大模型在一些方面的不足:如
训练
数据不全、无垂直领域数据、容易出现幻觉等。
同学小张
·
2025-03-22 05:43
大模型
人工智能
笔记
经验分享
gpt
agi
AIGC
【论文阅读】PERSONALIZE SEGMENT ANYTHING MODEL WITH ONE SHOT
PERSONALIZESEGMENTANYTHINGMODELWITHONESHOT原文摘要研究背景与问题:SAM是一个基于大规模数据预
训练
的强大提示框架,推动了分割领域的发展。
s1ckrain
·
2025-03-22 04:42
计算机视觉
论文阅读
计算机视觉
人工智能
DeepSeek-R1核心技术深度解密:动态专家网络与多维注意力融合的智能架构实现全解析
DeepSeek-R1智能架构核心技术揭秘:从动态路由到分布式
训练
的完整实现指南一、DeepSeek-R1架构设计原理1.1动态专家混合系统DeepSeek-R1采用改进型MoE(MixtureofExperts
Coderabo
·
2025-03-22 04:41
DeepSeek
R1模型企业级应用
架构
DeepSeek-R1
代码随想录算法
训练
营第八天| 344 反转字符串、541 反转字符串II
这两天开的是字符串专题,我准备在做题的时候用C++做一遍,再用C做一遍,因为一直刷leetcode用的都是C++,导致C的基础太薄弱了,之后工作中有可能用到C,相当于再复习复习一、Leetcode344反转字符串题目链接:Leetcode344反转字符串这道题很简单,这才是真正的简单题voidreverseString(char*s,intsSize){intleft=0,right=sSize-
Anjoubecoding
·
2025-03-22 04:33
算法
数据结构
c++
c语言
leetcode
百某田网任务脚本
多
账号支持:支持多个账号的登录和管理,账号信息通过baitianGameCookie变量传入,可以通过@或换行符分隔多个账号。积分兑换:根据配置的兑换ID进行积分兑换操作,支持选
点云-激光雷达-Slam-三维牙齿
·
2025-03-22 04:03
其他
智能手机
运维
自动化
SATA(Serial Advanced Technology Attachment)详解
一、SATA的定义与核心特性SATA(串行高级技术附件)是一种用于连接存储设备(如硬盘、固态硬盘、光驱)的高速串行接口标准,取代了早期的PATA(
并行
ATA)。
美好的事情总会发生
·
2025-03-22 03:26
高速接口
嵌入式硬件
硬件工程
智能硬件
table合
并行
{{scope.row.gdLength/10}}importtype{TableColumnCtx}from'element-plus';consttableData=[{"id":6140,"projectId":1306,"projectName":"","sectionId":12985,"sectionName":"YYZQ-9标","tunnelId":96160,"tunnelNam
花归去
·
2025-03-22 03:23
vue3
element
vue.js
javascript
elementui
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析
随着深度学习技术的飞速发展,通过构建和
训练
神经网络模型,手写数字识别的精度已经可以达到99%以上。
快撑死的鱼
·
2025-03-22 02:45
Python算法精解
python
深度学习
开发语言
本地锁 vs 分布式锁详解
synchronizedJVM内置,修饰方法或代码块,重量级锁,自动释放ReentrantLockJUC提供,支持可重入、可中断、公平锁、Condition等StampedLock支持读写锁和乐观读,适合读
多
写少场景
重生之我在成电转码
·
2025-03-21 23:56
java
系统
锁
分布式锁
模拟退火算法:原理、应用与优化策略
本文详细阐述模拟退火算法的原理,深入分析其核心要素,通过案例展示在函数优化、旅行商问题中的应用,并探讨算法的优化策略与拓展方向,为解决复杂优化问题提供全面的理论与实践指导,助力该算法在
多
领域的高效应用与创新发展
尹清雅
·
2025-03-21 22:46
算法
Sqoop安装部署
并行
化处理基于MapReduce实现
并行
导入导出,提升大数据量场景的效率。自
愿与狸花过一生
·
2025-03-21 22:10
大数据
sqoop
hadoop
hive
【AI 天才研究院】从 MoE 架构到 AGI:DeepSeek 将给未来带来哪些影响?
FP8低精度
训练
:DeepSeek采用了FP8
AI天才研究院
·
2025-03-21 22:40
DeepSeek
R1
&
大数据AI人工智能大模型
人工智能
架构
agi
DeepSeek
知识蒸馏:让大模型“瘦身“而不失智慧的魔术
GPT-4的1750亿参数需要价值500万美元的
GPU
集群运行,但现实中的智能设备可能只有指甲盖大小。
一休哥助手
·
2025-03-21 21:06
人工智能
人工智能
解析稳定率达99.99%!合合信息“大模型加速器2.0”助力AI打破“幻觉”
训练
数据是影响大模型“认知能力”的关键要素,近期,上海合合信息科技股份有限公司(简称“合合信息”)TextIn“大模型加速器2.0”版本正式上线,基于领先的智能文档处理技术,对复杂文档的版式、布局和元素进行精准解析及结构化处理
·
2025-03-21 21:56
算法大数据人工智能图表表格
MySQL 进阶学习文档
不同引擎独立管理数据存储,可动态选择1.2主流引擎对比特性InnoDB(默认)MyISAMMemory事务支持✅支持❌不支持❌不支持锁粒度行锁表锁表锁外键支持✅支持❌不支持❌不支持存储位置磁盘磁盘内存适用场景高并发事务读
多
写少临时数据缓存选择建议
你曾经是少年
·
2025-03-21 19:49
数据库
LoadRunner 11 性能测试全面教程
本文还有配套的精品资源,点击获取简介:LoadRunner11(LR11)是HP开发的一款企业级性能测试工具,支持
多
应用程序类型的负载测试,用于性能评估、瓶颈识别和系统优化。
金融先生-Frank
·
2025-03-21 19:19
【深度学习】DeepSeek模型介绍与部署
为了实现高效推理和成本效益的
训练
,DeepSeek-V3采用了多头潜在注意力(MLA)和DeepSeekMoE架构,这些架构在DeepSeek-V2中得到了充分验证。
Nerous_
·
2025-03-21 19:15
深度学习
深度学习
人工智能
VRRP协议介绍及一些常见问题
VirtualRouter)角色划分VRRP组(VRRPGroup)3.VRRP工作机制设备状态主路由器选举特殊情况:VRRP出现优先级0和255故障切换4.VRRP特性抢占模式(Preemption)
多
网关负载分担
cocologin
·
2025-03-21 18:43
网络技术原理
智能路由器
网络
网络协议
运维
路由交换技术——
多
私网下NAPT、FTP服务公网映射配置的实验
网络地址转换(NAT)技术概述1.定义与背景网络地址转换(NetworkAddressTranslation,NAT)是一种在IP数据包传输过程中修改源或目标IP地址及端口的技术,主要用于解决IPv4地址短缺问题。随着互联网设备激增,NAT通过允许多个设备共享单一公网IP地址,显著延缓了IPv4地址耗尽的速度。2.工作原理NAT的核心是通过中间设备(如路由器、防火墙)建立内网私有地址与外网公有地址
「J1e」
·
2025-03-21 18:41
网络
网络协议
tcp/ip
【nnUnetv2】Code复现
相反的,把重心放在:预处理(resampling和normalization)、
训练
(loss,optimizer设置、数据增广)、推理(patch-based策略、test-time-augmentations
是Winky啊
·
2025-03-21 18:35
#
项目nnUnet
人工智能
深度学习
上一页
3
4
5
6
7
8
9
10
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他