E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
yolov3训练
Python打卡
训练
营day20-奇异值SVD分解
知识点回顾:线性代数概念回顾(可不掌握)奇异值推导(可不掌握)奇异值的应用特征降维:对高维数据减小计算量、可视化数据重构:比如重构信号、重构图像(可以实现有损压缩,k越小压缩率越高,但图像质量损失越大)降噪:通常噪声对应较小的奇异值。通过丢弃这些小奇异值并重构矩阵,可以达到一定程度的降噪效果。推荐系统:在协同过滤算法中,用户-物品评分矩阵通常是稀疏且高维的。SVD(或其变种如FunkSVD,SVD
sak77
·
2025-06-18 04:22
python打卡训练营
python
机器学习
奇异值分解
SVD
Qwen2.5:模型
训练
和推理核心参数介绍
二、TrainingArguments核心参数2.1基础
训练
设置参数介绍output_dir(
艾墨舟启航
·
2025-06-18 04:51
大模型实战
大模型
Trainer
参数介绍
剖析前沿技术领域的预
训练
模型架构
剖析前沿技术领域的预
训练
模型架构关键词:预
训练
模型架构、前沿技术、深度学习、自然语言处理、计算机视觉摘要:本文聚焦于前沿技术领域的预
训练
模型架构,旨在深入剖析其核心概念、算法原理、数学模型以及实际应用。
AI天才研究院
·
2025-06-18 04:50
AI大模型企业级应用开发实战
AI
Agent
应用开发
架构
ai
【论文解读】s3: 仅 2.4K 数据即可 RL
训练
Search Agent
tNeedThatMuchDatatoTrainaSearchAgentviaRLcode:pat-jj/s3:s3-EfficientYetEffectiveSearchAgentTrainingviaRLforRAG5.总结(结果先行)s3框架以其“解耦搜索与生成、仅
训练
搜索代理
·
2025-06-18 04:50
AI大模型的概念验证与落地
AI大模型,深度学习,Transformer,自然语言处理,计算机视觉,概念验证,落地应用,模型
训练
,模型部署1.背景介绍近年来,人工智能(AI)技术取得了飞速发展,其中,大模型作为AI领域的重要组成部分
AI智能应用
·
2025-06-18 04:19
AI大模型应用入门实战与进阶
java
python
javascript
kotlin
golang
架构
人工智能
深度学习 backbone,neck,head网络关键组成
neck(颈部),head(头部)是网络的关键组成部分,各自承担了不同的功能:1,总署:Backbone,译作骨干网络,主要指用于特征提取的,已在大型数据集(例如ImageNet|COCO等)上完成预
训练
SLAM必须dunk
·
2025-06-18 02:12
深度学习
人工智能
深度强化学习应用:基于Double DQN算法的移动机器人路径跟踪技术解析
尤其是在路径跟踪问题中,传统的控制算法往往依赖于模型和假设,而深度强化学习则能够通过大量的
训练
数据让机器人自主学习如何优化其行为策略,从而实现高效的路径跟踪。
威哥说编程
·
2025-06-18 02:40
算法
李宏毅机器学习——类神经网络
训练
不起来怎么办?
https://www.bilibili.com/video/BV1Wv411h7kN?spm_id_from=333.788.videopod.episodes&vd_source=779fe6f5ae2ab98c0dc9480ff4ae61a3&p=201.局部最小值(localminima)与鞍点(saddlepoint)criticalpoint:hessian矩阵:1.1判断点类型:1.
JustNow_Man
·
2025-06-18 02:39
机器学习
神经网络
人工智能
DeepSeek 源码解构:从 MoE 架构到 MLA 的工程化实现
而MLA作为一种多层次结构,在更大规模的数据集上展现出了出色的性能,尤其在模型
训练
和推理效率方面表
威哥说编程
·
2025-06-18 02:08
架构
人工智能
AI编程
生成对抗网络(GAN)与深度生成模型实战
1.生成模型基础与GAN原理1.1生成模型概览生成模型是深度学习中的重要分支,主要分为以下几类:变分自编码器(VAE):基于概率图模型的生成方法生成对抗网络(GAN):通过对抗
训练
学习数据分布自回归模型
软考和人工智能学堂
·
2025-06-17 23:21
人工智能
Python开发经验
#
DeepSeek快速入门
开发语言
深度学习框架与联邦学习:探究未来的AI发展趋势=======================摘要:本文将深入探讨深度学习框架与联邦学习的融合,分析其在现代AI领域的应用和发展趋势。我们将介绍深度学习框
一、深度学习框架:AI的基石深度学习框架是构建和
训练
深度学习模型的重要工具。它为开发者提供了便捷的工具和库,使得构建复杂的神经网络模型变得更加简单高效
·
2025-06-17 23:46
开源新王诞生!MiniMax-M1正式发布,超强上下文能力剑指DeepSeek!
一百万token上下文窗口,八倍于DeepSeekR1的处理长度,
训练
成本仅53万美元——沉寂已久的AI六小虎之一MiniMax用开源新模型重新定义了性价比。6月17日,中国AI领域再掀巨浪。
算家计算
·
2025-06-17 23:15
话题文章
人工智能
MiniMax
DeepSeek
开源
算家云
租算力
到算家云
入选 ICML 2025,清华/人大提出统一生物分子动力学模拟器 UniSim
该方法在大量3D分子结构数据上通过去噪+力场混合预
训练
获得统一的全原子表示模型,基于随机差值(stochasticinterpolant)生成式框架学习分子在长时间步长下的转移向量场(vectorfield
·
2025-06-17 20:51
hyperai
如何用PyTorch构建第一个神经网络?——从环境搭建到实战部署的零基础指南
这几年带学员入门深度学习时,发现90%的新手都会卡在「第一个神经网络构建」上:有人装环境时被CUDA版本搞晕,有人写模型时分不清nn.Module和nn.Sequential,还有人
训练
时遇到梯度不更新的问题
唐宇迪(学习规划+技术答疑)
·
2025-06-17 18:42
pytorch
神经网络
人工智能
深度学习
机器学习
计算机视觉
自然语言处理
「大模型学习」(10)LLM的量化(GPTQ、LLM.int8()、AWQ)不信你学不会!
1.权重和输入经过归一化,数值范围较小➤通常神经网络
训练
后会对输入和权重做标准
木楚子
·
2025-06-17 16:32
学习
SnapViewer:解决PyTorch官方内存工具卡死问题,实现高效可视化
在深度学习模型
训练
过程中,GPU内存不足(OutofMemory,OOM)错误是开发者频繁遇到的技术挑战。
·
2025-06-17 16:48
人工智能深度学习pytorch
【FineDance】
训练
:accelerate config 的作用
accelerate主要是配置分布式
训练
和硬件加速的设置。accelerateconfig的作用Accelerate是HuggingFace开发的库,用于简化多GPU、多机器的分布式
训练
。
等风来不如迎风去
·
2025-06-17 13:38
AI入门与实战
python
人工智能
动作
舞蹈
Moonlight-16B-A3B: 变革性的高效大语言模型,凭借Muon优化器打破
训练
效率极限
这款全新的Mixture-of-Experts(MoE)架构的大型语言模型,凭借其创新的
训练
优化技术,特别是Muon优化器的使用,成功突破了
训练
效率的极限,展现出强大的性能表现。
OpenCSG
·
2025-06-17 13:07
语言模型
人工智能
自然语言处理
社区
深度学习笔记
文章目录聚类导入模块生成模拟数据建立并
训练
K-Means聚类模型创建图形绘制散点图(聚类结果)获取聚类中心可视化聚类中心设置图形标题和标签输出效果数据降维一、常见的数据降维方法二、Python降维示例(
疯狂成瘾者
·
2025-06-17 10:54
深度学习
笔记
人工智能
(什么是)大模型的“越狱”(Model Jailbreaking)
核心概念安全机制的局限性:大模型在
训练
时会过滤掉大量有害数据,并通过“对齐
训练
”(如RLHF)学习人类价值观,拒绝
音程
·
2025-06-17 09:48
人工智能
机器学习
人工智能
机器学习
深度学习
基于AgentUniverse在金融场景中的多智能体应用探索【极客传媒】
先从语言模型说起,一个经过足够语料充分预
训练
的基模型(basem
汀、人工智能
·
2025-06-17 09:41
LLM工业级落地实践
AI
Agent
人工智能
Agent
多智能体
【Python打卡Day12】启发式算法 @浙大疏锦行
下面介绍这几种常见的优化算法遗传算法粒子群优化模拟退火##1.数据处理+划分
训练
和测试importpandasaspdimportpandasaspd#用于数据处理和分析,可处理表格数据。
可能是猫猫人
·
2025-06-17 09:40
Python打卡训练营内容
启发式算法
算法
大模型微调(Fine-tuning)概览
大模型微调(Fine-Tuning)是将预
训练
大模型(如GPT、LLaMA)适配到特定任务或领域的核心技术,其效率与效果直接影响大模型的落地价值。
MzKyle
·
2025-06-17 08:39
深度学习
人工智能
【0样本起手做多标签分类】3——大小模型螺旋上升
这套方案用了一系列奇技yin巧的trick调整现在的经典召回方案和经典模型方案,最终做到了高密度挖掘种子样本模型可分开
训练
,结构可插拔实际运行时准确率高,运行成本低前面两篇文章分别描述了在工业场景下:0
崔高杰
·
2025-06-17 08:07
LLM相关工程经验
数据挖掘
人工智能
分类
深度学习
语言模型
代码随想录-算法
训练
营day33(贪心算法03:K次取反后最大化的数组和,加油站,分发糖果)
第八章贪心算法part03●1005.K次取反后最大化的数组和●134.加油站●135.分发糖果详细布置1005.K次取反后最大化的数组和本题简单一些,估计大家不用想着贪心,用自己直觉也会有思路。https://programmercarl.com/1005.K%E6%AC%A1%E5%8F%96%E5%8F%8D%E5%90%8E%E6%9C%80%E5%A4%A7%E5%8C%96%E7%9A
java菜鸡加油
·
2025-06-17 08:07
算法训练营
算法
贪心算法
leetcode
java
力扣
ResNet结合LSTM王炸创新!最新SOTA方案预测准确率超91%
比如一种用来预测癫痫发作的预
训练
模型的方法,该方法结合了监督对比
深度之眼
·
2025-06-17 08:06
深度学习干货
人工智能干货
人工智能
LSTM
ResNet
深度学习
代码随想录
训练
营Day33:完全背包问题2
1.322零钱兑换与昨天的零钱兑换问题的区别主要不同点在于dp数组的含义,相同点都是属于组合问题。1.dp数组的含义:dp[j]:代表容量为j时候的最少零钱个数2.递推公式:dp[j]=min(dp[j],dp[j-coins[i]]+1);dp[j-coins[i]]+1=dp[j-weight[i]]+value[i],所以还是属于一个变式。因为题目要求的是最小个数,所以得取min函数。3.初
mooc666quq
·
2025-06-17 08:04
代码随想录训练营打卡
算法
leetcode
C++
学习
动态规划
Hugging Face、魔塔社区(MOTA)与OpenRouter:AI模型平台深度对比与实战指南
引言随着人工智能技术的飞速发展,大型语言模型(LLM)和各种预
训练
模型在各个领域的应用日益广泛。为了方便开发者和研究人员使用这些模型,涌现了许多优秀的AI模型平台。
何双新
·
2025-06-17 02:21
大模型应用开发
工具库介绍
人工智能
实现AI数据高效评估的一种方法
本文提出了一种新的机器学习模型
训练
数据影响分析框架,称为DistilledDatamodel(DDM)。该框架通过两个阶段实现高效的数据影响评估:离线
训练
和在线评价。
mao_feng
·
2025-06-17 00:08
人工智能
如何稳定地更新你的大模型知识(算法篇)
目录在线强化学习的稳定知识获取机制:算法优化与数据策略一、算法层面的稳定性控制机制二、数据处理策略的稳定性保障三、
训练
过程中的渐进式优化策略四、环境设计与反馈机制的稳定性影响五、稳定性保障的综合应用策略六
mao_feng
·
2025-06-16 23:36
算法
强化学习
大模型
知识
python pytorch 实战篇:a+b数字模型
目录前言构思定义模型定义数据集
训练
优化(选看)运行完成最终代码(含优化)define.pytrain.pyrun.pyadder.pth前言看之前必须得去看我的理论篇,不然跟不上:pythonpytorch
·
2025-06-16 23:02
《阿里新神器MaskSearch问世:为何我们需要打破传统搜索代理
训练
的枷锁?》
阿里巴巴最近开源的MaskSearch技术,正在悄然改变着搜索代理(SearchAgent)
训练
的游戏规则。
来自于狂人
·
2025-06-16 22:00
语言模型
人工智能
python
垂直领域大模型必须备案吗?90%企业都搞错的大模型备案真相!
最近收到一位朋友的紧急咨询:他们团队研发了一款面向珠宝设计师的垂直领域大模型,主打“文生图、图生图”的深度合成能力,模型架构基于第三方开源框架二次开发
训练
而成。
武昌库里写JAVA
·
2025-06-16 22:25
面试题汇总与解析
spring
boot
vue.js
宠物管理
课程设计
java
从混沌到宝藏:数据治理、清洗与资产化的炼金术
2021年,某国际车企因客户数据未脱敏泄露被GDPR重罚8.7亿欧元;2023年,医疗AI模型因
训练
数据偏见导致误诊率激增50%——这些触目惊心的案例印证了未经治理的数据不是资产,而是负债。本文将深入
鼓掌MVP
·
2025-06-16 20:42
人工智能
python打卡day39
图像数据与显存图像数据的格式:灰度和彩色数据模型的定义显存占用的4种地方模型参数+梯度参数优化器参数数据批量所占显存神经元输出中间状态batchisize和
训练
的关系一、图像数据的介绍minist这个经典的手写数据集
ZHPEN1
·
2025-06-16 17:27
Python打卡
人工智能
python打卡day40
知识点回顾:彩色和灰度图片测试和
训练
的规范写法:封装在函数中展平操作:除第一个维度batchsize外全部展平dropout操作:
训练
阶段随机丢弃神经元,测试阶段eval模式关闭dropout导入包#先继续之前的代码
ZHPEN1
·
2025-06-16 17:27
Python打卡
python
python打卡day41
该策略通常不改变单次
训练
的样本总数,而是通过对现有图像进行多样化变换,使每次
训练
输入的样本呈现更丰富的形态差异,从而有效扩展模型
训练
的样本空间多样性。常见的修改策
ZHPEN1
·
2025-06-16 17:54
Python打卡
python
深度学习
计算机视觉
可持续AI的基石:液冷数据中心的关键技术解析与能效优化实践
一、AI算力爆发下的能效危机随着千亿级参数大模型
训练
成为常态,单机柜功率密度从10kW猛增至50kW+(NVIDIADGXH100系统达70kW)。
梦玄海
·
2025-06-16 16:51
人工智能
量子计算
神经网络
自动化
重构
(ML-Agents) 是一个开源项目,它使游戏和模拟能够作为使用深度强化学习和模仿学习
训练
智能代理的环境
一、软件介绍文末提供程序和源码下载(ML-Agents)是一个开源项目,使游戏和模拟能够用作
训练
智能代理的环境。
struggle2025
·
2025-06-16 16:47
游戏
学习
使用ModelScopeEmbeddings进行文本嵌入
技术背景介绍ModelScope提供了各种预
训练
模型和嵌入技术来帮助开发者轻松实现复杂的NLP任务。嵌入
yunwu12777
·
2025-06-16 16:46
langchain
服务器
数据库
oracle
深度学习聊天机器人 需要考虑
要让深度学习聊天机器人表现更优,需从多维度综合优化,以下从数据、模型架构、
训练
策略、评估及工程落地等方面展开分析:一、数据层面:质量与多样性是核心1.数据规模与多样性多场景覆盖:覆盖日常对话、专业领域(
MYH516
·
2025-06-16 15:14
深度学习
机器人
人工智能
大模型10个核心概念,一文讲透(产品经理也能轻松看懂)
1.大模型(FoundationModel)大模型,是一种具备通用能力、可跨任务泛化的AI模型,通常由海量数据+超大算力+千万亿参数
训练
而成。
deepseek大模型
·
2025-06-16 15:13
产品经理
大模型
人工智能
深度学习
机器学习
大数据
大模型学习
PyTorch项目打包部署:从模型
训练
到生产环境的全链路解析
它不仅提供了灵活且强大的API用于模型
训练
,还支持多种优化工具以提高性能。
cda2024
·
2025-06-16 15:43
pytorch
人工智能
python
【AI大模型】15、从GPT-1到GPT-3:大语言模型核心技术演进与能力涌现全解析
一、GPT-1:预
训练
微调范式的奠基者(2018)(一)架构创新:单向Transformer解码器的诞生GPT-1首次将Transformer架构应用于语言模型领域,其核心采用12层Transformer
·
2025-06-16 14:04
OpenAI的AI模型o3在测试中自动修改关闭代码的原因
1.
训练
奖励机制的偏差研究者推测,o3在
训练
过程中可能被过度强化了“任务完成度”作为核心奖励指标。这种设计使得模型将“解决问题”视为最高优先级,甚至凌驾于服从人类指令之上。
大囚长
·
2025-06-16 14:33
大模型
机器学习
人工智能
Sklearn 机器学习 缺失值处理 过滤掉缺失值的行并统计
如果不及时处理,缺失值可能会影响模型的
训练
和预测精度。本文将详细介绍如何使用
Thomas Kant
·
2025-06-16 14:33
人工智能
机器学习
sklearn
人工智能
解密prompt系列52. 闲聊大模型还有什么值得探索的领域
但其实当前的大模型技术只是跨进了应用阶段,可以探索的领域还有不少,所以这一章咱不聊论文了,偶尔不脚踏实地,单纯仰望天空,聊聊还有什么有趣值得探索的领域,哈哈有可能单纯是最近科幻小说看太多的产物~尚未攻克的持续学习当前的大模型
训练
还是阶段式的
·
2025-06-16 14:22
程序员
【AI大模型】14、Transformer架构深度解析:从并行计算到千亿参数模型的扩展密码
并行化架构的革命性突破(一)序列计算的历史性突破在Transformer诞生之前,RNN/LSTM等序列模型受困于串行计算的天然缺陷:时间复杂度瓶颈:处理长度为N的序列需O(N)时间,且无法并行,导致
训练
速度随序列长度呈线性下降
无心水
·
2025-06-16 14:32
AI大模型
人工智能
transformer
架构
AI大模型
Transformer模型扩展
特征工程
自动化特征工程
YOLOv3
正负样本划分详解
✅
YOLOv3
正负样本划分详解一、前言在目标检测任务中,正负样本的划分是
训练
过程中的关键环节。它决定了哪些预测框参与位置回归、分类损失和置信度损失。
要努力啊啊啊
·
2025-06-16 12:54
计算机视觉
YOLO
目标检测
深度学习
计算机视觉
目标跟踪
硬核算力时代:裸金属服务器如何重塑企业级云基建?
虚拟化技术带来的资源争用、性能损耗和安全边界模糊,正成为高并发、AI
训练
等核心业务的"隐形天花板"。
小艺E
·
2025-06-16 12:19
服务器
运维
上一页
17
18
19
20
21
22
23
24
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他