E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
NLP预训练
【论文阅读】DynamicControl :一种新的controlnet多条件控制方法
本文方法从一个双循环控制器开始,它通过利用预先
训练
的条件生成模型和判别模型为所有输入条件生
prinTao
·
2025-06-18 19:33
pytorch
Diffusion
论文阅读
Bottle:一个轻量的python web 框架
由于
训练
的模型要提供http服务,目前python的web框架有Flask、Jdango用的比较多,但是相对较重。
·
2025-06-18 15:36
python简单的预测模型_python简单预测模型
python简单预测模型步骤1:导入所需的库,读取测试和
训练
数据集。
HOWARD ZHOU
·
2025-06-18 14:55
python简单的预测模型
【深度学习-Day 23】框架实战:模型
训练
与评估核心环节详解 (MNIST实战)
Langchain系列文章目录01-玩转LangChain:从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块:四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain:从核心链条构建到动态任务分配的实战指南04-玩转LangChain:从文档加载到高效问答系统构建的全程实战05-玩转LangChain:深度评估问答系统的三种高效方法(示例生成、手
吴师兄大模型
·
2025-06-18 13:23
深度学习入门到精通
深度学习
人工智能
python
MNIST
大模型
pytorch
LLM
训练
成本降低2000倍: 直接将推理能力注入LLM
https://arxiv.org/pdf/2506.09967代码地址https://github.com/shangshang-wang/Resa作者背景南加州大学动机激发大模型的推理能力通常需要繁重的后
训练
工作
大模型最新论文
·
2025-06-18 13:20
深度学习
人工智能
语言模型
自然语言处理
llama
AI大模型从0到1记录学习 大模型技术之机器学习 day27-day60
通过输入海量
训练
数据对模型进行
训练
,使模型掌握数据所蕴含的潜在规律,进而对新输入的数据进行准确的分类或预测。机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸优化、算法复杂度理论等多门学科。
Gsen2819
·
2025-06-18 13:19
算法
大模型
人工智能
人工智能
学习
机器学习
Follow My Instruction and Spill the Beans: Scalable Data Extraction from Retrieval-Augmented Generat
iclr20255688检索增强生成(Retrieval-AugmentedGeneration,RAG)通过在测试阶段引入外部知识,提升了
预
训练
模型的能力,实现了定制化适应。
UQI-LIUWJ
·
2025-06-18 11:10
论文笔记
论文阅读
自然语言处理分类
NLP
学习
Nlp
基本分类
NLP
领域的任务分为两个类别:第一类是人工智能
NLP
。包括词性标注,分词,语法解析,语言模型,信息检索,信息抽取,语义表示,文本分类。
要奋斗呀
·
2025-06-18 10:58
自然语言处理
JAX革命性优势解剖:GPU/TPU自动并行计算实战
近年来,大模型
训练
与科学计算对算力的需求呈现指数级增长。传统框架面临硬件绑定深、并行编码复杂、跨平台迁移成本高三大痛点。
AI咸鱼保护协会
·
2025-06-18 10:58
分布式
算法
人工智能
gpu算力
计算机
绿色AI实践指南:通过算力优化降低千亿模型
训练
碳排放——动态电压频率调整(DVFS)+ 余热回收系统设计
一、AI算力的碳排危机与绿色突围当前千亿参数大模型
训练
的单次碳排放已超284吨CO₂(相当于5辆燃油车终身排放量),且随着模型规模指数级增长,2030年AI产业碳排放占比或达全球总量的3.5%。
AI咸鱼保护协会
·
2025-06-18 10:57
人工智能
AI
绿色AI实践
算力
算力优化
GPU
代码随想录算法
训练
营第四十四天|LeetCode1143 最长公共子序列、LeetCode1035 不相交的线、LeetCode53 最大子序和、LeetCode392 判断子序列
LeetCode1143最长公共子序列代码随想录题目链接/文章讲解/视频讲解:代码随想录代码随想录PDF,代码随想录网站,代码随想录百度网盘,代码随想录知识星球,代码随想录八股文PDF,代码随想录刷题路线,代码随想录知识星球八股文https://programmercarl.com/1143.%E6%9C%80%E9%95%BF%E5%85%AC%E5%85%B1%E5%AD%90%E5%BA%8
weixin_67709152
·
2025-06-18 08:48
算法
代码随想录算法
训练
营第五十七天| LeetCode 392 判断子序列、LeetCode 115 不同的子序列
1LeetCode392判断子序列题目链接:LeetCode392判断子序列文章讲解:代码随想录(programmercarl.com)视频讲解:动态规划,用相似思路解决复杂问题|LeetCode:392.判断子序列2LeetCode115不同的子序列题目链接:LeetCode115不同的子序列文章讲解:代码随想录(programmercarl.com)视频讲解:动态规划之子序列,为了编辑距离做铺
望仁啊
·
2025-06-18 08:45
代码随想录算法刷题
算法
leetcode
职场和发展
《大模型应用开发极简入门》——笔记
2.
NLP
技术从n-gram到LLM的
孟柯coding
·
2025-06-18 08:15
笔记
AIGC
学习方法
代码
训练
LeetCode(35)验证回文串
代码
训练
(35)验证回文串Author:OnceDayDate:2025年6月17日漫漫长路,才刚刚开始…全系列文章可参考专栏:十年代码
训练
_Once-Day的博客-CSDN博客参考文章:125.验证回文串
Once-Day
·
2025-06-18 08:44
#
十年代码训练
leetcode
算法
C
代码随想录算法
训练
营第 44 天 |LeetCode1143.最长公共子序列 LeetCode 1035.不相交的线 LeetCode 53. 最大子序和 LeetCode392.判断子序列
代码随想录算法
训练
营Day44代码随想录算法
训练
营第44天|LeetCode1143.最长公共子序列LeetCode1035.不相交的线LeetCode53.最大子序和LeetCode392.判断子序列目录代码随想录算法
训练
营前言
HIT最菜电控
·
2025-06-18 08:43
代码随想录算法训练营
算法
leetcode
LLM大模型实战:从零到精通——大模型应用开发极简入门
朋友们如果有需要《大模型应用开发极简入门》,扫码获取~本书主要讲解了以下几个方面的大模型技术:GPT-4和ChatGPT的工作原理:书中详细介绍了这两个先进的语言模型的基本原理,包括它们是如何
训练
的、它们的架构以及它们在处理自然语言方面的能力
大模型入门学习
·
2025-06-18 07:10
AI大模型
人工智能
大模型
机器学习
AI智能体Coze知识库:从使用到实战详解
1.Coze智能体简介Coze是由字节跳动推出的AI智能体开发平台,旨在帮助用户快速构建、
训练
和部署AI智能体。
非著名架构师
·
2025-06-18 06:32
大模型
知识文档
人工智能
coze智能体
coze实战
Python
训练
营打卡 Day 20-奇异值SVD分解
一.奇异值分解(SVD)的输入和输出输入:一个任意的矩阵A,尺寸为m×n(其中m是行数,n是列数,可以是矩形矩阵,不必是方阵)奇异值分解(SVD)得到的三个矩阵U、Σ和V^T各有其特定的意义和用途,下面我简要说明它们的作用:U(奇异值向量矩阵):是一个m×m的正交矩阵,列向量是矩阵AA^T的特征向量作用:表示原始矩阵A在行空间(样本空间)中的主方向或基向量。简单来说,U$的列向量描述了数据在行维度
帮关下月亮
·
2025-06-18 04:54
python训练营
python
算法
开发语言
python编程游戏-Python游戏趣味编程
通过游戏案例逐步引入新的语法知识;2.为初学者量身打造:案例从易到难,所有程序的代码均不超过100行;3.趣味性强:12个案例,涵盖了多种游戏类型,寓教于乐;4.可拓展性强:提供练习题和参考答案,巩固知识,
训练
逻辑思维
weixin_37988176
·
2025-06-18 04:53
Python打卡
训练
营day20-奇异值SVD分解
知识点回顾:线性代数概念回顾(可不掌握)奇异值推导(可不掌握)奇异值的应用特征降维:对高维数据减小计算量、可视化数据重构:比如重构信号、重构图像(可以实现有损压缩,k越小压缩率越高,但图像质量损失越大)降噪:通常噪声对应较小的奇异值。通过丢弃这些小奇异值并重构矩阵,可以达到一定程度的降噪效果。推荐系统:在协同过滤算法中,用户-物品评分矩阵通常是稀疏且高维的。SVD(或其变种如FunkSVD,SVD
sak77
·
2025-06-18 04:22
python打卡训练营
python
机器学习
奇异值分解
SVD
Qwen2.5:模型
训练
和推理核心参数介绍
二、TrainingArguments核心参数2.1基础
训练
设置参数介绍output_dir(
艾墨舟启航
·
2025-06-18 04:51
大模型实战
大模型
Trainer
参数介绍
剖析前沿技术领域的
预
训练
模型架构
剖析前沿技术领域的
预
训练
模型架构关键词:
预
训练
模型架构、前沿技术、深度学习、自然语言处理、计算机视觉摘要:本文聚焦于前沿技术领域的
预
训练
模型架构,旨在深入剖析其核心概念、算法原理、数学模型以及实际应用。
AI天才研究院
·
2025-06-18 04:50
AI大模型企业级应用开发实战
AI
Agent
应用开发
架构
ai
【论文解读】s3: 仅 2.4K 数据即可 RL
训练
Search Agent
tNeedThatMuchDatatoTrainaSearchAgentviaRLcode:pat-jj/s3:s3-EfficientYetEffectiveSearchAgentTrainingviaRLforRAG5.总结(结果先行)s3框架以其“解耦搜索与生成、仅
训练
搜索代理
·
2025-06-18 04:50
AI大模型的概念验证与落地
AI大模型,深度学习,Transformer,自然语言处理,计算机视觉,概念验证,落地应用,模型
训练
,模型部署1.背景介绍近年来,人工智能(AI)技术取得了飞速发展,其中,大模型作为AI领域的重要组成部分
AI智能应用
·
2025-06-18 04:19
AI大模型应用入门实战与进阶
java
python
javascript
kotlin
golang
架构
人工智能
深度学习 backbone,neck,head网络关键组成
,neck(颈部),head(头部)是网络的关键组成部分,各自承担了不同的功能:1,总署:Backbone,译作骨干网络,主要指用于特征提取的,已在大型数据集(例如ImageNet|COCO等)上完成
预
训练
SLAM必须dunk
·
2025-06-18 02:12
深度学习
人工智能
深度强化学习应用:基于Double DQN算法的移动机器人路径跟踪技术解析
尤其是在路径跟踪问题中,传统的控制算法往往依赖于模型和假设,而深度强化学习则能够通过大量的
训练
数据让机器人自主学习如何优化其行为策略,从而实现高效的路径跟踪。
威哥说编程
·
2025-06-18 02:40
算法
李宏毅机器学习——类神经网络
训练
不起来怎么办?
https://www.bilibili.com/video/BV1Wv411h7kN?spm_id_from=333.788.videopod.episodes&vd_source=779fe6f5ae2ab98c0dc9480ff4ae61a3&p=201.局部最小值(localminima)与鞍点(saddlepoint)criticalpoint:hessian矩阵:1.1判断点类型:1.
JustNow_Man
·
2025-06-18 02:39
机器学习
神经网络
人工智能
DeepSeek 源码解构:从 MoE 架构到 MLA 的工程化实现
而MLA作为一种多层次结构,在更大规模的数据集上展现出了出色的性能,尤其在模型
训练
和推理效率方面表
威哥说编程
·
2025-06-18 02:08
架构
人工智能
AI编程
生成对抗网络(GAN)与深度生成模型实战
1.生成模型基础与GAN原理1.1生成模型概览生成模型是深度学习中的重要分支,主要分为以下几类:变分自编码器(VAE):基于概率图模型的生成方法生成对抗网络(GAN):通过对抗
训练
学习数据分布自回归模型
软考和人工智能学堂
·
2025-06-17 23:21
人工智能
Python开发经验
#
DeepSeek快速入门
开发语言
自然语言处理(
NLP
)核心技术:从词嵌入到Transformer
1.
NLP
基础与文本表示1.1文本预处理技术importreimportnltkfromnltk.corpusimportstopwordsfromnltk.stemimportPorterStemmer
软考和人工智能学堂
·
2025-06-17 23:21
人工智能
#
深度学习
Python开发经验
自然语言处理
transformer
人工智能
「Happy LLM」机器与人类沟通的桥梁——
NLP
如果说,编程语言是人类与机器“单方”交流的语言,那么
NLP
就是机器与人类进行“双向”交流的桥梁了。本章节我们会聊到:什么是
NLP
?
NLP
的预处理是怎样实现的?什么是
NLP
?
OvO_ll
·
2025-06-17 23:18
自然语言处理
人工智能
LLM
NLP
深度学习框架与联邦学习:探究未来的AI发展趋势=======================摘要:本文将深入探讨深度学习框架与联邦学习的融合,分析其在现代AI领域的应用和发展趋势。我们将介绍深度学习框
一、深度学习框架:AI的基石深度学习框架是构建和
训练
深度学习模型的重要工具。它为开发者提供了便捷的工具和库,使得构建复杂的神经网络模型变得更加简单高效
·
2025-06-17 23:46
开源新王诞生!MiniMax-M1正式发布,超强上下文能力剑指DeepSeek!
一百万token上下文窗口,八倍于DeepSeekR1的处理长度,
训练
成本仅53万美元——沉寂已久的AI六小虎之一MiniMax用开源新模型重新定义了性价比。6月17日,中国AI领域再掀巨浪。
算家计算
·
2025-06-17 23:15
话题文章
人工智能
MiniMax
DeepSeek
开源
算家云
租算力
到算家云
详解Byte Pair Encoding (BPE)原理
答案字节对编码(BytePairEncoding,BPE)是一种有效的数据压缩算法,广泛应用于自然语言处理(
NLP
)中的子词分割。
强化学习曾小健
·
2025-06-17 22:11
大模型LLM面试指南
多模态MLLM大模型面试指南
人工智能
深度学习
计算机视觉
入选 ICML 2025,清华/人大提出统一生物分子动力学模拟器 UniSim
该方法在大量3D分子结构数据上通过去噪+力场混合
预
训练
获得统一的全原子表示模型,基于随机差值(stochasticinterpolant)生成式框架学习分子在长时间步长下的转移向量场(vectorfield
·
2025-06-17 20:51
hyperai
如何用PyTorch构建第一个神经网络?——从环境搭建到实战部署的零基础指南
这几年带学员入门深度学习时,发现90%的新手都会卡在「第一个神经网络构建」上:有人装环境时被CUDA版本搞晕,有人写模型时分不清nn.Module和nn.Sequential,还有人
训练
时遇到梯度不更新的问题
唐宇迪(学习规划+技术答疑)
·
2025-06-17 18:42
pytorch
神经网络
人工智能
深度学习
机器学习
计算机视觉
自然语言处理
H5/小程序容器核心组件深度解读:高性能WebView的“快人一步”奥秘(鸿蒙5+版)
mPaaS的H5/小程序容器通过内核优化、
预
加
鸿蒙大白
·
2025-06-17 16:02
华为
HarmonyOS5
mPaaS
「大模型学习」(10)LLM的量化(GPTQ、LLM.int8()、AWQ)不信你学不会!
1.权重和输入经过归一化,数值范围较小➤通常神经网络
训练
后会对输入和权重做标准
木楚子
·
2025-06-17 16:32
学习
SnapViewer:解决PyTorch官方内存工具卡死问题,实现高效可视化
在深度学习模型
训练
过程中,GPU内存不足(OutofMemory,OOM)错误是开发者频繁遇到的技术挑战。
·
2025-06-17 16:48
人工智能深度学习pytorch
Dify文档喂不饱模型?别慌!Embedding 微调就是你的救星!
在AI时代,Embedding是
NLP
任务的基石,直接决定了你的模型是「聪明绝顶」还是「笨拙不堪」。你是否遇到过这些让人头疼的问题:做智能问答时,模型总是答非所问,用户一脸懵圈?
大模型玩家
·
2025-06-17 13:41
embedding
ai
自然语言处理
人工智能
语言模型
学习
程序员
【FineDance】
训练
:accelerate config 的作用
accelerate主要是配置分布式
训练
和硬件加速的设置。accelerateconfig的作用Accelerate是HuggingFace开发的库,用于简化多GPU、多机器的分布式
训练
。
等风来不如迎风去
·
2025-06-17 13:38
AI入门与实战
python
人工智能
动作
舞蹈
Moonlight-16B-A3B: 变革性的高效大语言模型,凭借Muon优化器打破
训练
效率极限
这款全新的Mixture-of-Experts(MoE)架构的大型语言模型,凭借其创新的
训练
优化技术,特别是Muon优化器的使用,成功突破了
训练
效率的极限,展现出强大的性能表现。
OpenCSG
·
2025-06-17 13:07
语言模型
人工智能
自然语言处理
社区
深度学习笔记
文章目录聚类导入模块生成模拟数据建立并
训练
K-Means聚类模型创建图形绘制散点图(聚类结果)获取聚类中心可视化聚类中心设置图形标题和标签输出效果数据降维一、常见的数据降维方法二、Python降维示例(
疯狂成瘾者
·
2025-06-17 10:54
深度学习
笔记
人工智能
RabbitMq介绍和使用
这里写目录标题概念安装AMQP引入jar包创建连接配置文件队列工作队列消息应答消息重新入队持久化
预
取值发布确认单个确认批量确认异步确认交换机类型绑定交换机使用死信队列设置TTL队列达到最大长度消息被拒延迟队列
愚不白
·
2025-06-17 10:19
rabbitmq
rabbitmq
(什么是)大模型的“越狱”(Model Jailbreaking)
核心概念安全机制的局限性:大模型在
训练
时会过滤掉大量有害数据,并通过“对齐
训练
”(如RLHF)学习人类价值观,拒绝
音程
·
2025-06-17 09:48
人工智能
机器学习
人工智能
机器学习
深度学习
基于AgentUniverse在金融场景中的多智能体应用探索【极客传媒】
先从语言模型说起,一个经过足够语料充分
预
训练
的基模型(basem
汀、人工智能
·
2025-06-17 09:41
LLM工业级落地实践
AI
Agent
人工智能
Agent
多智能体
【Python打卡Day12】启发式算法 @浙大疏锦行
下面介绍这几种常见的优化算法遗传算法粒子群优化模拟退火##1.数据处理+划分
训练
和测试importpandasaspdimportpandasaspd#用于数据处理和分析,可处理表格数据。
可能是猫猫人
·
2025-06-17 09:40
Python打卡训练营内容
启发式算法
算法
大模型微调(Fine-tuning)概览
大模型微调(Fine-Tuning)是将
预
训练
大模型(如GPT、LLaMA)适配到特定任务或领域的核心技术,其效率与效果直接影响大模型的落地价值。
MzKyle
·
2025-06-17 08:39
深度学习
人工智能
【0样本起手做多标签分类】3——大小模型螺旋上升
这套方案用了一系列奇技yin巧的trick调整现在的经典召回方案和经典模型方案,最终做到了高密度挖掘种子样本模型可分开
训练
,结构可插拔实际运行时准确率高,运行成本低前面两篇文章分别描述了在工业场景下:0
崔高杰
·
2025-06-17 08:07
LLM相关工程经验
数据挖掘
人工智能
分类
深度学习
语言模型
代码随想录-算法
训练
营day33(贪心算法03:K次取反后最大化的数组和,加油站,分发糖果)
第八章贪心算法part03●1005.K次取反后最大化的数组和●134.加油站●135.分发糖果详细布置1005.K次取反后最大化的数组和本题简单一些,估计大家不用想着贪心,用自己直觉也会有思路。https://programmercarl.com/1005.K%E6%AC%A1%E5%8F%96%E5%8F%8D%E5%90%8E%E6%9C%80%E5%A4%A7%E5%8C%96%E7%9A
java菜鸡加油
·
2025-06-17 08:07
算法训练营
算法
贪心算法
leetcode
java
力扣
上一页
21
22
23
24
25
26
27
28
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他