E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大规模训练
(4-8)基于DeepSeekMoE架构的DeepSeek-V3:测试模型
在加载模型时,首先需要从指定路径加载模型的配置文件和预
训练
权重。加载完成后,模型被设置为评估模式,并移动到GPU上以加速推理过程。
码农三叔
·
2025-03-13 13:37
训练
RAG
多模态)
架构
transformer
deekseek
人工智能
大模型
图像识别技术与应用
工资是怎么样的岗位职责和任职要求看到了人类工业文明的演变了解了人工智能的研究、开发、模拟、延伸、理论、方法和技术看到了生活方式的转变比如智能语音闹钟控制系统、自动驾驶和人脸识别考勤智能购物、医疗日常生活的智能比如指纹、淘宝、抖音还能用软件看到天气的好坏了解了典型
训练
和机器学习中的关键组件机器学习中的关键组件包含
超帅的好吧
·
2025-03-13 13:36
笔记
一个基于LSTM的字符级文本生成模型的
训练
+使用(pytorch)
一、代码实现1.配置文件config.pyimporttorch#设备配置DEVICE=torch.device('cuda'iftorch.cuda.is_available()else'cpu')#超参数和配置SEQ_LENGTH=100#输入序列长度BATCH_SIZE=64#批大小EMBEDDING_DIM=256#嵌入层维度HIDDEN_SIZE=512#LSTM隐藏层大小NUM_LAY
一只小铁柱
·
2025-03-13 12:04
lstm
pytorch
人工智能
模型
训练
和推理
训练
时需要梯度,推理时不需要怎么理解“梯度”?
一杯水果茶!
·
2025-03-13 12:02
视觉与网络
python
梯度
反向传播
训练
推理
【Agent实战】RAG方式+结构化prompt(CoT)+API工具结合ChatGPT4o能力Agent项目实践(货物上架位置推荐助手)
本文原创作者:姚瑞南AI-agent大模型运营专家,先后任职于美团、猎聘等中大厂AI
训练
专家和智能运营专家岗;多年人工智能行业智能产品运营及大模型落地经验,拥有AI外呼方向国家专利与PMP项目管理证书。
姚瑞南
·
2025-03-13 12:56
RAG技术应用探索
大模型落地探索及agent搭建
prompt
chatgpt
自然语言处理
人工智能
AIGC
YOLO系列模型从v1到v10的演进
文章目录引言YOLOv1:开创单阶段目标检测先河发布时间与背景核心创新模型架构
训练
策略与优化YOLOv2:提升精度与速度的平衡发布时间与背景核心创新模型架构
训练
策略与优化YOLOv3:多尺度检测与残差连接发布时间与背景核心创新模型架构
训练
策略与优化
剑走偏锋o.O
·
2025-03-13 11:25
YOLO
目标跟踪
人工智能
sparkML入门,通俗解释机器学习的框架和算法
确定目标|想做什么菜(红烧肉/沙拉)|明确任务(分类/回归/聚类)2.准备食材|买菜、洗菜、切菜|数据收集与预处理3.设计食谱|决定烹饪步骤和调料|选择算法和模型设计4.试做并尝味道|调整火候和调味|模型
训练
与调参
Tometor
·
2025-03-13 11:53
spark-ml
机器学习
算法
回归
数据挖掘
人工智能
scala
神经网络机器学习中说的过拟合是什么意思
在神经网络和机器学习中,过拟合(Overfitting)是指模型在
训练
数据上表现非常好,但在未见过的测试数据上表现较差的现象。
yuanpan
·
2025-03-13 10:46
机器学习
神经网络
人工智能
分布式并行策略概述
数据并行(DataParallelism)内容:数据并行通过将
训练
数据分割成多个小批次,并在多个处理单元(如GPU)上同时
训练
模型的副本来工作。
灵海之森
·
2025-03-13 10:11
LLM
算法
分布式
突破:海量倾斜高斯OPGS Cesium高效渲染!
在重建大师7.0新品发布会上,我们首次推出了倾斜摄影测量高斯飞溅(OPGS)从
训练
到实时渲染的软件工具解决方案,使得用户能够在常用的重建农场计算节点下,就能够实现城市级地理场景3DOPGS成果的高质量、
大势智慧
·
2025-03-13 09:34
实景三维
三维模型
三维建模
Cesium
OPGS
整理:4篇论文介绍实时语义分割的未来,Transformer架构下的性能与效率平衡
在Transformer架构推动下,计算机视觉领域致力于打造一个极为强大且通用的
大规模
模型,它能处理物体检测、图像分割等多种任务。
mslion
·
2025-03-13 08:25
transformer
深度学习
人工智能
语义分割
LLM填坑:
训练
自己的分词器-Tokenizer
说明:文本搬运以下文章,略微调整,有需求可参考原文。paper:https://zhuanlan.zhihu.com/p/625715830code:Chatterbox/example/TrainTokenizersExample/train_tokenizers.pyatmain·enze5088/Chatterbox·GitHubHuaggingface教程:
微风❤水墨
·
2025-03-13 08:53
LLM
&
AIGC
&
VLP
人工智能
LLM填坑:
训练
自己的分词器-Tokenizer 2
merges.txtmerges文件存放的是
训练
tokenizer阶段所得到的合并词表结果,就是tokenizer.json中,model.merges下的内容。
微风❤水墨
·
2025-03-13 08:53
LLM
&
AIGC
&
VLP
LLM
tokenizer
Spring Boot HikariCP数据库连接池入门
阿里
大规模
采用Druid。当然,如下有一些资料,胖友可以阅读参考:《Druid连接池介绍》《为什么HikariCP被号称为
Ase5gqe
·
2025-03-13 07:49
面试
学习路线
阿里巴巴
java
整理:开启新征程!四篇文章助力 AI,告别 “3D理解困难户”
目前的MLLM主要是用2D图片
训练
出来的,也就是说,它们更擅长识别平面的信息,比如照片中的人和物体。但是,现实世界是三维的(3D),仅靠2D图片
训练
的模型很难准确理解物体的立体关系。
mslion
·
2025-03-13 07:17
人工智能
3d
大语言模型
计算机视觉
目标识别
分子动力学仿真软件:GROMACS_(1).GROMACS基础知识
GROMACS以其高效、灵活和强大的功能而闻名,支持
大规模
并行计算,适用于从小分子到复杂生物体系的多种应用场景。1.1GROMACS的历史和发展GROMAC
kkchenjj
·
2025-03-13 07:15
分子动力学2
仿真模拟
模拟仿真
分子动力学
训练
大模型LLM选择哪种开发语言最好
训练
大型语言模型(LLM)时,选择合适的编程语言主要取决于效率、生态支持、开发便利性以及特定需求(如性能优化或硬件适配)。
大0马浓
·
2025-03-13 05:09
人工智能
训练
python
动手深度学习笔记(二十九)5.5. 读写文件
.深度学习计算5.5.读写文件5.5.1.加载和保存张量5.5.2.加载和保存模型参数5.5.3.小结5.5.4.练习5.深度学习计算5.5.读写文件到目前为止,我们讨论了如何处理数据,以及如何构建、
训练
和测试深度学习模型
落花逐流水
·
2025-03-13 04:29
pytorch实践
pytorch
pytorch
大语言模型(LLM)的微调与应用
一、微调与应用的核心区别目标差异微调(Fine-tuning):针对预
训练
模型进行参数调整,使其适应特定任务或领域(如医疗问答、法律文本分析)。
AI Echoes
·
2025-03-13 03:50
语言模型
人工智能
自然语言处理
PyTorch分布式
训练
本文结构:分布式
训练
概述环境设置数据并行(DDP)模型并行启动
训练
性能优化建议示例代码参考资料和相关问题以下是为您整理的PyTorch分布式
训练
教程指南:一、PyTorch分布式
训练
核心概念数据并行:通过分割数据集实现多
阳光明媚大男孩
·
2025-03-13 02:16
pytorch
分布式
人工智能
29.代码随想录算法
训练
营第二十九天|134. 加油站,135. 分发糖果,860. 柠檬水找零,406. 根据身高重建队列
29.代码随想录算法
训练
营第二十九天|134.加油站,135.分发糖果,860.柠檬水找零,406.根据身高重建队列134.加油站-力扣(LeetCode)在一条环路上有n个加油站,其中第i个加油站有汽油
白鹭鸣鸣!
·
2025-03-13 02:12
算法
java
书生大模型全链路开源体系,学习
优点书生·浦语开源大模型,是一个开源的大模型,大家可以一起学习还有配套的教学视频,很快就能上手,而且还奖励算力,可以直接
训练
,讨论学习,非常nice。
小方abc
·
2025-03-13 01:37
语言模型
论文阅读笔记:Graph Matching Networks for Learning the Similarity of Graph Structured Objects
论文做的是用于图匹配的神经网络研究,作者做出了两点贡献:证明GNN可以经过
训练
,产生嵌入graph-leve的向量可以用于相似性计算。
游离态GLZ不可能是金融技术宅
·
2025-03-13 01:07
知识图谱
机器学习
深度学习
人工智能
论文阅读 EEG-TCNet
AnAccurateTemporalConvolutionalNetworkforEmbeddedMotor-ImageryBrain–MachineInterfaces1.Intrduction本文提出了一种新颖的时间卷积网络(TCN),在需要很少的可
训练
参数的情况下实现了出色的精度
Plan-C-
·
2025-03-13 01:36
论文阅读
FLOW MATCHING FOR GENERATIVE MODELING 阅读笔记
FlowMatching(FM)是一种
训练
连续标准化流ContinuousNormalizingFlow(CNF)的方法。FM是一种通用的方法。FM可以用于
训练
扩散路径,用FM
训练
扩散路径更稳定。
冰冰冰泠泠泠
·
2025-03-13 01:35
笔记
机器学习
算法
论文阅读笔记——π0: A Vision-Language-Action Flow Model for General Robot Control
π0论文π0π_0π0是基于预
训练
的VLM模型增加了actionexpert,并结合了flowmatching方法
训练
的自回归模型,能够直接输出模型的actionchunk(50)。
寻丶幽风
·
2025-03-13 01:33
论文阅读笔记
论文阅读
笔记
人工智能
机器人
语言模型
【论文阅读】Learning Transferable Visual Models From Natural Language Supervision(2021)
State-of-the-art(最先进的)computervisionsystems(计算机视觉系统)aretrainedtopredictafixedsetofpredeterminedobjectcategories(被
训练
来预测一组固定的预定对象类别
Bosenya12
·
2025-03-13 01:02
论文阅读
Stable Diffusion游戏底模推荐
一、基础通用型底模SDXLbase官方原版底模,支持1024x1024高清出图,适用于各类游戏场景和角色的基础生成,建议作为微调
训练
的基准模型。
Liudef06
·
2025-03-12 23:52
从零开始设计游戏
stable
diffusion
游戏
InternVL:论文阅读 -- 多模态大模型(视觉语言模型)
3)
训练
策略(1)第一阶段:视觉-语言对比
训练
(2)第二阶段:视觉语言生成
训练
(3)第三阶段:监督微调(SFT)3.InternVL应用1)对于视觉感知任务2)对于对比任务3)对于生成任务4)对于
XiaoJ1234567
·
2025-03-12 23:20
LLM
论文阅读
语言模型
人工智能
多模态大模型
internVL
LLM大模型技术实战6:一文总结大模型微调方法
作为像水、电一样的基础设施,预
训练
大模型这样的艰巨任务,只会有少数技术实力强、财力雄厚的公司去做。绝大多数人,是水、电的应用者。对这部分人来说,掌握如何用好大模型的技术,更加重要。
AIG暴躁猫叔
·
2025-03-12 22:16
人工智能
深度学习
机器学习
Adapter-Tuning:高效适配预
训练
模型的新任务
1.引言近年来,预
训练
语言模型(PLM)如BERT、GPT和T5在自然语言处理(NLP)任务中取得了巨大成功。
花千树-010
·
2025-03-12 22:15
Tuning
prompt
embedding
AIGC
机器学习
chatgpt
pytorch
Doris集群启停脚步
ApacheDoris是一个基于MPP(
大规模
并行处理)架构的高性能、实时的分析型数据库。
江畔独步
·
2025-03-12 20:01
数据仓库
基于hf的trl框架的deepseek-r1-zero实现与
训练
导入模块和promt格式"""Reference:"""importreimporttorchfromdatasetsimportload_dataset,DatasetfromtransformersimportAutoTokenizer,AutoModelForCausalLMfromtrlimportGRPOConfig,GRPOTrainer#LoadandprepdatasetSYSTE
喂喂喂喂位
·
2025-03-12 20:00
deepseek
python
AIGC
【AI论文】SEAP: 无
训练
稀疏专家激活修剪,解锁大型语言模型的潜力
本文介绍了稀疏专家激活修剪(SEAP)方法,这是一种无需
训练
的修剪方法,通过选择性地保留与任务相关的参数来降低推理开销。
东临碣石82
·
2025-03-12 19:53
人工智能
语言模型
深度学习
00后用DeepSeek直播1天卖出3.3亿;Manus披露基座模型是Claude和阿里千问;X平台遭受
大规模
网络攻击|极客头条
「极客头条」——技术人员的新闻圈!CSDN的读者朋友们好,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。整理|郑丽媛出品|CSDN(ID:CSDNnews)一分钟速览新闻点!美的回应“强制18点20下班”:严禁形式主义加班,身体力行践行“反内卷”字节被曝曾想收购Manus团队,因出价低被拒传小米人形机器人Cyberone即将量产,官方回应:消息不实被网友获取运行代码后,Man
极客日报
·
2025-03-12 19:52
deepseek
在本地部署DeepSeek等大模型时,需警惕的潜在安全风险
在本地部署DeepSeek等大模型时,尽管数据存储在本地环境(而非云端),但仍需警惕以下潜在安全风险:1.模型与数据存储风险未加密的存储介质:若
训练
数据、模型权重或日志以明文形式存储,可能被物理窃取(如硬盘丢失
安 当 加 密
·
2025-03-12 18:19
安全
模型
多因素认证
访问控制
加密技术
数据安全
51-52 CVPR 2024 | Generalized Predictive Model for Autonomous Driving,自动驾驶通用预测模型
作者提出了通用的
大规模
自动驾驶视频预测模型GenAD,在实现过程中,进一步提出了迄今为止最大的自动驾驶场景
训练
数据集OpenDV-2K。
深圳季连AIgraphX
·
2025-03-12 18:18
aiXpilot
智驾大模型1
自动驾驶
人工智能
机器学习
stable
diffusion
AIGC
计算机视觉
vLLM框架:使用大模型推理框架
vLLM专为高效部署
大规模
语言模型设计,尤其适合高并发推理场景,关于对vLLM的介绍请看这篇博文。以下从安装配置、基础推理、高级功能、服务化部署到多模态扩展逐步讲解。
CITY_OF_MO_GY
·
2025-03-12 17:12
人工智能
HBase2.6.1部署文档
HBase通常应用于需要快速随机读写、低延迟访问以及高吞吐量的场景,例如
大规模
日志处理、社交网络数据存储等。HBase特性列存储模型:HBase的数据是按列族存储的,适合高稀疏数据。行键分区
CXH728
·
2025-03-12 17:10
zookeeper
hbase
数据清洗级可视化中,Pandas&numyp的主要作用
此外,Pandas还支持数据类型转换、异常值处理等数据清洗任务,以及时间序列图、柱状图和折线图等基本数据可视化方法NumPy专注于数值计算,提供了高效的数组操作功能,适用于
大规模
数
Test-Sunny
·
2025-03-12 16:09
pandas
信息可视化
算力服务器主要是指什么?
算力服务器对于人工智能领域来说,在深度学习模型的
训练
和推理过程中扮演着非常重要的角色,算力服务器可以执行
大规模
的矩阵计算,加速神经网络的
训练
和推理过程,帮助企业使得模型
训练
的时间大幅度缩短。
wanhengidc
·
2025-03-12 16:38
服务器
运维
【模型调优的深入分析与Python实践】
其核心目标是在以下两者间找到平衡:泛化能力∝1过拟合风险\text{泛化能力}\propto\frac{1}{\text{过拟合风险}}泛化能力∝过拟合风险1二、调优注意事项1.数据层面确保
训练
集/验证集
蝉叫醒了夏天
·
2025-03-12 15:30
机器学习
python
开发语言
模型调优
DeepSeek开源周:面向大模型
训练
的三个工具包
在2025年的开源周中,DeepSeek推出了一系列旨在优化
大规模
模型
训练
效率的工具。
花生糖@
·
2025-03-12 15:28
AIGC学习资料库
DeepSeek
实用集
DualPipe
EPLB
Profile-data
Deepseek
神经网络探秘:原理、架构与实战案例
本文旨在深入剖析神经网络的原理、常见架构,并通过一个实际的代码案例,带领读者亲手实践神经网络的构建与
训练
过程。无论你是机器学习初学者,还
二川bro
·
2025-03-12 14:56
智能AI
神经网络
人工智能
深度学习
为什么VAE效果不好,但VAE+diffusion效果就好了?
它结合了自编码器(Autoencoder)的结构和变分推断(VariationalInference)的思想,能够从数据中学习有意义的潜在表示,并生成与
训练
数据相似的新样本。
AndrewHZ
·
2025-03-12 12:43
深度学习新浪潮
算法
计算机视觉
深度学习
扩散模型
VAE
生成式模型
技术分析
基础算法
训练
2
基础算法1链接目录最长公共前缀两数之和删除字符串中所有相邻重复项n叉树的层序遍历最后一块石头的重量第N个泰波那契数图像渲染迷宫中离入口最近的出口矩阵课程表最长公共前缀14.最长公共前缀-力扣(LeetCode)在解决这道题时,巧妙运用String类的两个方法,能让解题过程变得十分轻松。首先,我们需要确定一个查找公共前缀的标准。这里,我们选择数组中的第一个字符串作为标准。不过,在此之前,必须对边界情
祁小白2024
·
2025-03-12 12:42
基础算法
算法
java
广度优先
Phi-4-multimodal:图、文、音频统一的多模态大模型架构、
训练
方法、数据细节
训练
过程包括多阶段优化,确保在不同模式和任务上的性能,数据来源多样,覆盖高质量网络和合成数据。
余俊晖
·
2025-03-12 12:40
大语言模型
多模态
LLM
多模态
在整个大模型LoRA微调中,哪些方法可以提升和优化模型
训练
后推理效果?
环境:LoRA微调问题描述:在整个大模型LoRA微调中,哪些方法可以提升和优化模型
训练
后推理效果?
玩人工智能的辣条哥
·
2025-03-12 11:38
人工智能
人工智能
LoRA
微调
weka 决策树
-synopsisor-infoOutputsynopsisforclassifier(useinconjunctionwith-h)-t(trainfile,
训练
文件,通常
训练
时只需要此文件即可,会进行
marui1982
·
2025-03-12 11:03
机器学习
大模型微调:定义、方法、应用与未来展望
一、定义与意义(一)微调的定义大模型微调是指在预
训练
模型的基础上,通过特定领域的数据集对模型进行进一步
训练
的过程。
软件职业规划
·
2025-03-12 11:33
easyui
前端
javascript
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他