E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
YOLOv8训练
基于hf的trl框架的deepseek-r1-zero实现与
训练
导入模块和promt格式"""Reference:"""importreimporttorchfromdatasetsimportload_dataset,DatasetfromtransformersimportAutoTokenizer,AutoModelForCausalLMfromtrlimportGRPOConfig,GRPOTrainer#LoadandprepdatasetSYSTE
喂喂喂喂位
·
2025-03-12 20:00
deepseek
python
AIGC
【AI论文】SEAP: 无
训练
稀疏专家激活修剪,解锁大型语言模型的潜力
本文介绍了稀疏专家激活修剪(SEAP)方法,这是一种无需
训练
的修剪方法,通过选择性地保留与任务相关的参数来降低推理开销。
东临碣石82
·
2025-03-12 19:53
人工智能
语言模型
深度学习
在本地部署DeepSeek等大模型时,需警惕的潜在安全风险
在本地部署DeepSeek等大模型时,尽管数据存储在本地环境(而非云端),但仍需警惕以下潜在安全风险:1.模型与数据存储风险未加密的存储介质:若
训练
数据、模型权重或日志以明文形式存储,可能被物理窃取(如硬盘丢失
安 当 加 密
·
2025-03-12 18:19
安全
模型
多因素认证
访问控制
加密技术
数据安全
51-52 CVPR 2024 | Generalized Predictive Model for Autonomous Driving,自动驾驶通用预测模型
作者提出了通用的大规模自动驾驶视频预测模型GenAD,在实现过程中,进一步提出了迄今为止最大的自动驾驶场景
训练
数据集OpenDV-2K。
深圳季连AIgraphX
·
2025-03-12 18:18
aiXpilot
智驾大模型1
自动驾驶
人工智能
机器学习
stable
diffusion
AIGC
计算机视觉
算力服务器主要是指什么?
算力服务器对于人工智能领域来说,在深度学习模型的
训练
和推理过程中扮演着非常重要的角色,算力服务器可以执行大规模的矩阵计算,加速神经网络的
训练
和推理过程,帮助企业使得模型
训练
的时间大幅度缩短。
wanhengidc
·
2025-03-12 16:38
服务器
运维
【模型调优的深入分析与Python实践】
其核心目标是在以下两者间找到平衡:泛化能力∝1过拟合风险\text{泛化能力}\propto\frac{1}{\text{过拟合风险}}泛化能力∝过拟合风险1二、调优注意事项1.数据层面确保
训练
集/验证集
蝉叫醒了夏天
·
2025-03-12 15:30
机器学习
python
开发语言
模型调优
DeepSeek开源周:面向大模型
训练
的三个工具包
在2025年的开源周中,DeepSeek推出了一系列旨在优化大规模模型
训练
效率的工具。
花生糖@
·
2025-03-12 15:28
AIGC学习资料库
DeepSeek
实用集
DualPipe
EPLB
Profile-data
Deepseek
神经网络探秘:原理、架构与实战案例
本文旨在深入剖析神经网络的原理、常见架构,并通过一个实际的代码案例,带领读者亲手实践神经网络的构建与
训练
过程。无论你是机器学习初学者,还
二川bro
·
2025-03-12 14:56
智能AI
神经网络
人工智能
深度学习
如何提升OmniParser V2的小元素识别率——
YOLOv8
增加 P2 层的性能变化解析
YOLOv8
增加P2层通过牺牲部分计算效率换取了小目标检测性能的显著提升,尤其适用于高分辨率、小目标密集的场景。
AI-AIGC-7744423
·
2025-03-12 14:22
目标跟踪
人工智能
计算机视觉
为什么VAE效果不好,但VAE+diffusion效果就好了?
它结合了自编码器(Autoencoder)的结构和变分推断(VariationalInference)的思想,能够从数据中学习有意义的潜在表示,并生成与
训练
数据相似的新样本。
AndrewHZ
·
2025-03-12 12:43
深度学习新浪潮
算法
计算机视觉
深度学习
扩散模型
VAE
生成式模型
技术分析
基础算法
训练
2
基础算法1链接目录最长公共前缀两数之和删除字符串中所有相邻重复项n叉树的层序遍历最后一块石头的重量第N个泰波那契数图像渲染迷宫中离入口最近的出口矩阵课程表最长公共前缀14.最长公共前缀-力扣(LeetCode)在解决这道题时,巧妙运用String类的两个方法,能让解题过程变得十分轻松。首先,我们需要确定一个查找公共前缀的标准。这里,我们选择数组中的第一个字符串作为标准。不过,在此之前,必须对边界情
祁小白2024
·
2025-03-12 12:42
基础算法
算法
java
广度优先
Phi-4-multimodal:图、文、音频统一的多模态大模型架构、
训练
方法、数据细节
训练
过程包括多阶段优化,确保在不同模式和任务上的性能,数据来源多样,覆盖高质量网络和合成数据。
余俊晖
·
2025-03-12 12:40
大语言模型
多模态
LLM
多模态
AI:230-YOLOv8与RT-DETR的完美结合 | 重塑目标检测技术的前沿【保姆级教程】
正在不断更新中~文章目录
YOLOv8
与RT-DETR的完美结合|重塑目标检测
一键难忘
·
2025-03-12 12:09
精通AI实战千例专栏合集
人工智能
YOLO
目标检测
YOLOv8与RT-DETR
在整个大模型LoRA微调中,哪些方法可以提升和优化模型
训练
后推理效果?
环境:LoRA微调问题描述:在整个大模型LoRA微调中,哪些方法可以提升和优化模型
训练
后推理效果?
玩人工智能的辣条哥
·
2025-03-12 11:38
人工智能
人工智能
LoRA
微调
weka 决策树
-synopsisor-infoOutputsynopsisforclassifier(useinconjunctionwith-h)-t(trainfile,
训练
文件,通常
训练
时只需要此文件即可,会进行
marui1982
·
2025-03-12 11:03
机器学习
大模型微调:定义、方法、应用与未来展望
一、定义与意义(一)微调的定义大模型微调是指在预
训练
模型的基础上,通过特定领域的数据集对模型进行进一步
训练
的过程。
软件职业规划
·
2025-03-12 11:33
easyui
前端
javascript
扩散 Transformer 策略:用于通才视觉-语言-动作学习的规模化扩散 Transformer
最近,在多样化的机器人数据集上进行预
训练
的大型视觉-语言-动作模型,已展示出利用少量域内数据泛化到
三谷秋水
·
2025-03-12 10:27
计算机视觉
大模型
智能体
transformer
深度学习
计算机视觉
语言模型
人工智能
机器学习
计算机视觉深度学习入门(4)
在小型数据集上从头开始
训练
一个卷积神经网络利用少量数据来
训练
图像分类模型,这是一种很常见的情况。如果你从事与计算机视觉相关的职业,那么很可能会在实践中遇到这种情况。
yyc_audio
·
2025-03-12 10:26
计算机视觉
人工智能
计算机视觉
深度学习
神经网络
Python
训练
的机器学习模型【保存】 和【加载】的方法?
一.为什么要保存
训练
好的模型由于传统
训练
机器学习模型,需要耗费大量的人力和资源。因此,将
训练
好的模型保存成为一件特别重要的事情。
福葫芦
·
2025-03-12 09:22
python
机器学习
开发语言
深入解析模型蒸馏(Knowledge Distillation):原理、方法与优化策略
深入解析模型蒸馏(KnowledgeDistillation):原理、方法与优化策略1.引言随着深度学习模型规模的不断增长,
训练
和部署大模型的计算成本也越来越高。
赵大仁
·
2025-03-12 09:48
AI
大语言模型
人工智能
人工智能
深度学习
神经网络
机器学习
自然语言处理
51-53 CVPR 2024 | DriveWorld:通过自动驾驶世界模型进行 4D 预
训练
场景理解 (含模型数据流梳理)
24年5月,北京大学、国防创新研究院无人系统技术研究中心、中国电信人工智能研究院联合发布了DriveWorld:4DPre-trainedSceneUnderstandingviaWorldModelsforAutonomousDriving。DriveWorld在UniAD的基础上又有所成长,提升了自动驾驶目标检测、目标追踪、3D占用、运动预测及规划的性能,后期扩大数据集和调整骨干网络大小应该会
深圳季连AIgraphX
·
2025-03-12 08:43
aiXpilot
智驾大模型1
自动驾驶
人工智能
AIGC
stable
diffusion
计算机视觉
智慧城市
大模型面试--大模型(LLMs)基础面
以下是一些主流的Transformer模型:GPT系列GPT-2和GPT-3:由OpenAI开发的生成式预
训练
变换器模型,用于生成高质量的文本。GPT-Neo和GPT-J:由Eleuthe
TAICHIFEI
·
2025-03-12 08:13
大模型面试
语言模型
人工智能
AIGC是怎么为拥有5000家门店的行业头部企业做内容分发?
最初,我们都沉浸在通过海量数据
训练
出超级智能的幻想中,但随着时间的推移,我们逐渐意识到,在商业应用中,技术的稳定性和可靠性远比单纯的先进性更为重要。
Tezign_space
·
2025-03-12 07:06
AIGC
人工智能
科技
经验分享
传媒
音视频
N1学习打卡笔记
本文为365天深度学习
训练
营中的学习记录博客原作者:K同学啊Onhot编码one-hot编码的基本思想是将每个类别映射到一个向量,其中只有一个元素的值为1,其余元素的值为0。
无涯学徒1998
·
2025-03-12 07:06
学习
笔记
机器学习入门指南:从 TensorFlow 到 PyTorch
机器学习是一种通过数据
训练
模型,使计算机能够自动学习和改进的技术。它主要分
6v6-博客
·
2025-03-12 06:23
机器学习
tensorflow
pytorch
Faster R-CNN原理详解以及Pytorch实现模型
训练
与推理
【
YOLOv8
多目标识别与自动标注软件开发】8.【基于深度学习的行人跌倒检测系统】9.【基于深度学习的PCB板缺陷检测系统
阿_旭
·
2025-03-12 05:51
深度学习实战
cnn
pytorch
人工智能
Faster
RCNN
cornell grasp data 康奈尔大学抓取数据集 百度云
目前先进的基于视觉和机器人抓取方法都是在该数据集上
训练
过。该数据集共十组,每组100个物体,共计1000个物体,不仅包含物体的图像,还包含物体的抓取位姿。
工科pai
·
2025-03-12 05:20
深度学习
自主抓取
康奈尔抓取数据集
自主抓取
RK3568笔记五十六:yolov8_obb旋转框
训练
部署
本文基于rknn_model_zoo和山水无移大佬的博客和代码
训练
模型并部署到正点原子的ATK-DLRK3568板子测试。
殷忆枫
·
2025-03-12 04:07
RK3568学习笔记
笔记
YOLO
RK3568笔记六十八:Yolov11目标检测部署测试
这里不
训练
自己的模型了,使用官方模型测试。
殷忆枫
·
2025-03-12 04:07
RK3568学习笔记
笔记
YOLO
对开源VLA sota π0的微调——如何基于各种开源数据集、以及你自己的私有数据集微调π0(含我司的微调实践)
前言25年2.4日,几个月前推出π0的公司PhysicalIntelligence(π)宣布正式开源π0及π0-FAST,如之前所介绍的,他们对用超过10,000小时的机器人数据进行了预
训练
该GitHub
v_JULY_v
·
2025-03-12 04:07
通用机械臂之路:
π0等VLA
sota模型
开源VLA的sota模型
微调π0
微调VLA模型
基于私有数据集微调π0
基于开源数据集微调π0
《自然语言处理实战入门》深度学习 ---- 预
训练
模型初探
文章大纲前言预
训练
模型简介语言表示学习神经上下文编码器为何需要预
训练
模型发展历史主流预
训练
模型预
训练
模型与分类将PTMs应用至下游任务微调策略未来研究方向参考文献前言随着深度学习的发展,各种神经网络被广泛用于解决自然语言处理
shiter
·
2025-03-12 02:21
AI重制版】
预训练
NLP
自然语言处理
DeepSeek发展背景和前景
2.技术演进:2024年1月:发布首个大模型DeepSeekLLM,包含670亿参数,在2万亿token的数据集上
训练
,性能超越Llama270BBase。202
爱吃苹果的日记本
·
2025-03-12 02:18
人工智能
第20周:Pytorch文本分类入门
目录前言一、前期准备1.1环境安装导入包1.2加载数据1.3构建词典1.4生成数据批次和迭代器二、准备模型2.1定义模型2.2定义示例2.3定义
训练
函数与评估函数三、
训练
模型3.1拆分数据集并运行模型3.2
weixin_46620278
·
2025-03-12 01:44
pytorch
分类
人工智能
NLP新手入门-第N1周:Pytorch文本分类入门
本文为365天深度学习
训练
营中的学习记录博客原作者:K同学啊|接辅导、项目定制目录一、课题背景和开发环境二、环境安装三、文本分类1.加载数据2.构建词典3.生成数据批次和迭代器4.定义模型5.定义实例6
Oaix Nay
·
2025-03-12 01:42
365天深度学习训练记录
pytorch
自然语言处理
分类
28.代码随想录算法
训练
营第二十八天|122. 买卖股票的最佳时机 II,55. 跳跃游戏,45. 跳跃游戏 II,1005. K 次取反后最大化的数组和
28.代码随想录算法
训练
营第二十八天|122.买卖股票的最佳时机II,55.跳跃游戏,45.跳跃游戏II,1005.K次取反后最大化的数组和122.买卖股票的最佳时机II-力扣(LeetCode)给你一个整数数组
白鹭鸣鸣!
·
2025-03-12 00:08
算法
java
Python 在深度学习中的应用
深度学习是机器学习的一个分支,它通过构建和
训练
深层神经网络来实现对数据的学习和理解。Python作为一种简洁、易读、功能强大的编程语言,在深度学习领域得到了广泛的应用。
2501_90435375
·
2025-03-12 00:38
人工智能
python
深度学习
开发语言
Bert的使用
dataloaderfromtorch.utils.dataimportDataLoader,Datasetfromsklearn.model_selectionimporttrain_test_split#给X,Y和分割比例,分割出来一个
训练
集和验证机的
巨鹿..
·
2025-03-12 00:31
深度学习记录
bert
人工智能
深度学习
PyTorch 中的混合精度
训练
方法,从 autocast 到 GradScalar
PyTorch的混合精度
训练
主要由两个方法实现:amp.autocast和amp.GradScalar。在这两个工具的帮助下,可以实现以torch.float16的混合精度
训练
。
Syntax_CD
·
2025-03-12 00:01
PyTorch
必知必会
pytorch
人工智能
python
人工智能混合编程实践:C++调用Python ONNX进行
YOLOv8
推理
人工智能混合编程实践:C++调用PythonONNX进行
YOLOv8
推理前言相关介绍Python简介C++简介ONNX简介
YOLOv8
简介前提条件实验环境项目结构C++调用PythonONNX进行
YOLOv8
FriendshipT
·
2025-03-11 22:48
人工智能混合编程实践
人工智能
c++
python
YOLO
ONNX
目标检测
考研复习时间规划:从迷茫到高效备考的进阶之路
基础阶段需要全面梳理知识体系,强化阶段着重攻克重点难点,冲刺阶段则要进行查漏补缺和模拟
训练
。每个阶段都有其特定的任务和目标,考生需要根据这些特征合理安排时间。考研复习的时
闲虎考研
·
2025-03-11 22:16
考研经验
考研
模型优化前沿趋势与行业应用实战
以联邦学习为代表的数据隐私保护技术,正在重构跨机构协作的模型
训练
范式,而量子计算与神经架构搜索(NAS)的结合,为超参数优化开辟了新维度。
智能计算研究中心
·
2025-03-11 22:12
其他
算力安全创新驱动未来趋势endofsentence
例如,异构计算通过CPU、GPU、FPGA的协同加速,使复杂模型
训练
效率提升40%以上。关键数据:根据IDC预测,到2025年全球智能算力需求将增长30倍,
智能计算研究中心
·
2025-03-11 22:42
其他
H800实战应用深度解析endofsentence
下表展示了H800在不同场景下的性能表现对比:场景类型
训练
速度提升推理延迟降低能效比提升自然语言处理35%22%40%计算机视觉28%18%33%推荐系统41%29%37%资深系统架构师指出:"H800
智能计算研究中心
·
2025-03-11 22:12
其他
DeepSeek高效AI创作成本革新endofsentence
该系统通过多任务联合
训练
框架,在自然语言理解、代码生成和跨模态处理方面展现出显著优势。其混合专家架构采用动态路由机制,实现参数利用率提升40%以上,在保持模型容量的同时将推理成本降低68%。
智能计算研究中心
·
2025-03-11 22:12
其他
DeepSeek大语言模型下几个常用术语
AI人工智能实现人类第二脑”(大概是这个意思)更多内容,可关注公众号“一名程序媛”,我们一起从0-1学编程基本概念AI人工智能NLP自然语言处理LLM大语言模型HuggingFace一个提供了丰富的预
训练
模型和工具库的平台网站
曲幽
·
2025-03-11 21:36
AI
计算机
语言模型
人工智能
自然语言处理
deepseek
ollama
ai
Python机器学习实战:使用Flask构建机器学习API
机器学习实战:使用Flask构建机器学习API作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来在数据科学和机器学习领域,模型
训练
和部署一直是重要的挑战
AI天才研究院
·
2025-03-11 20:03
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
大厂Offer收割机
面试题
简历
程序员读书
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
Java
Python
架构设计
Agent
程序员实现财富自由
入坑 Python 全能实战小白
训练
营,470 集干货 12.9G 大揭秘!
家人们,我最近挖到了一个Python学习的宝藏——Python全能实战小白
训练
营。整整470集,内容超丰富,资源包有12.9G,完全就是为咱们这些想系统学习Python的小白量身定制的。
七七知享
·
2025-03-11 19:54
Python
python
开发语言
pandas
numpy
matplotlib
java
php
深度学习
训练
中GPU内存管理
文章目录概述常见问题1、设备选择和数据迁移2、显存监控函数3、显存释放函数4、自适应batchsize调节5、梯度累积概述在深度学习模型
训练
中,主流GPU显存通常为8GB~80GB,内存不足会导致
训练
中断或
@Mr_LiuYang
·
2025-03-11 19:24
遇到过的问题
内存管理
内存溢出
out
of
memory
GPU内存
一学就会的深度学习基础指令及操作步骤(5)使用预
训练
模型
文章目录使用预
训练
模型加载预
训练
模型图像加载与预处理预测使用预
训练
模型查看模型库和常用模型加载预
训练
模型fromtorchvision.modelsimportvgg16#VGG16模型架构的定义fromtorchvision.modelsimportVGG16
小圆圆666
·
2025-03-11 19:53
深度学习
人工智能
python
卷积神经网络
【LLM】预
训练
的具体流程
分词器
训练
预
训练
模型:就像你已经学会了一些基础知识的“大脑”,我们可以在这个基础上继续学习新东西。比如,有些模型已经学会了英语,但中文学得不够好。
FOUR_A
·
2025-03-11 17:05
LLM
python
人工智能
深度学习
大模型
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他