E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
GPU训练
数据增强:扩充数据集提升模型泛化能力
一个泛化能力强的模型能够在未见数据上表现良好,而过拟合的模型则会在
训练
数据上表现出色,但在新数据上表现糟糕。
AI天才研究院
·
2025-03-19 23:06
计算
AI大模型企业级应用开发实战
ChatGPT
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
数据增强:扩充数据集,提升模型的鲁棒性
数据增强:扩充数据集,提升模型的鲁棒性1.背景介绍1.1数据集的重要性在机器学习和深度学习领域中,数据集是
训练
模型的基础。高质量的数据集对于构建准确、鲁棒的模型至关重要。
AI天才研究院
·
2025-03-19 23:05
DeepSeek
R1
&
大数据AI人工智能大模型
LLM大模型落地实战指南
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
NLP高频面试题(三)——普通RNN的梯度消失和梯度爆炸问题
普通RNN(循环神经网络)的梯度消失和梯度爆炸问题是指在
训练
深层或长序列的RNN模型时出现的两种典型问题:一、梯度消失(VanishingGradient)梯度消失是指在反向传播过程中,梯度逐层传播时变得越来越小
Chaos_Wang_
·
2025-03-19 23:34
NLP常见面试题
自然语言处理
rnn
人工智能
vscode连接远程服务器docker里的容器--使用remote ssh
背景介绍:因为工作的原因,图像相关,模型
训练
,需要在服务器上面搞,同时,服务器上面的环境配置,全部使用的是docker创建容器的方式。
欢仔要学习
·
2025-03-19 22:28
python
学习
ubuntu
使用TensorFlow、OpenCV和Pygame实现图像处理与游戏开发
安装TensorFlowTensorFlow是一个基于数据流图的开源机器学习框架,提供了丰富的工具和库来构建和
训练
各种深度
UwoiGit
·
2025-03-19 22:25
tensorflow
opencv
pygame
MMScan数据集:首个最大的多模态3D场景数据集,包含层次化的语言标注
数据集的建立,不仅推动了3D场景理解的研究进展,还为
训练
和评估多模态3D感知模型提供了宝贵的资源。
·
2025-03-19 21:28
数据集
深度革命:ResNet 如何用 “残差连接“ 颠覆深度学习
更令人震撼的是,ResNet将神经网络的深度推至152层,彻底打破了"深层网络无法
训练
"的魔咒。这场革命的核心,正是一个简单
安意诚Matrix
·
2025-03-19 20:46
机器学习笔记
深度学习
人工智能
Deepseek的本地化部署软件工具包
选择模型版本参数规模硬件要求(最低)适用场景1.5B/7B8GB内存,无专用
GPU
文本处理、简单问答14B16GB内存+12GB显存代码生成、逻辑推理32B/70B24GB显存+32GB内存企业级复杂任务执行命令
哈拉少12
·
2025-03-19 20:14
人工智能
芯片:CPU和
GPU
有什么区别?
CPU(中央处理器)和
GPU
(图形处理单元)是计算机系统中两种非常重要的处理器,它们各自有不同的设计理念、架构特点以及应用领域。
InnoLink_1024
·
2025-03-19 19:07
AGI
人工智能
人工智能
ai
agi
gpu算力
A SURVEY ON POST-TRAINING OF LARGE LANGUAGE MODELS——大型语言模型的
训练
后优化综述——第9部分——应用
应用尽管预
训练
为大型语言模型(LLMs)赋予了强大的基础能力,但在部署于专业领域时,LLMs仍经常遇到持续的限制,包括上下文长度受限、容易产生幻觉(hallucination)、推理能力欠佳和固有的偏见
王金-太想进步了
·
2025-03-19 19:31
语言模型
人工智能
自然语言处理
Yolov8
训练
自己的数据集(脱离ultralytics库)
比如在使用v8的时候需要安装ultralytics库,然后再调用YOLO进行
训练
或者预测,那么就有这几个问题:问题1:安装了ultralytics库后如何使用YOLO呢
爱吃肉的鹏
·
2025-03-19 17:22
YOLO
迁移学习基础知识
简介使用迁移学习的优势:1、能够快速的
训练
出一个理想的结果2、当数据集较小时也能
训练
出理想的效果。注意:在使用别人预
训练
的参数模型时,要注意别人的预处理方式。
zhooooooou
·
2025-03-19 16:44
深度学习
迁移学习
人工智能
机器学习
迁移学习入门
迁移学习1迁移学习的概念预
训练
模型定义:简单来说别人
训练
好的模型。
EmbodiedTech
·
2025-03-19 16:14
人工智能
大模型
迁移学习
人工智能
机器学习
使用LoRA微调LLaMA3
步骤一:环境搭建安装必要的Python包pipinstalltransformersdatasetstorch配置
GPU
环境确保你的环境中配置了CUDA和cuDNN,并验证
GPU
是否可用。
想胖的壮壮
·
2025-03-19 16:12
深度学习
人工智能
nvidia_uvm 被占用,nvidia-smi 卡死
系统可以识别到多块NVIDIA
GPU
,且驱动模块已加载,但nvidia_uvm被占用,nvidia-smi卡死,通常是由于以下原因导致:可能原因
GPU
资源被占用某些进程正在使用NVIDIA驱动,导致模块无法卸载
guganly
·
2025-03-19 15:08
数据中心运维实战
chrome
前端
服务器
运维
linux
用户行为路径分析(Google Analytics数据挖掘)
目录用户行为路径分析(GoogleAnalytics数据挖掘)1.引言2.项目背景与意义2.1用户行为路径的重要性2.2GoogleAnalytics数据概述2.3数据规模与挑战3.数据集生成与介绍4.数据预处理与
GPU
闲人编程
·
2025-03-19 14:00
Python数据分析实战精要
数据挖掘
人工智能
用户行为路径分析
Analytics
数据分析
用户习惯
Dify知识库构建流程及示例
3.向量化(Embedding)嵌入模型:调用预
训练
cqbelt
·
2025-03-19 14:54
ai
笔记
AI应用
MNIST数据集&手写数字识别
它提供了一种基于数据流图的编程模型,用于构建和
训练
机器学习模型。TensorFlow的核心概念是张量(Tensor)和流图(Graph)。
Zoro|
·
2025-03-19 13:18
keras
tensorflow
人工智能
机器学习
Codeforces Round 995 (Div. 3)
在这第iii天,如果Monocarp准备
训练
,那么他将完成aia_iai题,同样的,如果Stereocarp也在这天准备
训练
,那么他将完成bib_ibi题。
polarours
·
2025-03-19 13:17
Codeforces
算法
c++
数据结构
医疗影像联邦学习可解释性算法研究
本研究以跨机构医疗影像协作场景为核心,系统性探讨联邦学习框架下可解释性算法的创新路径,重点解决医疗AI模型在分布式
训练
中的透明度缺失问题。
智能计算研究中心
·
2025-03-19 11:36
其他
【Python】测试数据生成工具 --- Faker
Faker的应用不仅限于测试,它还广泛应用于数据分析、机器学习
训练
集的准备以及任何需要大量样本数据的场景。Faker安装前提:已安装python、pip安装命令如下:pipinst
·
2025-03-19 11:00
pythonfaker数据分析
算力未来演进与多场景创新
从技术架构层面来看,异构计算通过整合CPU、
GPU
、FPGA等多元芯片实现性能跃升,边缘计算则借助分布式节点降低时延并提升响应效率,而量子计算在特定领域的指数级加速潜力已进入验证阶段。
智能计算研究中心
·
2025-03-19 11:06
其他
融合AMD与NVIDIA
GPU
集群的MLOps:异构计算环境中的分布式
训练
架构实践
随着模型规模不断扩大而预算约束日益严格,2-3年更换一次
GPU
的传统方式已不具可持续性。
·
2025-03-19 11:59
深度学习框架PyTorch——从入门到精通(4)数据转换
转换(Transforms)很多时候,数据并不总是以
训练
机器学习算法所需的最终处理形式出现。所以我们需要使用变换对数据进行一些处理,使其适合
训练
。
Fansv587
·
2025-03-19 11:01
Torch框架学习
深度学习
pytorch
人工智能
python
经验分享
深度学习框架PyTorch——从入门到精通(5)构建神经网络
构建神经网络获取
训练
设备定义类模型层nn.Flattennn.Linearnn.ReLUnn.Sequentialnn.Softmax模型参数补充说明argmax神经网络是由一些层或者模块组成的,这些层和模块会对数据进行各种操作
Fansv587
·
2025-03-19 11:58
Torch框架学习
深度学习
pytorch
神经网络
经验分享
大语言模型的
训练
数据清洗策略
目录大语言模型的
训练
数据清洗策略1.数据去重与标准化问题解决方案示例代码(Python实现数据去重):2.过滤有害内容问题解决方案示例代码(基于关键词过滤有害内容):3.纠正数据不均衡问题解决方案示例代码
gs80140
·
2025-03-19 10:23
AI
python
Megatron-LM
训练
框架和Deepspeed
训练
框架最主要的异同和优劣是什么
核心异同点并行策略Megatron-LM核心:以张量并行(TensorParallelism)和流水线并行(PipelineParallelism)为主,结合数据并行。张量并行通过切分模型层(如注意力头、MLP块)到不同设备,利用NVLink高速通信提升效率。流水线并行将不同层分配到不同设备,通过P2P通信协调。DeepSpeed核心:ZeRO优化技术(ZeroRedundancyOptimize
强化学习曾小健
·
2025-03-19 09:15
人工智能
OctoTools:一个具有复杂推理可扩展工具的智体框架
现有方法使用外部工具增强大语言模型(LLM),但仅限于专业领域、有限的工具类型或需要额外的
训练
数据。本文的OctoTools,是一个无需
训练
、用户友好且易于扩展的
三谷秋水
·
2025-03-19 09:09
智能体
大模型
机器学习
人工智能
语言模型
机器学习
Windows 图形显示驱动开发-WDDM 3.0功能- IOMMU DMA 重新映射(一)
概述直到WDDM3.0,Dxgkrnl仅支持通过1:1物理重新映射实现IOMMU隔离,这意味着
GPU
访问的逻辑页被转换为相同的物理页码。
程序员王马
·
2025-03-19 07:58
windows图形显示驱动开发
驱动开发
Linux中部署DeepSeek R1
DeepSeek-R1本地部署硬件需求表模型规模
GPU
需求CPU需求内存需求存储需求备注1.5B-GTX16504GB(可选)四核i5/Ryzen3000+16GBDDR450GBSSD需4-bit量化
Java探索者 °
·
2025-03-19 07:26
linux
服务器
语言模型
深度学习框架PyTorch——从入门到精通(5)自动微分
使用torch.autograd自动微分张量、函数和计算图计算梯度禁用梯度追踪关于计算图的更多信息张量梯度和雅可比乘积在
训练
神经网络时,最常用的算法是反向传播。
Fansv587
·
2025-03-19 06:20
深度学习
pytorch
人工智能
标签转换脚本 - VOC格式转COCO格式,即voc2coco,xml2json 附VOC及COCO标签格式详解
专栏目录:YOLO
训练
/写作脚本目录一览|涉及标签转换、数据扩充、热力图、感受野、精度曲线、数量统计等近百个脚本文件专栏地址:YOLO
训练
/写作脚本——丰富文章内容,增强实验信服力,助力发文!!!
Limiiiing
·
2025-03-19 04:57
YOLO训练/写作脚本
YOLO
计算机视觉
目标检测
深度学习
标签转换脚本 - VOC格式转YOLO格式,即voc2yolo,xml2txt 附VOC及YOLO标签格式详解
专栏目录:YOLO
训练
/写作脚本目录一览|涉及标签转换、数据扩充、热力图、感受野、精度曲线、数量统计等近百个脚本文件专栏地址:YOLO
训练
/写作脚本——丰富文章内容,增强实验信服力,助力发文!!!
Limiiiing
·
2025-03-19 04:26
YOLO训练/写作脚本
YOLO
深度学习
计算机视觉
目标检测
自建智能算力中心 vs 第三方算力租赁:AI企业的算力博弈与最优解
从ChatGPT到DeepSeek,从自动驾驶到智能医疗,AI模型的
训练
和推理需求呈现指数级增长。在这场技术革命中,算力已成为企业竞争的“命脉”。
·
2025-03-19 03:50
深入
GPU
渲染流水管线:从顶点到像素的微观世界
现代图形硬件的架构解密与优化实践一、渲染流水线全景解析1.经典渲染管线阶段划分应用阶段几何阶段光栅化阶段像素处理阶段输出合并阶段2.现代
GPU
架构演进SIMT架构特性:NVIDIASM(StreamingMultiprocessor
晴空了无痕
·
2025-03-19 01:00
图形学
GPU渲染管线
RAG 在多模态数据处理中的应用探索:结合图像与文本生成
目录引言多模态数据处理的挑战与需求数据异质性与融合难题多样化应用场景的需求RAG在图像与文本生成中的应用架构图像检索与文本生成协同跨模态特征融合与生成关键技术与实现细节图像特征提取与表示文本检索与语义理解跨模态生成模型
训练
应用案例分析智能设计辅助医疗影像报告生成结论引言随着信息技术的飞速发展
hy098543
·
2025-03-18 22:40
AIGC
如何计算一个7B的模型
训练
需要的参数量以及
训练
时需要的计算资源
计算理论过程见:transformer中多头注意力机制的参数量是多少?1.模型参数量的计算7B参数模型的总参数量是70亿(7billion)。这些参数主要分布在以下几个部分:Transformer层:多头注意力机制(Multi-HeadAttention)前馈神经网络(Feed-ForwardNetwork)嵌入层(EmbeddingLayer):词嵌入(TokenEmbeddings)位置编码(
yxx122345
·
2025-03-18 20:59
算法
程序员必看!DeepSeek全栈开发实战指南:从代码生成到性能优化
这两项技术突破对程序员群体意义重大:通信效率飞跃:DeepEP通过NVLink优化实现
GPU
间158GB/s传输速度,后端开发者
训练
大模型时可节省60%集群资源推理性能突破:R1模型在H
AI创享派
·
2025-03-18 20:59
后端
MM-RAIT:多模态检索增强生成(RAG)的认知革命
多模态检索增强生成(RAG)领域迎来了一项里程碑式的突破——MM-RAIT框架通过“评估-
训练
”双轮驱动,显著提升了主流视觉语言模型的RAG性能,增幅达27%至34%。
花生糖@
·
2025-03-18 20:58
AIGC学习资料库
人工智能
深度学习
机器学习
RAG
AI知识库
五、AIGC大模型_05模型的vLLM部署与LangChain调用
0、概述要搭建一个大模型应用服务,通常需要包含以下五层结构,即:基础环境、模型层、推理层、对外接口、外挂应用在了解了模型的微调
训练
之后,本文将以vLLM、OpenAI、LangChain为例,介绍大模型的推理部署以及对外接口开放调用
学不会lostfound
·
2025-03-18 19:20
AI
人工智能
langchain
openai
vLLM
AIGC
PyTorch 深度学习实战(17):Asynchronous Advantage Actor-Critic (A3C) 算法与并行
训练
本文将介绍强化学习领域的重要里程碑——AsynchronousAdvantageActor-Critic(A3C)算法,并展示如何利用PyTorch实现并行化
训练
来加速学习过程。
进取星辰
·
2025-03-18 19:17
PyTorch
深度学习实战
深度学习
pytorch
算法
自建 DeepSeek 时代已来,联网搜索如何高效实现
基于7B/13B参数量的模型在常规
GPU
服务器上即可获得商业级响应效果,配合Higress开源AI网关的增强能力,开发者可快速构建具备实时联网搜索能力的智能问答系统。
·
2025-03-18 18:38
云原生
DeepSeek 3FS 与 JuiceFS:架构与特性比较
在AI业务中,企业需要处理大量的文本、图像、视频等非结构化数据,还需要应对数据量的爆炸式增长,分布式文件系统因此成为AI
训练
的关键存储技术。
·
2025-03-18 18:07
运维人工智能
DeepSeek
训练
数据模板生成指南
DeepSeek
训练
数据模板生成指南(一次生成多条高质量数据集)一、核心数据格式规范1.基础结构(JSONL格式)每条数据需包含prompt(输入指令)和completion(期望输出)两个核心字段,采用单行
He.Tech
·
2025-03-18 18:39
开发语言
yolov4
V4贡献:亲民政策,单
GPU
就能
训练
的非常好,接下来很多小模块都是这个出发点两大核心方法,从数据层面和网络设计层面来进行改善消融实验,感觉能做的都让他给做了,这工作量不轻全部实验都是单
GPU
完成,不用太担心设备了
zzh-
·
2025-03-18 16:28
笔记
【pytorch(cuda)】基于DQN算法的无人机三维城市空间航线规划(Python代码实现)
本文目录如下:目录⛳️赠与读者1概述一、研究背景与意义二、DQN算法概述三、基于DQN的无人机三维航线规划方法1.环境建模2.状态与动作定义3.奖励函数设计4.深度神经网络
训练
5.航线规划四、研究挑战与展望
wlz249
·
2025-03-18 16:28
python
pytorch
算法
【保姆级视频教程(一)】YOLOv12环境配置:从零到一,手把手保姆级教程!| 小白也能轻松玩转目标检测!
文章目录1.FlashAttentionWindows端WHL包下载1.1简介1.2下载链接1.3国内镜像站1.4安装方法2.NVIDIA
GPU
计算能力概述2.1简介2.2计算能力版本与
GPU
型号对照表
一只云卷云舒
·
2025-03-18 16:56
YOLOv12保姆级通关教程
YOLO
YOLOv12
flash
attention
GPU
计算能力
算力
yolov8的第一次实验报告
datasets]数据集大小:[2.68Gb]数据集描述:[数据集主要分两个类别:zdjy_ld,zdjy_gd]注释:占道经营流动,占道经营固定3.模型配置3.1基础配置·模型类型:YOLOv8·预
训练
模型
算法宇宙
·
2025-03-18 16:55
YOLO
人工智能
计算机视觉
李开复:AI 2.0 时代的机遇
然而,深度学习模型的
训练
成本高、数据依赖性强、可解释性差等问题仍然制约着AI技术的进一步发展。李开复先生在《AI2.0时代的机遇》
AGI大模型与大数据研究院
·
2025-03-18 15:52
DeepSeek
R1
&
大数据AI人工智能
java
python
javascript
kotlin
golang
架构
人工智能
YOLOv8n-OBB使用C#在windows10进行部署(CPU)
1.
训练
YOLOv8-OBB模型1.1数据集制作所用标注工具:X-AnyLabeling下载链接:https://github.com/CVHub520/X-AnyLabeling/releases/download
cd_Ww777
·
2025-03-18 15:21
YOLO
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他