E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
word2vec模型训练
卷积核在初始阶段的数据是怎么获取的
卷积核的初始化随机初始化:在大多数情况下,卷积核(滤波器)的权重在
模型训练
开始时是随机初始化的。常用的随机初始化方法包括以下几种:均匀分布初始化:权重从一个均匀分布中抽取值。
abments
·
2025-03-02 06:05
人工智能
深度学习
人工智能
深度学习开源数据集大全:从入门到前沿
在深度学习中,数据是
模型训练
的基石。本文整理了当前最常用且高质量的开源数据集,涵盖图像、视频、自然语言处理(NLP)、语音与音频等方向,帮助研究者和开发者快速定位所需资源。
念九_ysl
·
2025-03-01 19:48
AI
人工智能
【探商宝】DeepSeek开源周第四弹:双向流水并行与专家负载均衡技术解析
引言在千亿级大
模型训练
领域,计算资源利用率与通信效率是制约训练速度的核心瓶颈。
探熵科技
·
2025-03-01 15:19
数据分析
人工智能
YOLOv8 赋能道路状况检测:革新交通基础设施监测
一)检测原理(二)相较于传统方法的优势二、YOLOv8在道路状况检测中的具体应用实例(一)裂缝检测(二)坑洼检测(三)积水检测三、基于YOLOv8的道路状况检测流程(一)图像采集(二)数据预处理(三)
模型训练
与评估
他是只猫
·
2025-03-01 14:15
YOLOv8
在交通领域的应用
YOLO
目标跟踪
人工智能
yolo位姿估计实验
目录介绍实验过程2.1数据集下载2.2模型和数据配置文件修改2.3
模型训练
参考链接1.介绍1.1简介YOLOv8-Pose是基于YOLOv4算法的姿势估计模型,旨在实现实时高效的人体姿势估计。
jarreyer
·
2025-03-01 14:15
YOLO
大
模型训练
与微调(4)——Top-k 和 Top-p 采样策略介绍
大
模型训练
与微调(4)——Top-k和Top-p采样策略介绍**一、Top-k采样****1.核心思想****2.数学实现****3.示例****4.特点****二、Top-p(Nucleus)采样**
John_今天务必休息一天
·
2025-03-01 12:33
自然语言处理
深度学习
算法
python
chatgpt
人工智能
OpenCV 入门(六) —— Android 下的人脸识别
OpenCV入门系列:OpenCV入门(一)——OpenCV基础OpenCV入门(二)——车牌定位OpenCV入门(三)——车牌筛选OpenCV入门(四)——车牌号识别OpenCV入门(五)——人脸识别
模型训练
与
tmacfrank
·
2025-03-01 07:53
Android
#
NDK
opencv
android
人工智能
计算机视觉与机器学习之文档解析与向量化技术加速多模态大
模型训练
与应用——文件向量化大模型!
目录前言1、TextIn文档解析技术1.1、文档解析技术1.2、目前存在的问题1.2.1、不规则的文档信息示例1.3、合合信息的文档解析1.3.1、合合信息的TextIn文档解析技术架构1.3.2、版面分析关键技术Layout-engine1.3.3、文档树提取关键技术Catalog-engine1.3.4、双栏1.3.5、非对称双栏1.3.6、双栏+表格1.3.7、无线表格1.3.8、合并单元格
知世不是芝士
·
2025-03-01 04:57
计算机视觉
人工智能
大语言模型
ai大模型
多模态大模型
机器学习
LLM
深入理解PyTorch
模型训练
所需的数据集
在PyTorch中,
模型训练
的核心是数据集(Dataset)。数据集是
模型训练
的基础,它提供了
模型训练
所需的所有输入数据和对应的标签。理解数据集的结构、加载方式以及如何预处理数据是成功训练模型的关键。
mosquito_lover1
·
2025-03-01 03:20
pytorch
人工智能
python
DeepSeek 最新发布 DeepEP:一款用于 MoE
模型训练
和推理的开源 EP 通信库
采用Mixture-of-Experts(MoE)架构的大型语言模型在没有相应计算量增加的情况下显著提升了模型容量。然而,这种方法也引入了一些挑战,尤其是在GPU之间的通信方面。在MoE模型中,对于任何给定的token,只有一部分专家是活跃的,因此在设备之间高效地交换数据至关重要。传统的全对全(all-to-all)通信方法可能会造成瓶颈,增加延迟,并导致GPU资源利用不足。在对延迟敏感的场景中,
强哥之神
·
2025-03-01 01:37
人工智能
LLM
机器学习
Latent
Space
语言模型
deepseek
目标检测YOLO实战应用案例100讲-面向无人机图像的小目标检测
目录知识储备YOLOv8无人机拍摄视角小目标检测数据集结构环境部署说明安装依赖
模型训练
权重和指标可视化展示训练YOLOv8PyQt5GUI开发主窗口代码main_window.py使用说明无人机目标跟踪一
林聪木
·
2025-02-28 19:00
无人机
目标检测
人工智能
基于深度学习的SSD口罩识别项目完整资料版(视频教程+课件+源码+数据)
算法原理回顾.mp403数据集收集.mp404自定义数据集.mp405生成anchors.mp406展示anchors.mp407计算iou值.mp408计算target.mp409定义模型.mp410
模型训练
AI方案2025
·
2025-02-28 18:54
深度学习
人工智能
基于Python实现的【机器学习】小项目教程案例
以下是一个基于Python实现的【机器学习】小项目教程案例,结合的经典案例与最佳实践,涵盖数据预处理、
模型训练
与评估全流程,并附详细代码说明与结果分析:案例1:鸢尾花分类(SVM算法)数据集:IrisDataset
xinxiyinhe
·
2025-02-28 16:03
人工智能
github
python
机器学习
低代码革命:基于DeepSeek微调模型实现前端代码自动生成与私有JS API调用的实战指南
从
模型训练
、代码生成到API集成,提供全面的实战方法论,结合CodeBLEU评估指标与异步调用优化技巧,确保代码质量与执行效率。
Light60
·
2025-02-28 15:58
低代码
实战篇
AI应用
低代码开发
DeepSeek
微调模型
JavaScript
API
智能生成
Transformer 代码剖析2 -
模型训练
(pytorch实现)
一、模型初始化模块参考:项目代码1.1参数统计函数defcount_parameters(model):returnsum(p.numel()forpinmodel.parameters()ifp.requires_grad)遍历模型参数筛选可训练参数统计参数数量返回总数技术解析:numel()方法计算张量元素总数requires_grad筛选需要梯度更新的参数统计结果反映模型复杂度,典型Tran
lczdyx
·
2025-02-28 09:38
Transformer代码剖析
transformer
pytorch
深度学习
人工智能
python
月之暗面改进并开源了 Muon 优化算法,对行业有哪些影响?
互联网各领域资料分享专区(不定期更新):Sheet正文月之暗面团队改进并开源的Muon优化算法在深度学习和大
模型训练
领域引发了广泛关注,其核心创新在于显著降低算力需求(相比AdamW减少48%的FLOPs
互联网之路.
·
2025-02-28 05:11
知识点
开源
算法
DeepSeek开源周第二弹:DeepEP如何用RDMA+FP8让MoE模型飞起来?
一、引言:MoE模型的通信瓶颈与DeepEP的诞生在混合专家(MoE)
模型训练
中,专家间的全对全(All-to-All)通信成为性能瓶颈。
曦紫沐
·
2025-02-28 04:03
大模型
deepseek
ZeRO分布式训练策略
ZeRO通过三级分片策略消除内存冗余,实现超大规模
模型训练
。其核心演进路线分为三个阶段:1.1ZeRO-1:优化器状态分片分片对象:优化器参数(如Ad
AIGC_ZY
·
2025-02-28 02:13
大模型
分布式
DeepSeek全栈接入指南:从零到生产环境的深度实践
第一章:DeepSeek技术体系全景解析1.1认知DeepSeek技术生态DeepSeek作为新一代人工智能技术平台,构建了覆盖算法开发、
模型训练
、服务部署的全链路技术栈。
量子纠缠BUG
·
2025-02-27 21:30
DeepSeek部署
AI
DeepSeek
人工智能
深度学习
机器学习
机器学习中的过拟合、欠拟合与正则化
在机器学习的世界里,过拟合与欠拟合是
模型训练
过程中常常会遇到的两大问题,而正则化则是应对过拟合的重要手段。理解它们对于构建高性能的机器学习模型至关重要。
喜-喜
·
2025-02-27 14:28
人工智能
机器学习
人工智能
基于大模型的肺纤维化预测及临床方案研究报告
大模型在医疗领域的应用现状三、肺纤维化相关知识3.1肺纤维化的病因与发病机制3.2肺纤维化的临床症状与诊断方法3.3肺纤维化的治疗现状与挑战四、大模型预测肺纤维化的方法4.1数据收集与预处理4.2模型选择与构建4.3
模型训练
与优化
LCG元
·
2025-02-27 08:52
围术期危险因子
预测模型研究
人工智能
智能算法的全面应用:量子计算与自动化学习在各行业的创新路径探索
自动化机器学习算法通过简化
模型训练
和调优的过程,为数据科学家节省了大量时间。可解释性算法则旨在让模型的决策过程更加透明,从而提高用户对算法决策的信任。
智能计算研究中心
·
2025-02-27 03:35
其他
零基础学习机器学习分类模型
模型训练
和评估:使用经典的分类算法——逻辑回归。代码解释:逐步分析代码实现。拓展内容:如何优化和扩展该项目。1.原理介绍1.1机器学习基本概念机器学习(
可喜~可乐
·
2025-02-26 12:14
机器学习
机器学习
学习
分类
人工智能
数据挖掘
总结yolov8做检测训练时所需要的代码
运行
模型训练
脚本代码:大家可以先在ultralytics/ultralytics文件夹下新建一个mytrain.py,然后直接复制下面的代码,所有训练有关的超参数都可以在这个文件中调节,不懂超参数可以忽略
小胡学长
·
2025-02-26 08:13
YOLO
人工智能
深度学习
yolov8
python
1024程序员节
基于深度学习的行人跌倒检测系统:UI 界面 + YOLOv5 + 数据集详解
目录引言系统设计概述数据集准备数据集选择数据预处理data.yaml文件模型选择与训练YOLOv5介绍
模型训练
步骤用户界
深度学习&目标检测实战项目
·
2025-02-26 03:45
深度学习
ui
YOLO
目标检测
人工智能
GLake:优化GPU内存管理与IO传输的开源项目
GLake:突破GPU内存和IO瓶颈的利器在人工智能快速发展的今天,大
模型训练
和推理正面临着严峻的挑战。
2401_87458718
·
2025-02-26 02:35
开源
高压输电线故障检测数据集 YOLO 格式
数据集介绍高压输电线故障检测数据集是一个专为电力行业AI
模型训练
设计的高质量数据集,支持YOLO格式的方框标注,适用于目标检测任务。数据集特点图像数量:1912张高质量图像,涵盖多种场景和光照条件。
幽络源小助理
·
2025-02-25 12:27
幽络源资料分享
人工智能
机器学习
深度学习
免费 MLOps 课程:学习机器学习运维的完整流程
免费MLOps课程概览(DataTalks.Club提供)课程平台:DataTalks.Club适合人群:有一定Python和ML经验的开发者重点内容:
模型训练
、实验跟踪、流水线构建、模型部署、监控和DevOps
真智AI
·
2025-02-25 05:11
学习
机器学习
运维
免费教程
使用Diffusion Models进行图像超分辩重建
目录贡献概述动机方法详解
模型训练
论文贡献概述这项研究提出了一种基于扩散逆过程的新图像
沉迷单车的追风少年
·
2025-02-25 04:32
Diffusion
Models与深度学习
人工智能
计算机视觉
超分辨率重建
AIGC
深度学习
联邦学习与边缘模型优化赋能医疗诊断新路径
联邦学习框架通过分布式
模型训练
机制,有效破解医疗机构间的数据壁垒,使跨机构的医学影像、病理数据在不离开本地服务器的前提下完成知识共享。
智能计算研究中心
·
2025-02-25 03:26
其他
基于Python开发的使用多个单视图特征融合的基于图卷积网络(GCN)的肺结节检测系统的示例
模型训练
:使用训练数据对模型进行训练。模型评估:使
go5463158465
·
2025-02-24 20:06
python
深度学习
算法
python
迁移学习
开发语言
DeepSeek混合精度训练核心技术解析与实践指南
和FP32数据格式,在保证模型精度的前提下实现:40-60%显存占用降低(ResNet50案例:从7.8GB降至4.2GB)1.5-3倍训练速度提升(BERT-Large案例:从8h缩短至5h)突破大
模型训练
显存瓶颈
燃灯工作室
·
2025-02-24 15:33
Deepseek
数据挖掘
语音识别
计算机视觉
目标检测
机器学习
人工智能
AI如何预测比赛结果:体育预测技术全解析
一、系统架构设计1.整体架构数据采集层数据处理层
模型训练
层预测服务层应用展示层2.技术选型Python3.8+TensorFlow/PyTorchScikit-learnPandas/NumpyFlask
翱翔的猪脑花
·
2025-02-23 17:54
人工智能
大语言
模型训练
数据集格式
1.SFT(有监督微调)的数据集格式对于大语言模型的训练中,SFT(SupervisedFine-Tuning)的数据集格式可以采用以下方式:输入数据:输入数据是一个文本序列,通常是一个句子或者一个段落。每个样本可以是一个字符串或者是一个tokenized的文本序列。标签数据:标签数据是与输入数据对应的标签或类别。标签可以是单个类别,也可以是多个类别的集合。对于多分类任务,通常使用one-hot编
香菜烤面包
·
2025-02-23 16:13
#
AI
大模型
语言模型
人工智能
深度学习
大
模型训练
&& 微调数据格式
1.SFT(有监督微调)的数据集格式?对于大语言模型的训练中,SFT(SupervisedFine-Tuning)的数据集格式可以采用以下方式:输入数据:输入数据是一个文本序列,通常是一个句子或者一个段落。每个样本可以是一个字符串或者是一个tokenized的文本序列。标签数据:标签数据是与输入数据对应的标签或类别。标签可以是单个类别,也可以是多个类别的集合。对于多分类任务,通常使用one-hot
comli_cn
·
2025-02-23 16:43
大模型笔记
人工智能
大模型
深度学习之图像回归(二)
(一)主要是帮助迅速入门理清一个深度学习项目的逻辑这篇文章则主要注重在此基础上对于数据预处理和
模型训练
进行优化前者会通过涉及PCA主成分分析特征选择后者通过正则化数据预处理数据预处理的原因思路链未经过处理的原始数据存在一些问题
zhengyawen666
·
2025-02-23 05:52
深度学习
回归
数据挖掘
人工智能
word2vec
(一) CBOW与Skip-Gram模型基础
Word2Vec
其实就是通过学习文本来用词向量的方式表征词的语义信息,即通过一个嵌入空间使得语义上相似的单词在该空间内距离很近。
浮汐
·
2025-02-22 18:24
自然语言处理
python自然语言处理—
Word2vec
模型之Skip-gram
Word2vec
模型之Skip-gram(跳字)模型一、skip-gram模型图二、skip-gram模型图示例说明举个例子来说明这个图在干嘛:1、假设我们的文本序列有五个词,["the","man",
诗雨时
·
2025-02-22 18:53
python
word2vec
之skip-gram算法原理
skip-gram算法原理1.input,output,targetinput的某个单词的one-hot编码(11000词汇量的总数目)output其他所有单词的概率(softmax输出也是11000)target是相近单词的one-hot形式2.Losstarget和output的矩阵的交叉熵最小or平方差最小3.NNet3.1隐层300个神经元,需要训练的权重矩阵大小是1000300本层的输出
cuixuange
·
2025-02-22 18:52
推荐算法
word2vec
skipgram
AIGC训练效率与模型优化的深入探讨
文章目录1.AIGC概述2.AIGC
模型训练
效率的重要性3.模型优化的概念与目标4.模型优化策略4.1学习率调节4.2模型架构选择4.3数据预处理与增强4.4正则化技术4.5量化与剪枝5.代码示例6.结论人工智能领域的发展
DARLING Zero two♡
·
2025-02-22 13:18
话题
AIGC
LangChain-基础(prompts、序列化、流式输出、自定义输出)
LangChain-基础我们现在使用的大
模型训练
数据都是基于历史数据训练出来的,它们都无法处理一些实时性的问题或者一些在训练时为训练到的一些问题,解决这个问题有2种解决方案基于现有的大模型上进行微调,使得它能适应这些问题
JolyouLu
·
2025-02-22 10:55
AI
langchain
prompts
人工智能
Ai
Agent
python
DeepSeek 学习路线图
概率统计:理解贝叶斯理论和概率分布,用于
模型训练
和推理。微积分:了解优化算法中的梯度下降等概念。2.编程基础Python:掌握Python编程,这是深度学习和AI开发的主要语言
CarlowZJ
·
2025-02-22 09:14
学习
deepseek
如何评估代理IP服务对AI大
模型训练
的影响
2023年某头部AI公司的内部报告显示,在分布式训练场景下,因代理IP配置不当导致的算力浪费平均达15%。工程师们往往更关注GPU型号或算法优化,却容易忽略网络链路这个隐形变量。本文将以可复现的测试方法,拆解代理IP对训练效果的三大影响维度,手把手教您建立科学的评估体系。一、影响因子的精准拆解代理IP对训练效果的影响主要体现在三个层面:1.数据流速波动当爬虫节点通过代理IP采集训练数据时,实测
·
2025-02-22 08:33
http
【深度学习】预训练和微调概述
预训练和微调概述1.预训练和微调的介绍1.1预训练(Pretraining)1.2微调(Fine-Tuning)2.预训练和微调的区别预训练和微调是现代深度学习
模型训练
中的两个关键步骤,它们通常是一个预训练
CS_木成河
·
2025-02-21 22:35
深度学习
深度学习
人工智能
语言模型
预训练
微调
基于深度学习的钢材表面缺陷检测系统:UI界面 + R-CNN + 数据集
内容涵盖从数据准备、R-CNN
模型训练
到UI界面设计
深度学习&目标检测实战项目
·
2025-02-21 21:30
R-CNN检测系统
深度学习
ui
r语言
开发语言
计算机视觉
cnn
人工智能
神经网络
模型训练
中的相关概念:Epoch,Batch,Batch size,Iteration
神经网络
模型训练
中的相关概念如下:Epoch(时期/回合):当一个完整的数据集通过了神经网络一次并且返回了一次,这个过程称为一次epoch。
一杯水果茶!
·
2025-02-21 16:39
视觉与网络
神经网络
batch
epoch
Iteration
机器学习—逻辑回归
目录1、基础概念1.1、什么是逻辑回归1.2、逻辑回归与线性回归的区别1.3应用场景2、逻辑回归模型2.1、模型定义2.2、Sigmoid函数2.3、决策边界2.4、概率解释3、
模型训练
3.1、损失函数
60岁的程序猿
·
2025-02-21 14:22
1024程序员节
机器学习
逻辑回归
人工智能
算法
模型压缩-模型蒸馏、模型剪枝、模型量化
一、模型蒸馏1.1蒸馏简介知识蒸馏是指通过教师模型指导学生
模型训练
,通过蒸馏的方式让学生模型学习到教师模型的知识,最终使学生模型达到或媲美教师模型的准确度。
NLP的小Y
·
2025-02-21 08:39
剪枝
机器学习
nlp
语言模型
图像检测分析难题?三维天地引入YOLO目标检测技术带来全新解决方案!
然而,传统的图像处理方法面临着诸多挑战,如庞大的数据量、复杂的特征提取、漫长的
模型训练
周期以及复杂的公式计算等。这些问题不仅限制了检测的效率,还对结果的准确性产生了负面影响。
资讯分享周
·
2025-02-21 08:02
YOLO
目标检测
人工智能
利用深度学习进行汇率预测:LSTM与Transformer模型的应用实践
第一部分:数据收集与准备1.1数据集介绍1.2数据准备第二部分:使用LSTM模型进行汇率预测2.1数据序列化2.2LSTM模型构建2.3
模型训练
与评估2.4结果可视化第三部分:使用Transformer
人工智能_SYBH
·
2025-02-21 06:53
深度学习
lstm
transformer
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他