E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
人脸训练
深度学习进阶:构建多层神经网络
我们还会使用更复杂的分类任务来
训练
模型,并评估其性能。1.多层神经网络的结构在实际应用中,深度学习模型通常包含多个隐藏层,这种结构被称为深度神经网络(DNN)。多层神经网络能够学习更
孤寂大仙v
·
2025-02-28 12:37
深度学习
神经网络
人工智能
大模型调优方法:提示工程、RAGs 与微调对比
就算是强大的预
训练
LLM也可能无法直接满足项目中的特定需求。
AI大模型探索者
·
2025-02-28 11:03
人工智能
机器学习
深度学习
ai
语言模型
实现一个 RDMA 用户态驱动程序
实际上,高性能、易维护、易定制的网络基础设施对于提升AI
训练
、推理的效率是至关重要的一环。
·
2025-02-28 11:17
pytorch基础-layernormal 与 batchnormal
nn.LayerNorm(层归一化)和nn.BatchNorm(批量归一化)是深度学习中常用的两种归一化方法,都有助于提高模型的
训练
效率和稳定性,但它们在归一化维度、应用场景、计算方式等方面存在明显区别
yuweififi
·
2025-02-28 10:49
pytorch
人工智能
python
通过TensorFlow实现简单深度学习模型(2)
前文我们已经实现了对每批数据的
训练
,下面继续实现一轮完整的
训练
。完整的
训练
循环一轮
训练
就是对
训练
数据的每个批量都重复上述
训练
步骤,而完整的
训练
循环就是重复多轮
训练
。
yyc_audio
·
2025-02-28 10:47
人工智能
深度学习
python
机器学习
Pytorch使用手册—使用TACOTRON2进行文本到语音转换(专题二十四)
一、概述本教程展示了如何使用torchaudio中的预
训练
Tacotron2构建文本到语音的管道。文本到语音的管道流程如下:文本预处理首先,输入的文本被编码为一系列符号。
AI专题精讲
·
2025-02-28 09:43
Pytorch入门到精通
pytorch
人工智能
python
Transformer 代码剖析2 - 模型
训练
(pytorch实现)
参数统计函数defcount_parameters(model):returnsum(p.numel()forpinmodel.parameters()ifp.requires_grad)遍历模型参数筛选可
训练
参数统计参数数量返回总数技术解析
lczdyx
·
2025-02-28 09:38
Transformer代码剖析
transformer
pytorch
深度学习
人工智能
python
Farm3D- Learning Articulated 3D Animals by Distilling 2D Diffusion论文笔记
LearningArticulated3DAnimalsbyDistilling2DDiffusion1.Introduction最近的研究DreamFusion表明,可以通过text-imagegenerator提取高质量的三维模型,尽管该生成模型并未经过三维
训练
Im Bug
·
2025-02-28 07:24
3d
论文阅读
神经网络中的Adagrad
Adagrad(AdaptiveGradient)是一种自适应学习率的优化算法,专门设计用于在
训练
过程中自动调整每个参数的学习率。
化作星辰
·
2025-02-28 07:53
神经网络
人工智能
深度学习
DeepSeek R1 简单指南:架构、
训练
、本地部署和硬件要求
DeepSeek推出的LLM推理新策略DeepSeek最近发表的论文DeepSeek-R1中介绍了一种创新的方法,通过强化学习(RL)提升大型语言模型(LLM)的推理能力。这项研究在如何仅依靠强化学习而不是过分依赖监督式微调的情况下,增强LLM解决复杂问题的能力上,取得了重要进展。DeepSeek-R1技术概述模型架构DeepSeek-R1不是一个单独的模型,而是包括DeepSeek-R1-Zer
爱喝白开水a
·
2025-02-28 07:52
人工智能
AI大模型
DeepSeek
R1
DeepSeek
算法
人工智能训练
大模型部署
【python 机器学习】sklearn ROC曲线与AUC指标
通俗介绍:学术解释:2.在`sklearn`中绘制ROC曲线与计算AUC2.1导入库和数据2.2加载数据集2.3
训练
模型2.4预测概率2.5计算FPR、TPR和AUC2.6绘制ROC曲线3.解析ROC曲线和
人才程序员
·
2025-02-28 06:11
杂谈
机器学习
python
sklearn
人工智能
深度学习
神经网络
目标检测
月之暗面改进并开源了 Muon 优化算法,对行业有哪些影响?
互联网各领域资料分享专区(不定期更新):Sheet正文月之暗面团队改进并开源的Muon优化算法在深度学习和大模型
训练
领域引发了广泛关注,其核心创新在于显著降低算力需求(相比AdamW减少48%的FLOPs
互联网之路.
·
2025-02-28 05:11
知识点
开源
算法
深度解析:大模型开源的真与假
目录大模型企业开闭源策略各异开源大模型的定义与现状开源内容的局限性通常开放的内容实际未开放的关键内容法律与商业模式的约束开源许可证的重要性大模型的定制许可证及其限制性条款商业公司对开源大模型的策略和目的建立生态系统吸引开发者提升品牌形象保持竞争优势技术创新和改进技术与协助开发的挑战
训练
和推理过程的资源需求差异微调和衍生模型的技术实现及其局限性开源大模型在协作开发中的局限总结大模型的发展开启了
rs勿忘初心
·
2025-02-28 05:39
#
AI大模型
大模型
开源闭源对比
开源闭源区别
OpenCV开源机器视觉软件
OpenCV(OpenSourceComputerVisionLibrary)是一个开源的计算机视觉和机器学习软件库,广泛应用于实时图像处理、视频分析、物体检测、
人脸
识别等领域。
视觉人机器视觉
·
2025-02-28 04:03
杂说
opencv
开源
人工智能
DeepSeek开源周第二弹:DeepEP如何用RDMA+FP8让MoE模型飞起来?
一、引言:MoE模型的通信瓶颈与DeepEP的诞生在混合专家(MoE)模型
训练
中,专家间的全对全(All-to-All)通信成为性能瓶颈。
曦紫沐
·
2025-02-28 04:03
大模型
deepseek
利用DSPy优化LangChain RAG系统的实战指南
具体来说,DSPy编译器会在内部追踪你的程序,然后为大型语言模型(LLMs)创建高质量的提示(或为小型LLMs
训练
自动微调),以教会它们任务的步骤。
scaFHIO
·
2025-02-28 04:01
langchain
python
使用LangChain与GPT4All模型进行交互
核心原理解析GPT4All是基于大型语言模型(LLMs)的开源项目,通过
训练
大量干净的数据,能够生成高质量的对话和回答。LangChain是一种用于简化与
bavDHAUO
·
2025-02-28 04:28
langchain
交互
python
前言:什么是大模型微调
大模型微调(Fine-tuning)是指在预
训练
模型的基础上,针对特定的任务或数据集进行进一步
训练
的过程。预
训练
模型通常在大规模的通用数据上
训练
,具备广泛的语言理解和生成能力。
伯牙碎琴
·
2025-02-28 04:26
大模型微调
深度学习
人工智能
机器学习
大模型
微调
训练
游戏语音趋势解析,社交互动有助于营造沉浸式体验
OpenAI的ChatGPT语音模式将语音转语音技术变成了现实,引入了基于音频和文本信息进行端到端预
训练
的模型,这些模型除了文本标记外,还能原生理解和生成音频。
网易数智
·
2025-02-28 03:22
IM即时通讯
游戏
人工智能
音视频
实时音视频
信息与通信
语音识别
深度学习模型优化与医疗诊断应用突破
当前研究聚焦于迁移学习与模型压缩算法的协同创新,通过复用预
训练
模型的泛化能力与降低计算负载,有效解决了医疗数据样本稀缺与硬件资源受限的痛点问题。
智能计算研究中心
·
2025-02-28 02:44
其他
ZeRO分布式
训练
策略
ZeRO分布式
训练
策略详解一、核心设计原理ZeRO(ZeroRedundancyOptimizer)是微软提出的分布式
训练
优化框架,与传统数据并行方法不同,ZeRO通过将模型的参数、梯度和优化器状态分散到多个设备上
AIGC_ZY
·
2025-02-28 02:13
大模型
分布式
【openCV-89】
人脸
检测
人脸
检测简介
人脸
检测是计算机视觉中的一个重要任务,旨在从图像或视频中识别并定位出
人脸
的位置。
华东算法王
·
2025-02-28 02:42
华东算法王-opencv
opencv
人工智能
计算机视觉
《揭秘机器学习中的交叉验证:模型评估的基石》
交叉验证的核心意义抵御过拟合风险在机器学习的
训练
过程中,模型可能会过度适应
训练
数据的细节和噪声,从而在新数据上表现不佳,这就是过拟合现象。交叉验证通过将数据集划分为多个子集,模型在不同子集上
·
2025-02-28 01:03
人工智能机器学习
扩散模型基本概念
1.核心思想从最原始的DDPM来讲,扩散模型是用变分估计
训练
的马尔可夫链,相当于VAE+流模型。与标准化流相比,扩散模型的正向过程为预先定义的加噪过程,负责将图像x∼p(x)x\sim{p(x)}x∼
AndrewHZ
·
2025-02-28 00:57
深度学习新浪潮
扩散模型
计算机视觉
流形学习
生成式模型
深度学习次
深度学习
人工智能
利用GPT开发应用005:Codex、Turbo、ChatGPT、GPT-4
它们是通过截至2021年6月的数据进行
训练
的,并被描述为比之前版本更强大。到2022年11月底,OpenAI开始将这些模型称为GPT-3.5系列的一部分。 Codex系列模型
翰墨之道
·
2025-02-28 00:56
GPT开发
GPT应用专栏
GPT-1
GPT-3
GPT开发
Codex
Turbo
ChatGPT
ASFF算法
这种不一致性干扰了
训练
过程中的梯度计算,降低了特征金字塔的有效性。4.这个问题存在的原因:当一个对象在某一层特征图中被赋值并被视为正值时,其他层特征图
神笔馬良
·
2025-02-28 00:21
Python入门知识
深度学习
人工智能
最全中文对话数据集(不定期更新)
为了提升对话系统的性能,需要大量的高质量对话数据来
训练
和优化模型。然而,中文对话数据相对于英文来说较为稀缺,且质量参差不齐,这限制了中文对话系统的发展。
数据猎手小k
·
2025-02-27 22:06
人工智能
大数据
【保姆级视频教程(二)】YOLOv12
训练
数据集构建:标签格式转换-划分-YAML 配置 避坑指南 | 小白也能轻松玩转目标检测!
【2025全站首发】YOLOv12
训练
数据集构建:标签格式转换-划分-YAML配置避坑指南|小白也能轻松玩转目标检测!
一只云卷云舒
·
2025-02-27 21:03
YOLOv12保姆级通关教程
YOLO
目标检测
人工智能
Ultralytics
数据集
YOLOv12
小白教程
DeepSeek全栈接入指南:从零到生产环境的深度实践
第一章:DeepSeek技术体系全景解析1.1认知DeepSeek技术生态DeepSeek作为新一代人工智能技术平台,构建了覆盖算法开发、模型
训练
、服务部署的全链路技术栈。
量子纠缠BUG
·
2025-02-27 21:30
DeepSeek部署
AI
DeepSeek
人工智能
深度学习
机器学习
2025,AI变现有哪些机遇与挑战?
与此同时,我国大模型领域仍然存在多方面痛点,例如:云端
训练
成本高、高端算力存在“卡脖子”风险、优质数据匮乏、人才缺口、AI算法开源生态仍需强化、数据安全和隐私问题等等,仍是市场
Imagination官方博客
·
2025-02-27 19:41
人工智能
haclon模板匹配
*打开窗口dev_open_window(0,0,512,512,'black',WindowHandle)*显示图像(用于创建模板的图像)read_image(Image,'D:/
训练
照片/4.png
CallZhang210
·
2025-02-27 18:30
haclon
视觉检测
自编码器(Autoencoders)
通过
训练
,自编码器能够学习数据的有效表示,常用于降维和特征提取。相比于独立模型,它的输入输出更灵活,且可以在输入完成后在完成解码。
路野yue
·
2025-02-27 17:55
机器学习
人工智能
深度学习
深度学习重要论文阅读笔记 ResNet (2025.2.26)
文章目录问题背景数据预处理神经网络模型模型性能知识点积累英语单词积累问题背景随着神经网络变得更深(层数变多),模型的
训练
过程也会变得更加困难。
北岛寒沫
·
2025-02-27 16:50
逐界星辰2025
计算机科研
深度学习
论文阅读
笔记
大语言模型原理与工程实践:Transformer 大语言模型预
训练
大语言模型原理与工程实践:Transformer大语言模型预
训练
关键词:大语言模型、预
训练
、Transformer、自监督学习、计算资源、数据处理文章目录大语言模型原理与工程实践:Transformer
AI天才研究院
·
2025-02-27 16:18
计算
ChatGPT
transformer
说话人识别系统原理
它与指纹识别、
人脸
识别等技术一样,都属于生物识别技术的范畴,但有着独特的优势——仅通过声音即可实现身份识别,无需额外的物理接触或视觉捕捉。与语音识别不同,语音识别关注的是语音内容的转写,比
醉心编码
·
2025-02-27 16:14
人工智能基础
编程基础
技术类
人工智能
说话人识别
语音识别
大模型核心技术原理: Transformer架构详解!
严格意义上讲,GPT可能不算是一个模型,更像是一种预
训练
范式,它本身模型架构是基于Transformer,但GPT引入了“预测下一个词”的任务,即不断通过前文内容预测下一个词。
大模型猫叔
·
2025-02-27 16:13
transformer
架构
深度学习
人工智能
学习
机器学习
算法
大模型最新面试题系列:深度学习基础(二)
过拟合是指模型在
训练
数据上表现很好,但在未见过的测试数据上表现不佳。当模型容量较低时,模型可能无法学习到数据中的复杂模式,导致欠拟合,即在
训练
集和测试集上的表现都较差。
人肉推土机
·
2025-02-27 15:08
大模型最新面试题集锦大全
AI编程
人工智能
pytorch
python
面试
Shell Script 编程笔记
考虑下面两个场景:场景一:我们在
训练
深度网络模型过程中保存了10个不同epoch模型。我们希望通过测试集验证每个模型的性能。
huangpg丶
·
2025-02-27 14:04
Supporting
Technology
DeepSeek 高阶应用技术详解(4)
1.引言在前三篇中,我们探讨了DeepSeek的基础功能、分布式
训练
、模型优化、模型解释性、超参数优化以及AutoML的应用。
Evaporator Core
·
2025-02-27 14:33
#
DeepSeek快速入门
DeepSeek进阶开发与应用
deepseek
DeepSeek开源周合集
FlashMLA,核心成就:GPU带宽利用接近理论极限,算力利用效率翻倍;周二:DeepEP,一个高效的MOE架构专家并行通信库:支持高效且优化后的全对全通信使用NVlink和RDMA进行节点内和节点间通信用于
训练
和推理填充的高吞吐量内核用于推理解码的低延迟内核原生支持
Vip.Gong
·
2025-02-27 14:03
人工智能
transformer
chatgpt
文心一言
python
scikit-learn
深度学习
记一次pytorch
训练
loss异常的问题
记一次pytorch
训练
loss异常的问题问题描述使用mmdetection框架
训练
时,某项loss出现异常大的值,比如1781232349724294.000。这个问题只在多卡
训练
时才会出现。
lyyiangang
·
2025-02-27 14:29
pytorch
人工智能
python
机器学习中的过拟合、欠拟合与正则化
在机器学习的世界里,过拟合与欠拟合是模型
训练
过程中常常会遇到的两大问题,而正则化则是应对过拟合的重要手段。理解它们对于构建高性能的机器学习模型至关重要。
喜-喜
·
2025-02-27 14:28
人工智能
机器学习
人工智能
优秀源头定制线束源头供应商-力可欣: 新能源储能线束领域的先行者
公司拥有标准线束生产车间,拥有先进的自动化生产设备和
训练
有素的生产
港澳粤生活网
·
2025-02-27 13:54
人工智能
java调用百度云
人脸
识别API
packagecom.sike.controller;importcom.baidu.aip.face.AipFace;importcom.sike.entity.User;importcom.sike.service.UserService;importjakarta.servlet.http.HttpServletRequest;importorg.json.JSONObject;import
一抓掉一大把
·
2025-02-27 13:21
java
模式识别课程设计:
人脸
识别 背景与问题引入之问题描述
1.2问题描述通过之前的背景介绍可以知道
人脸
识别技术作为计算机视觉和模式识别领域的重要研究方向,已广泛应用于身份验证、安全监控、智能家居等多个领域。
XLYcmy
·
2025-02-27 10:32
模式识别
网络安全
人工智能
课程设计
模式识别
人脸识别
PCA
LLM
KNN 算法优化实战分享
其核心原理是:对于一个待预测样本,计算其与
训练
集中所有样本的距离,选取距离最近的K个样本,根据这K个样本的标签进行投票(分类)或均值计算(回归),从而得到待预测样本的标签。
轻口味
·
2025-02-27 09:55
算法与实践
算法
大模型成本优化实战:从分布式
训练
到量化剪枝,轻松降低AI计算开销
网罗开发(小红书、快手、视频号同名) 大家好,我是展菲,目前在上市企业从事人工智能项目研发管理工作,平时热衷于分享各种编程领域的软硬技能知识以及前沿技术,包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者:《ESP32-C3物联网工程开发实战》图书作者:《SwiftUI入门,进阶与实战》超级个体:CO
网罗开发
·
2025-02-27 08:54
AI
大模型
人工智能
机器学习
深度学习
基于大模型的肺纤维化预测及临床方案研究报告
大模型在医疗领域的应用现状三、肺纤维化相关知识3.1肺纤维化的病因与发病机制3.2肺纤维化的临床症状与诊断方法3.3肺纤维化的治疗现状与挑战四、大模型预测肺纤维化的方法4.1数据收集与预处理4.2模型选择与构建4.3模型
训练
与优化
LCG元
·
2025-02-27 08:52
围术期危险因子
预测模型研究
人工智能
KNN 算法性能跃升秘籍:优化实战,打造高效分类利器!
KNN算法以其原理简单、易于实现、无需显式
训练
等特点,在模式识别、分类、回归等领域得到了广泛应用。
清水白石008
·
2025-02-27 07:16
开发语言
学习笔记
人工智能
算法
分类
机器学习
代码随想录
训练
营DAY07
四数相加classSolution(object):deffourSumCount(self,nums1,nums2,nums3,nums4):""":typenums1:List[int]:typenums2:List[int]:typenums3:List[int]:typenums4:List[int]:rtype:int"""dict={}foriinnums1:forjinnums2:i
程序员正在诞生中
·
2025-02-27 07:15
代码随想录打卡
python
开发语言
算法
哈希算法
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他