E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
pytorch训练lstm
大模型核心技术原理: Transformer架构详解!
严格意义上讲,GPT可能不算是一个模型,更像是一种预
训练
范式,它本身模型架构是基于Transformer,但GPT引入了“预测下一个词”的任务,即不断通过前文内容预测下一个词。
大模型猫叔
·
2025-02-27 16:13
transformer
架构
深度学习
人工智能
学习
机器学习
算法
大模型最新面试题系列:深度学习基础(二)
过拟合是指模型在
训练
数据上表现很好,但在未见过的测试数据上表现不佳。当模型容量较低时,模型可能无法学习到数据中的复杂模式,导致欠拟合,即在
训练
集和测试集上的表现都较差。
人肉推土机
·
2025-02-27 15:08
大模型最新面试题集锦大全
AI编程
人工智能
pytorch
python
面试
深度学习-自学手册
人工智能机器学习神经网络前馈神经网络:没有回路的反馈神经网络:有回路的DNN深度神经网络CNN卷积神经网络RNN循环神经网络
LSTM
是RNN的一种,长短期记忆网络自然语言处理神经网络神经元-分类器Hebb
谁用了尧哥这个昵称
·
2025-02-27 15:37
AI
深度学习
PyTorch
模型安卓部署流程(NCNN)全流程实战(2)代码详细解析
代码来源
PyTorch
模型安卓部署流程(NCNN)全流程实战(1)至于为什么要备注,因为我基础不好,就得一点一点来适合和我一样的慢羊羊学习项目整体结构1.布局文件不解析了比较简单最简单的线性布局main.xml2
咕咕学不会咋办
·
2025-02-27 15:06
pytorch
android
python
Shell Script 编程笔记
考虑下面两个场景:场景一:我们在
训练
深度网络模型过程中保存了10个不同epoch模型。我们希望通过测试集验证每个模型的性能。
huangpg丶
·
2025-02-27 14:04
Supporting
Technology
DeepSeek 高阶应用技术详解(4)
1.引言在前三篇中,我们探讨了DeepSeek的基础功能、分布式
训练
、模型优化、模型解释性、超参数优化以及AutoML的应用。
Evaporator Core
·
2025-02-27 14:33
#
DeepSeek快速入门
DeepSeek进阶开发与应用
deepseek
DeepSeek开源周合集
FlashMLA,核心成就:GPU带宽利用接近理论极限,算力利用效率翻倍;周二:DeepEP,一个高效的MOE架构专家并行通信库:支持高效且优化后的全对全通信使用NVlink和RDMA进行节点内和节点间通信用于
训练
和推理填充的高吞吐量内核用于推理解码的低延迟内核原生支持
Vip.Gong
·
2025-02-27 14:03
人工智能
transformer
chatgpt
文心一言
python
scikit-learn
深度学习
记一次
pytorch
训练
loss异常的问题
记一次
pytorch
训练
loss异常的问题问题描述使用mmdetection框架
训练
时,某项loss出现异常大的值,比如1781232349724294.000。这个问题只在多卡
训练
时才会出现。
lyyiangang
·
2025-02-27 14:29
pytorch
人工智能
python
机器学习中的过拟合、欠拟合与正则化
在机器学习的世界里,过拟合与欠拟合是模型
训练
过程中常常会遇到的两大问题,而正则化则是应对过拟合的重要手段。理解它们对于构建高性能的机器学习模型至关重要。
喜-喜
·
2025-02-27 14:28
人工智能
机器学习
人工智能
优秀源头定制线束源头供应商-力可欣: 新能源储能线束领域的先行者
公司拥有标准线束生产车间,拥有先进的自动化生产设备和
训练
有素的生产
港澳粤生活网
·
2025-02-27 13:54
人工智能
用
PyTorch
玩转数据:从整理到“看图说话
最近在实验室鼓捣深度学习项目,发现
PyTorch
的数据处理流程简直像搭乐高——每个模块都精准卡位。今天就把这套"厨房级"工具链拆解给大家看看,连我这种手残党都能轻松上手。
开心快乐幸福一家人
·
2025-02-27 13:54
pytorch
人工智能
python
RuntimeError: expected dtype Double but got dtype Float
在使用
Pytorch
时报了RuntimeError:expecteddtypeDoublebutgotdtypeFloat这个错误,仔细一查才发现是数据类型的问题。
一穷二白到年薪百万
·
2025-02-27 11:11
报错专栏
深度学习
【
pytorch
_geometric报错】RuntimeError: softmax() Expected a value of type
如果
pytorch
_geometric中的softmax函数报错,声明一下num_nodes变量即可。
一穷二白到年薪百万
·
2025-02-27 11:11
报错专栏
Windows环境安装torch_geometric库报错
查阅了各种资料尝试了各种方法,有的说是因为visualc++buildtools没有安装博客链接,有的说升级conda甚至还有的说卸载
pytorch
重装命,令行如下:condaupdate#升级conda
一穷二白到年薪百万
·
2025-02-27 11:11
报错专栏
python
anaconda
pip
KNN 算法优化实战分享
其核心原理是:对于一个待预测样本,计算其与
训练
集中所有样本的距离,选取距离最近的K个样本,根据这K个样本的标签进行投票(分类)或均值计算(回归),从而得到待预测样本的标签。
轻口味
·
2025-02-27 09:55
算法与实践
算法
大模型成本优化实战:从分布式
训练
到量化剪枝,轻松降低AI计算开销
网罗开发(小红书、快手、视频号同名) 大家好,我是展菲,目前在上市企业从事人工智能项目研发管理工作,平时热衷于分享各种编程领域的软硬技能知识以及前沿技术,包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者:《ESP32-C3物联网工程开发实战》图书作者:《SwiftUI入门,进阶与实战》超级个体:CO
网罗开发
·
2025-02-27 08:54
AI
大模型
人工智能
机器学习
深度学习
基于大模型的肺纤维化预测及临床方案研究报告
大模型在医疗领域的应用现状三、肺纤维化相关知识3.1肺纤维化的病因与发病机制3.2肺纤维化的临床症状与诊断方法3.3肺纤维化的治疗现状与挑战四、大模型预测肺纤维化的方法4.1数据收集与预处理4.2模型选择与构建4.3模型
训练
与优化
LCG元
·
2025-02-27 08:52
围术期危险因子
预测模型研究
人工智能
用
PyTorch
/TensorFlow 搭建简单全连接神经网络
目录用
PyTorch
/TensorFlow搭建简单全连接神经网络网络结构概述1.使用
PyTorch
构建网络2.使用TensorFlow构建网络总结用
PyTorch
/TensorFlow搭建简单全连接神经网络在本篇博客中
gs80140
·
2025-02-27 08:21
AI
pytorch
tensorflow
神经网络
KNN 算法性能跃升秘籍:优化实战,打造高效分类利器!
KNN算法以其原理简单、易于实现、无需显式
训练
等特点,在模式识别、分类、回归等领域得到了广泛应用。
清水白石008
·
2025-02-27 07:16
开发语言
学习笔记
人工智能
算法
分类
机器学习
代码随想录
训练
营DAY07
四数相加classSolution(object):deffourSumCount(self,nums1,nums2,nums3,nums4):""":typenums1:List[int]:typenums2:List[int]:typenums3:List[int]:typenums4:List[int]:rtype:int"""dict={}foriinnums1:forjinnums2:i
程序员正在诞生中
·
2025-02-27 07:15
代码随想录打卡
python
开发语言
算法
哈希算法
《李航 统计学习方法》学习笔记——第八章提升方法
提升方法8.1提升方法AdaBoost8.1.1提升方法的基本思路8.1.2AdaBoost算法8.1.3AdaBoost的例子(代码实现)8.2AdaBoost算法的
训练
误差分析定理8.1AdaBoost
eveiiii
·
2025-02-27 07:39
统计学习
python
机器学习
人工智能
算法
Cassini_Network-Aware Job Schedulingin Machine Learning Clusters
分布式机器学习
训练
工作负载的通信开销占据了
训练
迭代时间的很大一部分,而现有的ML调度器往往忽略了ML
训练
作业的通信模式。
一只积极向上的小咸鱼
·
2025-02-27 07:37
机器学习
人工智能
用于
训练
基于
pytorch
构建的小型字符级语言模型的数据集汇总
前文,我们从零开始基于transformer框架在
pytorch
上构建一个小型字符级语言模型,并编写了完整的python示例,模型是需要
训练
的,所以在原有代码的基础上,我们寻找一些公开的数据集对模型进行
训练
搏博
·
2025-02-27 06:03
大模型
pytorch
语言模型
人工智能
python
学习
机器学习
扣子和DIfy调用deepseek对比分析
又闻言,Dify、TensorFlow、
PyTorch
、Keras、Fastai、HuggingFace等工具可以微调诸如deepseek、chatgpt、doubao等大模型。
ISDF-CodeInkVotex
·
2025-02-27 06:30
人工智能+
科技前沿杂谈
人工智能
AI 平台技术架构设计方案
本方案旨在提供一个全面的AI平台技术架构设计,以满足不同场景下的AI开发、
训练
、部署和管理需求。
数研妙手
·
2025-02-27 03:11
AI技术实践
人工智能
多模态|开源多模态模型Emu3 & 多模态预
训练
模型CLIP对比
Emu3官方介绍我们推出了Emu3,这是一套新的最先进的多模态模型,仅使用next-token预测进行
训练
!通过将图像、文本和视频分词到一个离散空间中,我们在多模态序列的混合上从头开始
训练
单个转换器。
产品媛Gloria Deng
·
2025-02-27 03:08
AI之眼
人工智能
AI
多模态
预训练模型
CLIP
第十三站:卷积神经网络(CNN)的优化
通过对
训练
数据进行各种随机变换,可以生成更多的
训练
样本,帮助模型避免过拟合。常见的数据增强方法:旋转(Rotation):随机旋转图像,增强模型对旋转变换
武狐肆骸
·
2025-02-27 03:08
机器学习
cnn
人工智能
神经网络
智能算法的全面应用:量子计算与自动化学习在各行业的创新路径探索
自动化机器学习算法通过简化模型
训练
和调优的过程,为数据科学家节省了大量时间。可解释性算法则旨在让模型的决策过程更加透明,从而提高用户对算法决策的信任。
智能计算研究中心
·
2025-02-27 03:35
其他
大模型之二十七-语音识别Whisper实例浅析
Whisper简介Whisper是OpenAI于2022年9月开源的一个多语种识别模型,目前支持99种语言,是目前性能最好的开源多语种识别ASR大模型,第一版版使用了68万小时标注好的语料预
训练
模型,而
shichaog
·
2025-02-27 01:55
神经网络&人工智能
语音识别
whisper
人工智能
深入解析 DeepSeek R1:强化学习如何驱动大模型推理能力的进化
引言在AI竞赛日益激烈的时代,DeepSeek-AI推出了DeepSeekR1,试图以强化学习(RL)直接
训练
推理能力,而非仅依赖传统的监督微调(SFT)。
海棠AI实验室
·
2025-02-26 23:07
智元启示录
人工智能
deep
learning
DeepSeek-R1
基于 YOLO 进行车道线检测与目标检测算法研究及开发的一般步骤
以下是关于基于YOLO进行车道线检测与目标检测算法研究及开发的一般步骤和相关内容:1.环境搭建首先确保你的开发环境安装了必要的软件和库,推荐使用Python语言,以下是一些关键库:
PyTorch
:YOLO
pk_xz123456
·
2025-02-26 23:37
python
算法
深度学习
YOLO
目标检测
算法
深度学习批次数据处理的理解
基础介绍在计算机视觉深度学习网络中,在
训练
阶段数据输入通常是一个批次,即不是一次输入单张图片,而是一次性输入多张图片,而神经网络的结构内部一次只能处理一张图片,这时候很自然就会考虑为什么要这样的输入?
_DCG_
·
2025-02-26 22:28
计算机视觉
深度学习
人工智能
安装CUDA以及GPU版本的
pytorch
使用
pytorch
进行深度学习的时候,往往想用GPU进行运算来提高速度。于是搜索便知道了CUDA。下面给出一个自检的建议:检查cuda的版本是否适配自己的GPU。
lskkkkkkkkkkkk
·
2025-02-26 21:53
Python
pytorch
人工智能
python
如何将 DeepSeek 模型与
PyTorch
结合使用
Ollama下载模型验证模型下载本地部署DeepSeek模型使用Flask创建HTTP服务使用PyCharm调用本地服务进一步集成到开发流程封装函数自定义快捷键(可选)✍️相关问答DeepSeek模型与
PyTorch
LCG元
·
2025-02-26 21:52
大模型
pytorch
人工智能
python
医院HIS接入大模型:算力基础设施与
训练
能力的深度剖析与测算
一、引言1.1研究背景与意义在数字化医疗快速发展的当下,医院信息系统(HospitalInformationSystem,HIS)作为医疗信息化的核心枢纽,承载着患者诊疗信息、医院运营管理等关键数据,对提升医疗服务质量、优化医院管理流程起着至关重要的作用。然而,传统HIS在面对日益增长的医疗数据量和复杂的临床需求时,逐渐显露出分析决策能力不足、智能化程度低等短板。随着人工智能技术的飞速发展,大模型
Allen_LVyingbo
·
2025-02-26 21:52
数智化医院2025
健康医疗
人工智能
动态规划
python
论文笔记:Enhancing Sentence Embeddings in Generative Language Models
——>需要较大的
训练
批次,这会消耗大量的计算资源一些前沿的工作将焦点转向了最近开发的生成模型,期望利用其先进的文本理解能力,直接对输入句子进行编码,而无需额外的反向传播由于句子表示和自回归语言建模
UQI-LIUWJ
·
2025-02-26 20:17
论文阅读
语言模型
人工智能
Windows 系统下,使用
PyTorch
的 DataLoader 时,如果 num_workers 参数设置为大于 0 的值,报错
在Windows系统下,使用
PyTorch
的DataLoader时,如果num_workers参数设置为大于0的值,可能会遇到以下错误:RuntimeError:Anattempthasbeenmadetostartanewprocessbeforethecurrentprocesshasfinisheditsbootstrappingphase.Thisprobablymeansthatyoua
张三不嚣张
·
2025-02-26 20:10
pytorch
人工智能
python
DeepSeek-V3:最强开源MoE模型的技术解析与使用指南
目录引言模型概览架构创新:负载均衡策略与
训练
目标预
训练
:追求极致的
训练
效率后
训练
:从DeepSeek-R1进行知识蒸馏模型下载评估结果基础模型标准基准测试上下文窗口聊天模型标准基准测试(大于67B的模型
认识祂
·
2025-02-26 19:10
deepseek
开源
deepseek
DeepSeep开源周,第三天:DeepGEMM是啥?
矩阵乘法(GEMM)是深度学习模型的核心运算(如全连接层、卷积层等),其性能直接影响
训练
和推理效率。
程序员差不多先生
·
2025-02-26 19:33
pytorch
从零开始:使用
PyTorch
构建DeepSeek R1模型及其
训练
详解
本文将引导你使用
PyTorch
从零开始构建DeepSeekR1模型,并详细解释模型架构和
训练
步骤。
陆鳐LuLu
·
2025-02-26 19:02
pytorch
人工智能
python
pytorch
PIL对np和tensor 图像数据的显示
(显示图像)PIL可以显示np的图像数据,np是whc的格式。在np转换为tenser格式后会自动转换为cWH的格式,tenser再转回来时,依然是cwh格式np.tranpose(1,2,0)可以将cwh格式转换为whc的格式,也就是将原来的0,1,2代表的cwh,变成whc格式代码表示是====互转的代码“tensor_a=torch.tensor(array),np_array=tensor
Tianwen_Burning
·
2025-02-26 19:32
pytorch深度学习
pytorch
python
什么是RAG?RAG是如何解决问题的?RAG的未来发展趋势有哪些?
二、为什么会出现RAGRAG的出现,是因为在大模型的广泛应用中,伴随着出现的一些问题,比如:知识的局限性:模型自身的知识完全源于它的
训练
数据,而现有的主流大模
大模型综述
·
2025-02-26 18:31
人工智能
开发语言
大模型
AGI
ai
RAG
自然语言处理
DeepSeek 开源周:DeepEP 项目详解,GPU 压榨计划启动!
本文将详细介绍DeepEP的功能、应用场景以及如何使用它来提升AI
训练
和推理的效率。DeepEP概述功能与作用DeepEP是一个专门针对Mixture-of-Experts(
东方佑
·
2025-02-26 18:29
量子变法
开源
一文读懂 AI 大模型备案:万字详解全流程要点
它确保大模型在整个生命周期,从开发、
训练
到部署和应用,都严格遵循相关法律
chuangfumao
·
2025-02-26 17:25
人工智能
IPEX-LLM: 英特尔硬件大语言模型加速库部署
本指南将帮助你掌握如何使用IPEX-LLM(Intel
PyTorch
ExtensionforLargeLanguageModels)在英特尔硬件上实现最优化的模型部署。
Felix_bin
·
2025-02-26 17:23
语言模型
人工智能
自然语言处理
DeepSeek各模型现有版本对比分析
文章目录一、基础模型系列:V1到V3的演进二、专用模型系列:推理与多模态三、版本选型与商业化趋势DeepSeek作为最近特别火爆的模型,本文将对DeepSeek现有的主要版本进行对比分析,涵盖参数规模、
训练
数据
墨染夜雨笺
·
2025-02-26 17:22
DeepSeek
AI
在Intel GPU上使用IPEX-LLM进行本地BGE嵌入
Intel的IPEX-LLM是一种专门为IntelCPU和GPU优化的
PyTorch
库,能够在包括本地PC上的集成显卡和独立显卡(如Arc、Flex和Max)在内的Intel硬件上以极低的延迟运行大型语言模型
shuoac
·
2025-02-26 16:16
python
正则化技术和模型融合等方法提高模型的泛化能力
正则化技术原理正则化是通过在损失函数中添加一个正则化项,来限制模型的复杂度,防止模型过拟合
训练
数据,从而提高模型在未见过数据上的泛化能力。
小赖同学啊
·
2025-02-26 15:36
人工智能
人工智能
蓝桥杯备赛-基础
训练
(三)哈希表 day16
今天一更赎金信题意:给定一个赎金信(ransom)字符串和一个杂志(magazine)字符串,判断第一个字符串ransom能不能由第二个字符串magazines里面的字符构成。如果可以构成,返回true;否则返回false。(题目说明:为了不暴露赎金信字迹,要从杂志上搜索各个需要的字母,组成单词来表达意思。杂志字符串中的每个字符只能在赎金信字符串中使用一次。)注意:你可以假设两个字符串均只含有小写
清墨璃笙
·
2025-02-26 14:28
蓝桥杯
散列表
算法
数据结构
python
全市场大模型分类及对比分析报告
2.大模型分类根据模型架构、
训练
目标和应用领域,全市场的
早退的程序员
·
2025-02-26 13:53
分类
数据挖掘
人工智能
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他