E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
GPU训练
代码随想录
训练
营DAY07
四数相加classSolution(object):deffourSumCount(self,nums1,nums2,nums3,nums4):""":typenums1:List[int]:typenums2:List[int]:typenums3:List[int]:typenums4:List[int]:rtype:int"""dict={}foriinnums1:forjinnums2:i
程序员正在诞生中
·
2025-02-27 07:15
代码随想录打卡
python
开发语言
算法
哈希算法
《李航 统计学习方法》学习笔记——第八章提升方法
提升方法8.1提升方法AdaBoost8.1.1提升方法的基本思路8.1.2AdaBoost算法8.1.3AdaBoost的例子(代码实现)8.2AdaBoost算法的
训练
误差分析定理8.1AdaBoost
eveiiii
·
2025-02-27 07:39
统计学习
python
机器学习
人工智能
算法
Cassini_Network-Aware Job Schedulingin Machine Learning Clusters
研究背景背景介绍:这篇文章的研究背景是深度学习数据集和模型规模的不断增长,对高效
GPU
集群的需求日益增加。
一只积极向上的小咸鱼
·
2025-02-27 07:37
机器学习
人工智能
用于
训练
基于pytorch构建的小型字符级语言模型的数据集汇总
前文,我们从零开始基于transformer框架在pytorch上构建一个小型字符级语言模型,并编写了完整的python示例,模型是需要
训练
的,所以在原有代码的基础上,我们寻找一些公开的数据集对模型进行
训练
搏博
·
2025-02-27 06:03
大模型
pytorch
语言模型
人工智能
python
学习
机器学习
NVIDIA CUDA Compiler Driver NVCC
`--list-
gpu
-code`(`-code-ls`)4.2.8.24.
Yongqiang Cheng
·
2025-02-27 05:23
NVIDIA
GPU
-
CUDA
-
cuDNN
NVIDIA
CUDA
Compiler
NVCC
cosyvoice自用的代码
fromcosyvoice.cli.cosyvoiceimportCosyVoice,CosyVoice2fromcosyvoice.utils.file_utilsimportload_wavimporttorchaudioimportonnxruntimeasort#设置使用
GPU
ort.set
PyAIGCMaster
·
2025-02-27 05:22
我买了个服务器
人工智能
AI 平台技术架构设计方案
本方案旨在提供一个全面的AI平台技术架构设计,以满足不同场景下的AI开发、
训练
、部署和管理需求。
数研妙手
·
2025-02-27 03:11
AI技术实践
人工智能
多模态|开源多模态模型Emu3 & 多模态预
训练
模型CLIP对比
Emu3官方介绍我们推出了Emu3,这是一套新的最先进的多模态模型,仅使用next-token预测进行
训练
!通过将图像、文本和视频分词到一个离散空间中,我们在多模态序列的混合上从头开始
训练
单个转换器。
产品媛Gloria Deng
·
2025-02-27 03:08
AI之眼
人工智能
AI
多模态
预训练模型
CLIP
第十三站:卷积神经网络(CNN)的优化
通过对
训练
数据进行各种随机变换,可以生成更多的
训练
样本,帮助模型避免过拟合。常见的数据增强方法:旋转(Rotation):随机旋转图像,增强模型对旋转变换
武狐肆骸
·
2025-02-27 03:08
机器学习
cnn
人工智能
神经网络
智能算法的全面应用:量子计算与自动化学习在各行业的创新路径探索
自动化机器学习算法通过简化模型
训练
和调优的过程,为数据科学家节省了大量时间。可解释性算法则旨在让模型的决策过程更加透明,从而提高用户对算法决策的信任。
智能计算研究中心
·
2025-02-27 03:35
其他
LM_Funny-2-01 递推算法:从数学基础到跨学科应用
目录第一章递推算法的数学本质1.1形式化定义与公理化体系定理1.1(完备性条件)1.2高阶递推的特征分析案例:Gauss同余递推4第二章工程实现优化技术2.1内存压缩的革新方法滚动窗口策略分块存储技术2.2异构计算加速方案
GPU
王旭·wangxu_a
·
2025-02-27 01:25
算法
大模型之二十七-语音识别Whisper实例浅析
Whisper简介Whisper是OpenAI于2022年9月开源的一个多语种识别模型,目前支持99种语言,是目前性能最好的开源多语种识别ASR大模型,第一版版使用了68万小时标注好的语料预
训练
模型,而
shichaog
·
2025-02-27 01:55
神经网络&人工智能
语音识别
whisper
人工智能
深入解析 DeepSeek R1:强化学习如何驱动大模型推理能力的进化
引言在AI竞赛日益激烈的时代,DeepSeek-AI推出了DeepSeekR1,试图以强化学习(RL)直接
训练
推理能力,而非仅依赖传统的监督微调(SFT)。
海棠AI实验室
·
2025-02-26 23:07
智元启示录
人工智能
deep
learning
DeepSeek-R1
理解CPU与
GPU
频繁数据传输
基础理解在学习深度学习神经网络过程中,有时候会遇到一些描述“尽量避免CPU与
GPU
频繁数据传输”。那这句话应该如何理解呢?我们知道CPU可以访问内存,而
GPU
也有自己的显存。
_DCG_
·
2025-02-26 22:58
计算机视觉
深度学习
神经网络
CPU
GPU
数据传输
深度学习批次数据处理的理解
基础介绍在计算机视觉深度学习网络中,在
训练
阶段数据输入通常是一个批次,即不是一次输入单张图片,而是一次性输入多张图片,而神经网络的结构内部一次只能处理一张图片,这时候很自然就会考虑为什么要这样的输入?
_DCG_
·
2025-02-26 22:28
计算机视觉
深度学习
人工智能
IPU概述
1.IPU概述(一)框架首先来看看imx6q整体系统框架图,看看IPU位于整个SOC系统中的位置:可以看出来,整个IPU挂接在AXI与AHB总线上面,通过总线,它可以与ARM,VPU,
GPU
和RAM等模块通信
深圳信迈主板定制专家
·
2025-02-26 21:24
DSP+ARM
安装CUDA以及
GPU
版本的pytorch
使用pytorch进行深度学习的时候,往往想用
GPU
进行运算来提高速度。于是搜索便知道了CUDA。下面给出一个自检的建议:检查cuda的版本是否适配自己的
GPU
。
lskkkkkkkkkkkk
·
2025-02-26 21:53
Python
pytorch
人工智能
python
医院HIS接入大模型:算力基础设施与
训练
能力的深度剖析与测算
一、引言1.1研究背景与意义在数字化医疗快速发展的当下,医院信息系统(HospitalInformationSystem,HIS)作为医疗信息化的核心枢纽,承载着患者诊疗信息、医院运营管理等关键数据,对提升医疗服务质量、优化医院管理流程起着至关重要的作用。然而,传统HIS在面对日益增长的医疗数据量和复杂的临床需求时,逐渐显露出分析决策能力不足、智能化程度低等短板。随着人工智能技术的飞速发展,大模型
Allen_LVyingbo
·
2025-02-26 21:52
数智化医院2025
健康医疗
人工智能
动态规划
python
论文笔记:Enhancing Sentence Embeddings in Generative Language Models
——>需要较大的
训练
批次,这会消耗大量的计算资源一些前沿的工作将焦点转向了最近开发的生成模型,期望利用其先进的文本理解能力,直接对输入句子进行编码,而无需额外的反向传播由于句子表示和自回归语言建模
UQI-LIUWJ
·
2025-02-26 20:17
论文阅读
语言模型
人工智能
技术硬核:突出FP8、3倍速度、90%成本暴降等技术参数,强化可信度
DeepSeek近期开源项目详细分析1.FlashMLA:大模型推理效率革命技术特点:首个开源项目FlashMLA是针对英伟达Hopper架构
GPU
(如H800)优化的高效多头潜在注意力(MLA)解码内核
guzhoumingyue
·
2025-02-26 20:45
AI
python
DeepSeek-V3:最强开源MoE模型的技术解析与使用指南
目录引言模型概览架构创新:负载均衡策略与
训练
目标预
训练
:追求极致的
训练
效率后
训练
:从DeepSeek-R1进行知识蒸馏模型下载评估结果基础模型标准基准测试上下文窗口聊天模型标准基准测试(大于67B的模型
认识祂
·
2025-02-26 19:10
deepseek
开源
deepseek
全面分析 DeepSeek 的新开源 FlashMLA
导言著名的人工智能公司DeepSeek最近开源了FlashMLA,这是一款针对Hopper
GPU
上的多头潜意识(MLA)进行了优化的高性能解码内核。
X.Cristiano
·
2025-02-26 19:34
FlashMLA
深度学习
人工智能
云原生周刊:云原生和 AI
FlashMLA是专为NVIDIAHopper架构
GPU
(如H100、H800)优化的高效多头潜在注意力(MLA)解码内核,旨在提升大模型推理性能,特别是针对可变长度序列进行了优化。
·
2025-02-26 19:58
云计算
DeepSeep开源周,第三天:DeepGEMM是啥?
矩阵乘法(GEMM)是深度学习模型的核心运算(如全连接层、卷积层等),其性能直接影响
训练
和推理效率。
程序员差不多先生
·
2025-02-26 19:33
pytorch
从零开始:使用PyTorch构建DeepSeek R1模型及其
训练
详解
本文将引导你使用PyTorch从零开始构建DeepSeekR1模型,并详细解释模型架构和
训练
步骤。
陆鳐LuLu
·
2025-02-26 19:02
pytorch
人工智能
python
什么是RAG?RAG是如何解决问题的?RAG的未来发展趋势有哪些?
二、为什么会出现RAGRAG的出现,是因为在大模型的广泛应用中,伴随着出现的一些问题,比如:知识的局限性:模型自身的知识完全源于它的
训练
数据,而现有的主流大模
大模型综述
·
2025-02-26 18:31
人工智能
开发语言
大模型
AGI
ai
RAG
自然语言处理
DeepSeek 开源周:DeepEP 项目详解,
GPU
压榨计划启动!
这个旨在优化
GPU
性能的工具一经发布便迅速获得了广泛的关注和赞誉,短短两小时内就斩获了超过1000个Star。本文将详细介绍DeepEP的功能、应用场景以及如何使用它来提升AI
训练
和推理的效率。
东方佑
·
2025-02-26 18:29
量子变法
开源
一文读懂 AI 大模型备案:万字详解全流程要点
它确保大模型在整个生命周期,从开发、
训练
到部署和应用,都严格遵循相关法律
chuangfumao
·
2025-02-26 17:25
人工智能
DeepSeek各模型现有版本对比分析
文章目录一、基础模型系列:V1到V3的演进二、专用模型系列:推理与多模态三、版本选型与商业化趋势DeepSeek作为最近特别火爆的模型,本文将对DeepSeek现有的主要版本进行对比分析,涵盖参数规模、
训练
数据
墨染夜雨笺
·
2025-02-26 17:22
DeepSeek
AI
在Intel
GPU
上使用IPEX-LLM进行本地BGE嵌入
Intel的IPEX-LLM是一种专门为IntelCPU和
GPU
优化的PyTorch库,能够在包括本地PC上的集成显卡和独立显卡(如Arc、Flex和Max)在内的Intel硬件上以极低的延迟运行大型语言模型
shuoac
·
2025-02-26 16:16
python
【无标题】
日常开发stream流示例基础对象代码块@Data@ToStrin
gpu
blicclassPerson{privateStringname;privateStringcity;publicPerson(
fan510988896
·
2025-02-26 15:38
JAVA
java
正则化技术和模型融合等方法提高模型的泛化能力
正则化技术原理正则化是通过在损失函数中添加一个正则化项,来限制模型的复杂度,防止模型过拟合
训练
数据,从而提高模型在未见过数据上的泛化能力。
小赖同学啊
·
2025-02-26 15:36
人工智能
人工智能
下载cuda11.2+cudnn8.1+tensorflow-
gpu
2.5
安装cuda11.2和cudnn8.1要注意自己的版本,目前tensorflow-
gpu
2.5或最高版本tensorflow-
gpu
2.6只支持cuda11.2和cudnn8.1。
听微雨
·
2025-02-26 14:03
深度学习
tensorflow
人工智能
蓝桥杯备赛-基础
训练
(三)哈希表 day16
今天一更赎金信题意:给定一个赎金信(ransom)字符串和一个杂志(magazine)字符串,判断第一个字符串ransom能不能由第二个字符串magazines里面的字符构成。如果可以构成,返回true;否则返回false。(题目说明:为了不暴露赎金信字迹,要从杂志上搜索各个需要的字母,组成单词来表达意思。杂志字符串中的每个字符只能在赎金信字符串中使用一次。)注意:你可以假设两个字符串均只含有小写
清墨璃笙
·
2025-02-26 14:28
蓝桥杯
散列表
算法
数据结构
python
云平台结合DeepSeek的AI模型优化实践:技术突破与应用革新
**弹性算力调度体系**-**动态资源分配**:基于Kubernetes的智能调度器实现
GPU
资源的细粒
荣华富贵8
·
2025-02-26 13:23
程序员的知识储备1
经验分享
全市场大模型分类及对比分析报告
2.大模型分类根据模型架构、
训练
目标和应用领域,全市场的
早退的程序员
·
2025-02-26 13:53
分类
数据挖掘
人工智能
零基础学习机器学习分类模型
模型
训练
和评估:使用经典的分类算法——逻辑回归。代码解释:逐步分析代码实现。拓展内容:如何优化和扩展该项目。1.原理介绍1.1机器学习基本概念机器学习(
可喜~可乐
·
2025-02-26 12:14
机器学习
机器学习
学习
分类
人工智能
数据挖掘
DL之IDE:深度学习环境安装之Tensorflow/tensorflow_
gpu
+Cuda+Cudnn(最清楚/最快捷)之详细攻略(图文教程)
DL之IDE:深度学习环境安装之Tensorflow/tensorflow_
gpu
+Cuda+Cudnn(最清楚/最快捷)之详细攻略(图文教程)导读本人在Win10下安装深度学习框架Tensorflow
一个处女座的程序猿
·
2025-02-26 11:43
精选(人工智能)-中级
深度学习
人工智能
tensorflow
训练
神经网络出现nan
在理解和修改QARV的代码时,出现了
训练
会因为nan而终止的问题,因此学习记录。
崧小果
·
2025-02-26 11:12
AI学习记录
神经网络
深度学习
机器学习
复试英文准备方法
为了高效准备计算机领域的英文文献翻译面试,可以按照以下步骤进行系统
训练
,重点提升专业术语积累、文献结构理解和即时翻译能力:一、核心能力针对性
训练
专业术语速记建立术语库:-每天整理《算法导论》《人工智能:
小王Jacky
·
2025-02-26 11:12
计算机英语
英语
计算机英语
深度求索DeepSeek:AI大模型的全域应用与技术突破
其基于DeepSeek-R1系列大模型的创新架构,以600万美元的超低
训练
成本(仅为OpenAI同类模型的1/30)3,在自然语言处理、逻辑推理、多模
量子纠缠BUG
·
2025-02-26 11:11
DeepSeek部署
DeepSeek
AI
人工智能
easyui
前端
【TVM教程】为 NVIDIA
GPU
自动调度神经网络
ApacheTVM是一个深度的深度学习编译框架,适用于CPU、
GPU
和各种机器学习加速芯片。
HyperAI超神经
·
2025-02-26 09:57
TVM
神经网络
人工智能
深度学习
TVM
GPU
NVIDIA
语言模型
AI人工智能机器学习之监督线性模型
监督学习是一种机器学习任务,其中模型在已标记的数据集上进行
训练
。线性模型是一类通过线性组合输入特征来进行预测的模型。线性模型的基本形式可
rockfeng0
·
2025-02-26 09:57
人工智能
机器学习
sklearn
Yolov8分割
训练
自己的数据集记录
Yolov8分割
训练
自己的数据集记录第一章、标签制作一、安装labelmelabelme安装很简单,直接在终端输入:pipinstalllabelme启用labelme在终端输入:labelme接下来就是标注数据了
小俊俊的博客
·
2025-02-26 08:21
yolov8
分割
训练自己的数据集
【深度学习】PYTORCH框架中采用
训练
数据“CIFAR-10”实现RESNET50
一、ResNet网络结构二、基本块三、RESNET50代码实现resnet50.pyimporttorchimporttorch.nnasnnfromtorch.nnimportfunctionalasFclassResNet50BasicBlock(nn.Module):def__init__(self,in_channel,outs,kernerl_size,stride,padding):s
别出BUG求求了
·
2025-02-26 08:20
深度学习
深度学习
pytorch
cifar-10
resnet50
神经网络
详细介绍人工智能学习框架
人工智能学习框架是开发者用于构建、
训练
和部署机器学习模型的核心工具。
日记成书
·
2025-02-26 08:16
反正看不懂系列
人工智能
YOLOv8实例分割
训练
自己的数据集
转载https://blog.csdn.net/m0_51530640/article/details/1299752571.利用labelme进行数据标注1.1Labelme安装方法首先安装Anaconda,然后运行下列命令:####################forPython2####################condacreate--name=labelmepython=2.7s
NoContours
·
2025-02-26 08:14
YOLO
python
开发语言
Web
GPU
与Web框架集成
目录React集成Vue集成Angular集成Svelte集成React集成将Web
GPU
与React集成,可以让您在React应用中利用现代Web图形和计算API来创建高性能的3D图形和计算任务。
天涯学馆
·
2025-02-26 08:13
WebGL
3D图形图像技术
前端
javascript
react.js
webgl
图像处理
3d
总结yolov8做检测
训练
时所需要的代码
运行模型
训练
脚本代码:大家可以先在ultralytics/ultralytics文件夹下新建一个mytrain.py,然后直接复制下面的代码,所有
训练
有关的超参数都可以在这个文件中调节,不懂超参数可以忽略
小胡学长
·
2025-02-26 08:13
YOLO
人工智能
深度学习
yolov8
python
1024程序员节
Qwen2.5 技术报告
与之前的迭代相比,Qwen2.5在预
训练
和后
训练
阶段都有显著的改进。在预
训练
方面,将高质量的预
训练
数据集从之前的7万亿个token扩展到18万亿个token,为常识、专家知识和推理能力提供坚实的基础。
三谷秋水
·
2025-02-26 07:11
大模型
机器学习
人工智能
语言模型
机器学习
人工智能
上一页
18
19
20
21
22
23
24
25
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他