E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
cuda
QtAV入门
硬件加速利用GPU解码(DXVA2、VAAPI、VideoToolbox、
CUDA
)。
byxdaz
·
2025-03-31 06:09
QT
qt
video
audio
vLLM:高性能大语言模型推理框架源码解析与最佳实践
核心组件与类层次结构3.3.初始化阶段详细流程3.4.推理阶段详细流程3.5.完整调用链路示例3.6.关键调用路径总结vLLM关键工作机制4.1.PagedAttention机制4.2.连续批处理技术4.3.
CUDA
gfengwong
·
2025-03-30 11:29
AI
语言模型
人工智能
自然语言处理
CUDA
专题3:为什么GPU能改变计算?深度剖析架构、
CUDA
®与可扩展编程
1.简介1.1.使用GPU的优势图形处理器(GPU)在相近的成本和功耗范围内,能够提供比中央处理器(CPU)更高的指令吞吐量和内存带宽。许多应用程序利用这些优势,在GPU上的运行速度远超CPU(参见《GPU应用》)。其他计算设备(如FPGA)虽然能效也很高,但其编程灵活性远不及GPU。GPU与CPU的能力差异源于它们的设计目标不同。CPU旨在以最快速度执行单个线程(即一系列操作),并可并行执行数十
AI专题精讲
·
2025-03-29 20:22
CUDA
C++编程系列专题
gpu算力
Ubuntu LLaMA-Factory实战
一、UbuntuLLaMA-Factory实战安装:
CUDA
安装
CUDA
是由NVIDIA创建的一个并行计算平台和编程模型,它让开发者可以使用NVIDIA的GPU进行高性能的并行计算。
张3蜂
·
2025-03-29 19:20
llama
服务器上
Cuda
+Pytorch兼容性的那些问题
服务器上如何搭建匹配版本的
cuda
+pytorch:1.查询nvidia中驱动版本与
cuda
最高兼容版本命令行输入:nvidia-smi2.选择对应的pythonDriverVersion与NVIDIA-SMI
入世浮尘
·
2025-03-29 18:42
服务器
CUDA
Pytorch
服务器
pytorch
运维
开源深度学习框架PyTorch
2.强大的GPU加速使用
CUDA
深海水
·
2025-03-29 07:21
人工智能
行业发展
IT应用探讨
深度学习
开源
pytorch
人工智能
python
机器训练
OpenCV正确安装及环境变量配置
Windows10SDK和MSVC安装CMake(3.31.6)在.npmrc配置pnpmconfigsetauto-approve-buildstrue运行pnpminstall接下来是开启GPU加速,非必须安装
CUDA
Toolkit
饺子大魔王12138
·
2025-03-28 19:27
node.js
opencv
人工智能
计算机视觉
配置Windows Docker、Hyper-V虚拟机和WSL的一些踩坑解决备忘(随时更新)
Docker的设置上主要是
cuda
等配置会有问题,不知道是不是版本的事儿.尝试WSL中,看上去显卡环境没问题,
cuda
可以配置,开源代码尝试中。。。
VRJerry
·
2025-03-28 01:49
ubuntu
windows
docker
基于EasyOCR实现的中文、英文图像文本识别
pipinstalleasyocr主要特点:多语言支持:支持80+种语言的识别,包括中文、英文、日文、韩文等简单易用:几行代码即可实现OCR功能预训练模型:提供开箱即用的预训练模型GPU加速:支持
CUDA
听风吹等浪起
·
2025-03-27 15:31
深度学习之应用篇
深度学习
人工智能
DeepSeek 本地部署详细教程
4090或更高)显存:至少16GB(根据模型版本调整)内存:32GB及以上存储:50GB可用空间1.2软件依赖操作系统:Linux/WindowsWSL2(推荐Ubuntu20.04+)Python3.8+
CUDA
11.7
文or野
·
2025-03-27 04:07
deep
seek
算法
数据库
deep
seek
RTX4070Ti架构解析与效能实测
具体而言,7680个
CUDA
核心的并行计算效率、12GBGDDR6X显存的带宽利用率,以及DLSS3与光线追踪技术的协同优化,将成为重点探讨方向。为直观呈
智能计算研究中心
·
2025-03-27 02:53
其他
CUDA
学习(4)——
CUDA
编程模型
由于结构的不同,具有不同的特点:CPU:擅长流程控制和逻辑处理,不规则数据结构,不可预测存储结构,单线程程序,分支密集型算法GPU:擅长数据并行计算,规则数据结构,可预测存储模式在现在的计算机体系架构中,要完成
CUDA
哦豁灬
·
2025-03-27 02:51
CUDA
学习笔记
学习
CUDA
GPU
【nvidia-B200 生产环境】NVIDIA 570.124.06+
Cuda
12.8 Ubuntu22.04 nccl-test 一键部署脚本(免修改复制即用)
目录1.初始化与日志记录2.安装基础工具与配置更新3.NVIDIA驱动安装570.124.064.安装MellanoxOFED24.10-2.1.8.05.安装
CUDA
12.86.安装NCCL和测试7.
清风 001
·
2025-03-26 18:00
AI大模型底层建设
ubuntu
数据库
postgresql
V100架构深度优化指南
本指南聚焦架构层面的核心优化要素,系统梳理从TensorCore矩阵运算加速原理到NVLink多卡通信协议的底层工作机制,同时深入探讨
CUDA
任务调度模型与显存子系统的协同优化路径。
智能计算研究中心
·
2025-03-26 04:39
其他
NVIDIA GTC 开发者社区Watch Party资料汇总
NVIDIAGTC开发者社区WatchParty资料汇总以下是所有涉及到的工具中文解读汇总,希望可以帮到各位:1.
CUDA
编程模型开发者指南和最新功能解析专栏2.NVIDIAWarp:高性能GPU模拟与图形计算的
扫地的小何尚
·
2025-03-26 00:41
NVIDIA
GPU
linux
AI
算法
在GpuGeek上创建实例如何自定义环境?
Step1:创建实例如果平台的镜像中没有您需要的Python、
Cuda
、框架版本,则可以选择Miniconda,然后按照自己需求进行环境安装。
·
2025-03-25 13:48
gpu云平台人工智能
cuda
10.1降级(卸载+安装)
1.卸载:实测有用贴:https://blog.csdn.net/qq_34877350/article/details/81185447https://blog.csdn.net/m0_37951243/article/details/90051494https://blog.csdn.net/u012074597/article/details/803172752.安装9.0
Silber666
·
2025-03-25 11:02
怎么在linux服务器选择GPU进行训练模型?
然后选择第0个和第1个GPU进行使用:
CUDA
_VISIBLE_DEVICES=0,1pythontrain.py设置
CUDA
_VISIBLE_D
LRJ-jonas
·
2025-03-25 07:03
python
深度学习
开发语言
【
CUDA
】了解GPU架构
以Fermi架构为例,其包含以下主要组成部分:
CUDA
coresSharedMemory/L1CacheRegisterFileLoad/StoreUnitsSpecialFun
GG_Bond21
·
2025-03-25 04:07
GPU
gpu算力
保姆级大模型学习路线!清华博士耗时半年整理的14个核心阶段,文科生也能跟着冲!(附论文笔记+项目源码+训练技巧)
2023行业调查报告显示:92%学习者停滞在微调阶段,核心痛点集中在:论文看不懂:Transformer源码像天书环境配不好:
CUDA
版本冲突天天报错算力不够用:
大模型入门教程
·
2025-03-25 01:17
学习
人工智能
AI
大模型
大模型学习
大模型教程
大模型入门
【AI大模型】搭建本地大模型GPT-NeoX:详细步骤及常见问题处理
1.系统要求1.1硬件要求1.2软件要求操作系统:Linux(推荐Ubuntu20.04或更高版本)
CUDA
:11.2或更高版本Python
qzw1210
·
2025-03-24 09:13
gpt
人工智能
深度学习
vggt 3d重建 相机位姿,新视角生成
vggtimporttorchfromvggt.models.vggtimportVGGTfromvggt.utils.load_fnimportload_and_preprocess_imagesdevice="
cuda
"iftorch.
cuda
.is_available
AI算法网奇
·
2025-03-24 05:32
3D视觉
人工智能
深度学习
SenseVoice 部署记录
首先部署好conda环境和
cuda
,这个可以查看他人的文章。
安静六角
·
2025-03-23 23:09
开源软件
【最新】TensorFlow、cuDNN、
CUDA
三者之间的最新版本对应及下载地址
TensorFlow、cuDNN、
CUDA
对应关系官网查询地址
CUDA
下载地址cuDNN下载地址VersionPythonversionCompilerBuildtoolscuDNN
CUDA
tensorflow_gpu
江上_酒
·
2025-03-23 21:25
开发环境及工具配置
TensorFlow
CUDA
cuDNN
PyTorch核心基础知识点
核心基础知识点,结合最新特性与工业级实践,按优先级和逻辑关系分层解析:▍核心基石:张量编程(TensorProgramming)1.张量创建(8种生产级初始化)#设备自动选择(2024最佳实践)device="
cuda
"iftorch.
cuda
.is_available
niuTaylor
·
2025-03-23 21:20
编程区
pytorch
人工智能
python
os.environ[‘
CUDA
_VISIBLE_DEVICES‘] = 的用法
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录os.environ['
CUDA
_VISIBLE_DEVICES']=单值作用os.environ['
CUDA
_VISIBLE_DEVICES
@锦瑟五十弦
·
2025-03-23 12:06
深度学习
人工智能
位宽512bit显卡_6144
CUDA
/512bit位宽 Maxwell架构曝光
现在网上又流传开Maxwell的架构设计了,旗舰GM100将有6144个
CUDA
核心,512bit位宽显
李涛PS
·
2025-03-23 06:45
位宽512bit显卡
CUDA
学习(3)——
CUDA
初步实践
1定位thread
CUDA
中提供了blockIdx,threadIdx,blockDim,GridDim来定位发起thread,下面发起1个grid,里面有2个block,每个block里有5个threads
哦豁灬
·
2025-03-23 05:08
CUDA
学习笔记
学习
CUDA
pytorch v1.4.0安装问题
直接使用conda安装报错:(CenterNet)C:\Users\16323>condainstallpytorch==1.4.0torchvision==0.5.0
cuda
toolkit=10.1-
大柠丶
·
2025-03-23 05:32
pytorch
人工智能
python
Windows和Linux系统上的Mamba_ssm环境配置
第二种方法(感觉可靠)3、第三种方法:直接下载大神编译好的文件进行安装2)、安装mamba-ssm1、第一种方法2、第二种方法:直接下载大神编译好的文件进行安装一、Linux系统安装如果自己的系统不是
cuda
11.8
清纯世纪
·
2025-03-23 04:23
笔记
python
深度学习
人工智能
Ubuntu和Windows系统之Mamba_ssm安装
Ubuntu安装直接新建一个环境是最好的,不然很容易产生各种冲突#创建环境和相关包condacreate-nmambapython=3.10.13condaactivatemambacondainstall
cuda
Netceor
·
2025-03-23 04:50
Python
ubuntu
windows
linux
不用再当“技术宅“!这个AI神器让我5分钟变身人工智能达人
可每次想自己试试,打开教程就被满屏的代码吓退——"Python环境配置"、"
CUDA
驱动安装"这些词比数学作业还让人头疼。
阳光永恒736
·
2025-03-22 20:01
AI工具
人工智能
deepseek
一键包
本地部署
AI资源
GPU计算的历史与
CUDA
编程入门
GPU计算的历史与
CUDA
编程入门背景简介GPU计算的历史可以追溯到早期的并行计算研究,如今已发展成为计算机科学中的一个重要分支。
己见明
·
2025-03-22 12:49
GPU计算
CUDA
C
数据并行性
CUDA程序结构
向量加法内核
GTC 2025 中文在线解读
GTC2025中文在线解读|
CUDA
最新特性与未来[WP72383]NVIDIAGTC大会火热进行中,一波波重磅科技演讲让人应接不暇,3月24日,NVIDIA企业开发者社区邀请KenHe、YipengLi
扫地的小何尚
·
2025-03-22 11:17
人工智能
NVIDIA
GPU
深度学习
机器学习
英伟达消费级RTX显卡配置表
显卡型号显存大小显存频率显存位宽显存带宽
CUDA
核心数TDP(功耗)上市年份RTX409024GB21Gbps384-bit1,008GB/s16,384450W2022RTX4080(16GB)16GB22.4Gbps256
真相很简单
·
2025-03-22 10:35
识别算法
网络
rtx
nvidia
英伟达
游戏显卡
3090显卡Ktransformer本地部署deepseek R1:70B
这里写自定义目录标题效果完成视频:配置参考依赖安装安装
cuda
配置环境下载deepseekR170B下载ktransoformer开始安装运行Web启动常见问题runtimeerrordon'tmatch
SIATdog
·
2025-03-21 20:59
ai
【ai】mocap:conda 安装python3.8+
cuda
+ pytorch+torchaudio、torchvision
安装pytorch就是会带上
cuda
cudnn啥的pytorch【ai】tx2nx:安装torch、torchvisionforyolov5这里就发现pytorch和torchvision有依赖关系的,
等风来不如迎风去
·
2025-03-21 05:41
AI入门与实战
人工智能
ubuntu
conda
查看
CUDA
cudnn 版本 查看Navicat GPU版本
查看显卡型号:lspci|grepVGA(lspci是linux查看硬件信息的命令),屏幕会打印出主机的集显几独显信息python中查看显卡型号fromtensorflow.python.clientimportdevice_libdevice_lib.list_local_devices()
FergusJ
·
2025-03-21 03:30
备份
python
开发语言
查看 Linux 系统中安装的
CUDA
版本
查看Linux系统中安装的
CUDA
版本的常见方法:文章目录1查看/usr/local/
cuda
目录2使用nvcc命令3检查libcublas版本注意:nvidia-smi1查看/usr/local/
cuda
烟锁池塘柳0
·
2025-03-20 20:28
Linux
CUDA
linux
ubuntu
已解决:python多线程使用TensorRT输出为零?附tensorrt推理代码
设备:
cuda
12.1,cudnn8.9.2,tensorrt8.6.11.问题tensorrt的推理没输出???
李卓璐
·
2025-03-20 18:11
算法实战
python
开发语言
CUDA
编程基础
一、快速理解
CUDA
编程1.1
CUDA
简介
CUDA
(ComputeUnifiedDeviceArchitecture)是由NVIDIA推出的并行计算平台和应用程序接口模型。
清 澜
·
2025-03-20 17:35
算法面试
人工智能
c++
算法
nvidia
cuda编程
2025年开发者工具全景图:IDE与AI协同的效能革命
腾讯云等平台技术文档与行业趋势分析)一、核心工具链的务实演进与配置指南主流开发工具的升级聚焦于工程化适配与智能化增强,以下是2025年开发者必须掌握的配置技巧:1.VSCode:性能优化与远程协作标杆核心特性:
CUDA
He.Tech
·
2025-03-20 14:45
ide
人工智能
bitsandbytes 报错
用nvidia-smi查看
CUDA
版本,我的是12.2。
HuggingMe
·
2025-03-20 08:55
pytorch
centos7输入python -m bitsandbytes报错
CUDA
Setup failed despite GPU being available. Please run the follo
在centos7.9系统中安装gpu驱动及
cuda
,跑大模型会报错,提示让输入python-mbitsandbytes依然报错:
CUDA
SETUP:Loadingbinary/usr/local/python3
小太阳,乐向上
·
2025-03-20 08:21
python
开发语言
关于bitsandbytes安装报错
RunTimeError:
CUDA
SetupfaileddespiteGPUbeingavailable.Inspectthe
CUDA
SETUPoutputsabovetofixyourenvironment
跃跃欲试88
·
2025-03-20 07:18
语言模型
人工智能
transformer
python -m bitsandbytes 报错解释与解决
RuntimeError:
CUDA
SetupfaileddespiteGPUbeingavailable.Pleaserunthefollowingcommandtogetmoreinformation
MityKif
·
2025-03-20 07:44
python
开发语言
c++高性能多进程
cuda
编程: safe_softmax实现 + cub::BlockReduce自定义归约操作
BlockReduce自定义归约操作(`cub::BlockReduce::Reduce`)1.语法safe_softmax实现cub::BlockReducecub::BlockReduce是CUB库(
CUDA
UnBound
FakeOccupational
·
2025-03-20 06:35
深度学习
c++
开发语言
使用LoRA微调LLaMA3
步骤一:环境搭建安装必要的Python包pipinstalltransformersdatasetstorch配置GPU环境确保你的环境中配置了
CUDA
和cuDNN,并验证GPU是否可用。
想胖的壮壮
·
2025-03-19 16:12
深度学习
人工智能
融合AMD与NVIDIA GPU集群的MLOps:异构计算环境中的分布式训练架构实践
在深度学习的背景下,NVIDIA的
CUDA
与AMD的ROCm框架缺乏有效的互操作性,导致基础设施资源利用率显著降低。
·
2025-03-19 11:59
NVIDIA-B200 OFED安装失败解决步骤,实际生产环境故障一例
环境信息系统ubuntu22.04硬件nvidiaB200nvidia-driverubuntu2204-570.124.06
cuda
cuda
-toolkit-12-8报错信息.
清风 001
·
2025-03-19 05:34
AI大模型底层建设
linux
运维
服务器
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他