GPU 第4页

Conda安装pytorch和cuda出现问题的解决记录

pytorch已经安装却显示cuda不可用问题表现：pytorch已经安装，代码能够正常运行，但是不能识别到GPU，Cuda显示不可用。

IOT.FIVE.NO.1·2025-06-11 09:47

拉力测试cuda pytorch 把 4070显卡拉满

importtorchimporttimedefstress_test_gpu(matrix_size=16384,duration=300):"""对GPU进行压力测试，通过持续的矩阵乘法来最大化GPU

MYH516·2025-06-11 06:00

k8s集群GPU监控项说明

文章目录1.DCGM_FI_DEV_SM_CLOCK2.DCGM_FI_DEV_MEM_CLOCK3.DCGM_FI_DEV_MEMORY_TEMP4.DCGM_FI_DEV_GPU_TEMP5.DCGM_FI_DEV_POWER_USAGE6

玄德公笔记·2025-06-11 04:14

kubernetes 1.24 使用nvidia gpu 单机/集群

1k8s集群安装服务器配置域名设置好，端口号要开下。命令略了sudoapt-getupdate\&&sudoapt-getinstall-yapt-transport-https\ca-certificatescurlsoftware-properties-common关swapswapoff-ased-ri's/.*swap.*/#&/'/etc/fstabipv4流量转到iptables：ca

hymanSlime·2025-06-11 04:10

K8S集群 - GPU机器驱动安装

1、GPU可以升级下内核3.10版本的小版本升级```shellyuminstallkernel```2、首先查看GPU显卡信息```shelllspci|grep-invidia```3、去官网下载GPU

卡亦克·2025-06-11 04:10

无需手动输入命令，简单3步即可在K8S集群中启用GPU

在本文中，我将阐述在Kubernetes集群中使用GPU的简单方法。在未来的文章中，我们还将GPU推向至边缘并向你展示如何完成这一步骤。

2401_83916283·2025-06-11 04:09

零基础学习GPU 系统软件资源（7.4）--未来趋势与前沿技术:新型架构的软件适配

目录第七章：未来趋势与前沿技术新型架构的软件适配1.CXL协议对GPU缓存一致性的影响(1)CXL协议的核心特性(2)GPU缓存一致性的挑战与解决方案(3)性能影响与适用场景2.DPU加速下的GPU资源卸载场景

xiaoheshang_123·2025-06-11 00:12

多区域协同的异地多活AI推理服务架构

多区域协同的异地多活AI推理服务架构上海区域北京区域广州区域延迟最低北京故障转移备用命中未命中缓存未命中冷启动拉取冷启动拉取分发模型权重/CDN缓存写入异地日志上海API网关上海区域负载入口上海推理调度器上海GPU

大数据张老师·2025-06-10 22:29

【Triton 教程】triton_language.arange

它旨在提供一个基于Python的编程环境，以高效编写自定义DNN计算内核，并能够在现代GPU硬件上以最大吞吐量运行。

·2025-06-10 19:49

SurfaceFlinger及Android应用RenderThread角度观察Jank丢帧卡顿

SurfaceFlinger及Android应用RenderThread角度观察Jank丢帧卡顿CPU、GPU、Display三个部分：CPU负责计算帧数据，把计算好的数据交给GPU，GPU会对图形数据进行渲染

zhangphil·2025-06-10 18:25

OpenCV CUDA模块中用于稠密光流计算的 TV-L1（Dual TV-L1）算法类cv::cuda::OpticalFlowDual_TVL1

OpenCV4.9IDE:VisualStudioCode编程语言：C++11算法描述cv::cuda::OpticalFlowDual_TVL1类是基于变分优化方法的稠密光流算法实现（DualTV-L1光流模型），在GPU

村北头的码农·2025-06-10 15:37

【Triton 教程】triton_language.num_programs

它旨在提供一个基于Python的编程环境，以高效编写自定义DNN计算内核，并能够在现代GPU硬件上以最大吞吐量运行。

·2025-06-10 15:15

pycuda

一、定义1.定义2.案例3.pycuda调用c++，并在内核中执行4.接口二、实现定义PyCUDA是一个基于NVIDIACUDA的Python库，用于在GPU上进行高性能计算。

贾亚飞·2025-06-10 15:35

【评测】Qwen3-Embedding模型初体验

部署方法可以参考【部署】dify+ollama部署Qwen3-Embedding-8B【评测】Qwen3-Embedding模型初体验模型的介绍页面0.6B运行配置：笔记本i5-8265U，16G内存，无GPU

·2025-06-10 12:48

定时移动鼠标点击鼠标，防止电脑息屏的vba脚本

TypePOINTAPI'ThisholdsthelogicalcursorinformationDimxAsLongDimyAsLongEndTypePublicDeclareFunctionGetCursorPosLib"user32"(lpPointAsPOINTAPI)AsLongPublicDeclareFunctionSetCursorPosLib"user32

panfei263031·2025-06-10 04:53

7.4.1-elasticsearch索引元字段

且该字段要求长度在512字节以内;_id字段对应的值可以通过条件查询(term,terms,match,query_string,simple_query_string)进行检索;//定义mappingPUTidentity_id_index

akka_rz·2025-06-10 03:46

在Linux查看电脑的GPU型号

VGA是指VideoGraphicsArray，这是IBM于1987年推出的一种视频显示标准。lspci|grepvgalspci|grep-ivga的含义lspci：列出所有连接到PCI总线的设备。grep-ivga：过滤输出，仅显示包含“VGA”字样的行，-i表示忽略大小写。

易·木·2025-06-10 01:28

本地处理 + GPU 加速模糊视频秒变 4K/8K 修复视频老旧素材

各位数码小达人们！你们知道吗，今天我要给大家介绍一款超厉害的工具——Video2X。它就像是一个神奇的魔法棒，能把低分辨率的视频、GIF和图像变成高清甚至4K的，而且画质细节一点都不会损失！先来说说它的核心功能。第一，它能无损放大和提升画质，不管是视频、静态图片还是GIF动画，都能把分辨率提上去，最大能放大到8K呢！处理完之后，画面的噪点少了，色彩过渡就像丝绸一样自然，边缘也变得超级清晰，就像给画

小瑞软件库·2025-06-10 00:23

【AI大模型】11、CV预训练革命：从ImageNet到ViT的技术演进与商业化

Caltech101）1400万标注图像百亿级（如Laion-5B）类别覆盖数十类（如车辆、人脸）2.2万语义类别跨模态（图文音视频）标注体系平面标签WordNet层级结构多模态对齐标注硬件需求CPU单机处理2块GPU

·2025-06-09 21:38

纹理压缩格式优化

Texture压缩=减小显存占用，提升加载速度，减轻GPU负担纹理是游戏中最大资源，占用50%+内存正确压缩：减少GPUBandwidth，提高渲染性能错误压缩：画面失真、卡顿、发热总结：压缩纹理=手机省电不发烧

海尔辛·2025-06-09 18:46

【TVM 教程】如何使用 TVM Pass Infra

ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。

·2025-06-09 17:23

Shader编写指南(六十): Shader运行时性能优化

不同平台的GPU性能差异显著（如高端PCGPU与低端移动GPU），为确保游戏在各类设备上流畅运行，需针对性优化着色器，减少计算量和纹理读取。

小李也疯狂·2025-06-09 17:39

轻量化图像超分新范式：残差注意力网络重构超分计算逻辑

显存黑洞：传统残差网络堆叠导致参数量指数级增长，移动端部署时显存占用超过500MB细节丢失：常规通道注意力机制在压缩过程中丢失高频纹理信息，PSNR指标下降超过1.2dB推理延迟：典型4倍超分模型在移动端GPU

CodePatentMaster·2025-06-09 15:22

NVIDIA GPU介绍：概念、序列、核心、A100、H100

johnny233·2025-06-09 03:28

nohup: 无法运行命令‘Command‘: 没有那个文件或目录

使用下面代码nohup`pythonprojects/SparseRCNN/train_net.py--num-gpus2--config-fileprojects/SparseRCNN/configs

Asuyio·2025-06-09 01:44

边缘AI推理突破：树莓派5运行Llama3-13B的异构计算极致优化指南

引言：边缘大语言模型推理的挑战在边缘计算设备上部署13B参数级大语言模型（LLM）面临三重挑战：算力瓶颈：ARMCortex-A76CPU峰值算力仅0.5TFLOPS，远低于GPU服务器内存墙限制：8GBLPDDR4X

尘烬海·2025-06-09 00:38

C#检测本机是否安装CUDA

如果你需要在C#中检测是否安装了支持CUDA的GPU，可以使用ManagedCuda库。下面是一个简单的方法来检查CUDA设备的存在。

碎碎念的安静·2025-06-08 22:51

TPU结构总结

TPU只完成推理过程，训练过程在GPU上完成。TPU可以像GPU一样通过PCIe总线接口挂载到现有的服务器上。

枫溪夜影·2025-06-08 15:37

SpriteBatch类详解

绘图图片在存储时通常具有一定的格式，我们这里只说png类型，当一个png的文件被读入到GPU（图形处理器）后，我们称其为texture（纹理）。

weixin_34365417·2025-06-08 15:31

Unity性能优化 - Draw Call篇

一、什么是DrawCallDrawCall是Unity中的一个概念，指的是GPU渲染一个物体所需的调用次数。减少DrawCalls可以提高游戏的帧率。

后知后觉℘·2025-06-08 15:00

qwen3使用VLLM启动：vllm docker运行命令

1.停止大模型dockerstopvllm-qwen3-32b&&dockerrmvllm-qwen3-32b2.启动大模型dockerrun-d--gpusall--restartunless-stopped

Ven%·2025-06-08 08:12

Xbox：Xbox发展历史与文化_2024-07-19_19-00-40.Tex

它采用了Intel的PentiumIII处理器，NVIDIA的GeForce3GPU，以及8GB的硬盘，这些配置在当时是相当先

chenjj4003·2025-06-08 04:15

MXNet深度学习框架入门指南：核心概念与架构解析

MXNet的核心优势高性能与可扩展性：原生支持多GPU和分布式多主机任

陆璞朝Jocelyn·2025-06-08 04:44

安装了torch发现是cpu版本怎么办？

全局可用：安装的包对所有项目可见（适合常用工具如numpy、pandas）可以省略以下步骤（防止污染环境）创建并激活环境condacreate-npytorch_gpupython=3.10-ycondaactivate

·2025-06-08 01:56

CMake find_package(CUDAToolkit) 报错，找不到 CUDA_CUDART

安装llama-cpp-python时，使用GPU版本，系统版本是Ubuntu22.04cuda版本是12.1安装命令：CMAKE_ARGS="-DLLAMA_CUBLAS=on"pipinstallllama-cpp-python

0语1言·2025-06-07 18:40

Python 训练营打卡 Day 34

GPU训练及类的call方法一、GPU训练与day33采用的CPU训练不同，今天试着让模型在GPU上训练，引入importtime比较两者在运行时间上的差异importtorch#设置GPU设备device

2401_86382089·2025-06-07 17:35

使用deepSeek-8B-Transformers开发本地接口

__version__)#例如2.0.1print(torch.cuda.is_available())#必须返回True#使用HuggingFace（需GPU）model_name="app/utils

技术支持者python，php·2025-06-07 15:52

Vortex GPGPU的github流程跑通与功能模块波形探索（四）

文章目录前言一、demo的输入文件二、trace_csv三、2个值得注意的点3.1csv指令表格里面的tmask？3.2rtlsim和simx的log文件？总结前言跟着前面那篇最后留下的几个问题接着把输出波形文件和csv文件的输入、输出搞明白！一、demo的输入文件该文件夹下的内容包括：dention@dention-virtual-machine:~/Desktop/vortex/vortex/

·2025-06-07 09:15

【linux】服务器限制客户端ssh访问

只允许特定客户端访问服务器审计追踪：方便根据SSH密钥追踪访问者1实现方式1.1客户端生成SSH密钥以windows为例，以ssh-keygen-trsa命令生成密钥PSE:\>ssh-keygen-trsaGeneratingpublic

BreezeDove·2025-06-07 06:47

【PyTorch】CUDA基础知识

NVIDIACUDA显卡中包含一个GPU，它能够以高度并行化的方式实现矩阵乘法。在很长一段时间，英伟达（NVIDIA）的GPU市场份额一直保持领先。他们有一套成熟的软件工具，可以充分利用硬件加速。

沐兮Krystal·2025-06-07 05:08

开源 vGPU 方案：HAMi,实现细粒度 GPU 切分

本文主要分享一个开源的GPU虚拟化方案：HAMi，包括如何安装、配置以及使用。

·2025-06-07 01:34

ubuntu20.04使用docker部署ubuntu16.04环境

ubuntu16.04环境3.查看镜像4.启动镜像的一个容器5.进入容器并查看环境使用docker起因刚开始学习机器学习、深度学习都是使用的笔记本(只有集显)；后来做NLP项目需要训练bert这种大模型，训练是必须要用GPU

NUAA1703·2025-06-06 23:32

采用 Docker & GPU 部署的 Ubuntu 或者 windows 桌面环境

#国内下载不了dockerpullgezp/ubuntu-desktop:24.04-cu12.6.2#阿里云镜像dockerpullregistry.cn-hongkong.aliyuncs.com/gezp/ubuntu-desktop:24.04-cu12.6.2#createcontainerwithnomachinedockerrun-d--restart=on-failure--nam

深度求索者·2025-06-06 23:31

unsloth微调Qwen3模型实战

一、前言Unsloth是一个专注于优化大型语言模型（LLMs）微调效率的开源框架，旨在显著提升训练速度并降低显存占用，使得在资源有限的硬件（如单张消费级GPU）上高效微调大模型成为可能。

韭菜盖饭·2025-06-06 22:19

YOLO在QT中的完整训练、验证与部署方案

配置环境：安装必要的软件，包括Python3.x、CUDA（用于GPU加速）、CUDNN

LeonDL168·2025-06-06 15:03

手把手教你学PCIE--内存管理（2）-基本概念： UMD（用户模式驱动）、KMD（内核模式驱动）和 DDK（设备驱动开发工具包）之间的关系

目录示例背景步骤详解具体流程图示总结了更好地理解UMD（用户模式驱动）、KMD（内核模式驱动）和DDK（设备驱动开发工具包）之间的关系以及它们如何协同工作，我们可以考虑一个具体的示例：使用VulkanAPI提交一个简单的图形渲染作业到GPU

小蘑菇二号·2025-06-06 14:27

＜记录＞基于pytorch的cifar-10卷积神经网络（CNN）分类

0，开始之前（不使用GPU可以直接跳到第一步）运行环境：win10+py3.7.8+pycharm（可选部分：GPU环境：GTX1660+cuda10.2+cudnn8.1.0）cuda和cudnn简单的说就是两个用于机器学习的包

shc9912·2025-06-06 12:17

springboot Ehcache缓存配置

org.springframeworkspring-context-supportnet.sf.ehcacheehcacheorg.apache.shiroshiro-ehcache1.3.2新建配置类文件（注意启动类的扫描范围，可自定义扫描）@Configuration@EnableCachingpublicclassCacheConfig

baicu7502·2025-06-06 11:07

《PyTorch Hub：解锁深度学习模型的百宝箱》

据统计，训练一个像GPT-3这样的大规模语言模型，可能需要数千块GPU芯片并行计算数月之久，成本高达数百

空云风语·2025-06-05 22:11

Jetson Nano 2GB训练yolo11n模型（本地训练使用GPU）

温馨提示本篇文章是在Jetsonnano2gb的10W模式和关闭图形化界面的条件进行的，请确保你的条件符合要求。#关闭图形化界面sudosystemctlset-defaultmulti-user.targetsudoreboot#开启图形化界面sudosystemctlset-defaultgraphical.targetsudoreboot#开启Jetsonnano2gb的最高功率模式sudo

·2025-06-05 19:17

推荐频道

GPU