gpu 第13页

Windows 图形显示驱动开发-WDDM 1.2功能—Windows 8 中的 DirectX 功能改进（四）

1.1现代GPU架构演变graphLRA[传统IMR架构]

程序员王马·2025-04-20 00:54

Windows 图形显示驱动开发-WDDM 1.2功能—Windows 8 中的 DirectX 功能改进（一）

双精度着色器功能：高级着色器模型性能改进，使你可以在GPU上执行更多操作，而无需占用CPU。独立于目标的光栅化：适用于Direct2D应用程序的高性能抗锯齿路径。无覆盖和丢弃：使用基

程序员王马·2025-04-20 00:24

Windows 图形显示驱动开发-WDDM 1.2功能—Windows 8 中的 DirectX 功能改进（二）

1.1WDDM1.2双精度支持矩阵graphLRA[功能级别11_0+]-->|必须支持|B(基础双精度)A-->C[可选支持扩展指令]D[WDDM1.2驱动]-->|硬件加速|E[FMA指令集]F[GPU

程序员王马·2025-04-20 00:24

Pytorch与深度学习自查手册1-张量、自动求导和GPU

Pytorch与深度学习自查手册1-张量、自动求导和GPU张量构造Tensordtype类型：dtype=torch.long,torch.float,torch.double常见的构造Tensor的函数

冬于·2025-04-19 23:47

平板个人计算机的品牌和配置,比较热销十大平板电脑排行榜

www.chinapp.com品牌网比较热销十大平板电脑排行榜：1、三星GalaxyTab7.0Plus显示屏分辨率为1024像素X600像素，配置三星ExynosS5PV210处理器和ARMMali-400MPGPU

易三叨·2025-04-19 22:40

conda创建虚拟环境并安装GPU版torch全过程(cuda11.8+py3.10+torch2.4.1+torchvision0.19.0)

目录1.创建虚拟环境2.安装pytorch2.1查找对应版本2.2安装pytorch2.3测试是否安装成功3.安装torchvision3.1查找对应版本3.2安装torchvision3.3测试是否安装成功4.Others4.1安装numpy报错4.2安装timm报错1.创建虚拟环境condacreate-nenv_name-y##指定python版本condacreate-nenv_namep

哇噻_123·2025-04-19 14:49

在企业级部署中如何优化NVIDIA GPU和容器环境配置：最佳实践与常见误区20250414

在企业级部署中如何优化NVIDIAGPU和容器环境配置：最佳实践与常见误区引言随着AI和深度学习技术的迅速发展，企业对GPU加速计算的需求愈加迫切。

Narutolxy·2025-04-19 14:18

Tensorflow、Pytorch与Python、CUDA版本的对应关系（更新时间：2025年4月）

要在Windows上使用TensorFlowGPU，您需要在WSL2中构建/安装TensorFlow或将tensorflow-cpu与TensorFlow-DirectML-Plugin一起使用1.1、

芥子沫·2025-04-19 11:56

深入理解DeepSeek与企业实践（二）：32B多卡推理的原理、硬件散热与性能实测

前言在《深入理解DeepSeek与企业实践（一）：蒸馏、部署与评测》文章中，我们详细介绍了深度模型的蒸馏、量化技术，以及7B模型的部署基础，通常单张GPU显存即可满足7B模型完整参数的运行需求。

ZStack开发者社区·2025-04-19 11:54

yolov8复现

若有，后续可安装GPU版本的pytorch以加速训练；若没有，则安装CPU版本，不过训练速度会较慢。安装所需软件Anaconda3安装：可从清华镜像源选择对应系统版本的Anaconda3安装包下载。

吹风看太阳·2025-04-19 10:22

树莓派超全系列教程文档--(29)config.txt介绍

在ArmCPU和Linux初始化之前，GPU会读取config.txt。Rasp

想躺在地上晒成地瓜干·2025-04-19 09:11

CUDA_全局内存及访问优化

全局内存GPU全局内存，CPU和GPU都可以进行读写操作。任何设备都可以通过PCI-E总线对其进行访问，GPU之间不通过CPU，直接将数据从一块GPU卡上的数据传输到另一块GPU上。

一介草民李老四·2025-04-19 07:33

linux运行程序开启了opencl,Linux上使用AMD的OpenCL开发运行环境

AMDSDKAPP开发包，另一部分是AMD的Catalyst驱动软件包.AMDSDKAPP开发包主要包括开发OpenCL应用所需要的头文件，文档和例子程序.Catalyst驱动包括OpenCL运行库，AMDGPU

某友善的微笑·2025-04-19 06:56

PoCL Runtime开发笔记

1UMDAPI开源PoCL代码中有些例子是可以参考的，路径在pocl/lib/CL/devices，有：basic：以hostCPU作为targetdevice，仅有一个执行单元cuda:NVGPU为targetdevicepthread

小小蚂蚁fcy·2025-04-19 06:23

大模型面试题

分布式训练是一种利用多个计算节点（如多个GPU或多个机器）协同工作来加速训练机器学习模型的方法。它通过将训练任务分配给多个计算资源并行执行，以减少训练时间和处理大规模数据。

钢门狂鸭·2025-04-19 04:11

使用docker 安装向量数据库Milvus

Miluvs官网www.milvus.io/https://milvus.io/docs/zh/install_standalone-docker-compose-gpu.md一、基本概念向量数据库：Milvus

❀͜͡傀儡师·2025-04-19 03:05

spring boot+mybatis-plus 时间查询精确到分秒

日期yyyy-MM-dd查询前端get请求传递参数String类型@GetMappingpublicResultfinddate(@RequestParam(defaultValue="2021-

克里斯李逵·2025-04-19 00:48

在Ubuntu服务器上部署xinference

一、拉取镜像dockerpullxprobe/xinference:latest二、启动容器（GPU）dockerrun-d--namexinference-eXINFERENCE_MODEL_SRC=

你喜欢喝可乐吗？·2025-04-19 00:44

ubuntu 20.04上docker 使用gpu

要在Docker容器中使用GPU，你需要确保系统上已经安装了正确的NVIDIA驱动程序，并且安装了NVIDIAContainerToolkit。

AI拉呱·2025-04-18 23:07

GPU 在机器学习中的应用优势：从技术特性到云端赋能

正如蒸汽引擎重塑工业革命，GPU（图形处理器）的出现为机器学习带来了前所未有的算力突破，而云GPU的普及更是让这场算力革命进入"云计算时代"，让每个开发者和企

·2025-04-18 22:39

Qt 性能优化总结

1.Qt性能优化简介性能优化目标是减少资源消耗（如CPU、内存、GPU）、提高响应速度和流畅度。Qt应用程序的性能瓶颈可能出现在：GUI渲染：复杂界面或频繁重绘。内存管理：对象分配过多或内存泄漏。

lianghu666·2025-04-18 21:57

查看 GPU 与 NUMA 节点的绑定关系

目录一、通过nvidia-smi直接查看（NVIDIA专属）1.命令与输出解读2.原理二、通过PCIe设备路径关联NUMA节点（通用方法）1.步骤1：找到GPU的PCIe地址2.步骤2：读取PCIe设备的

清风 001·2025-04-18 16:56

4090租用，各云GPU平台价格对比清单及建议

根据各平台的价格和型号配置，以下是通过DeepSeek-R1进行分析后，给出的建议。一、按显存需求推荐1.24G显存需求（适合常规AI训练/推理、中小模型）性价比首选：智星云（1.35元/小时），价格最低，比第二名BuluAI（1.93元）便宜约30%，适合预算敏感型用户。备选方案：BuluAI（1.93元）或丹摩DAMODEL（2.18元），价格适中，可尝试作为智星云的替代选项。避坑提醒：aut

智星云算力·2025-04-18 15:16

边缘计算硬件架构介绍

某个用例可能需要高功率GPU来实现人工智能（AI），而另一个用例则可能需要低功耗来延长电池寿命。设备的位置，例如微型边缘数据中心或壁挂式工业机柜，对硬件施加了不同的限制。

公众号:肉眼品世界·2025-04-18 12:26

深入浅出谈cuda

CUDA深入浅出谈“CUDA是NVIDIA的GPGPU模型，它使用C语言为基础，可以直接以大多数人熟悉的C语言，写出在显示芯片上执行的程序，而不需要去学习特定的显示芯片的指令或是特殊的结构。”

向前一一步走·2025-04-18 11:49

YOLOV8 OBB 海思3516训练流程

YOLOV8OBB海思3516训练流程1、下载带GPU版本的torch（可选）32、安装ultralytics33、下载pycharm社区版44、安装pycharm55、新建pycharm工程56、添加

绕灵儿·2025-04-18 10:43

pytorch-lightning使用笔记

(howtodownload(),tokenize,etc…)在这个方法中处理需要写入磁盘或者需要单进程完成的任务setup(howtosplit,etc…)一些dataoperations希望在每块GPU

真炎破天·2025-04-18 09:09

多网卡场景智能路由新思路：批量自动配置？

Linux多网卡场景的路由当传统路由设置方法在智算环境下失效，一个可行的应对方式是提前规划GPU服务器内的路由，借助Linux的多路由表和策略机制实现更加灵活、精细的流量控制和路由管理功能，但也伴随着一定的复杂性和潜在风险

星融元asterfusion·2025-04-18 06:44

开源项目faster-whisper和whisper是啥关系

它在准确率方面表现出色，但同时其参数众多、计算资源占用较大，常常需要GPU才能较快运行；如果直接在CPU上使用，则运行速度较慢，并且在处理长音频时容易出现“幻听”问题（模型生成冗余或不恰当的转写）。

@程序员小袁·2025-04-17 21:22

英伟达CUDA原生Python支持革命：手把手教你用Python直接操控GPU加速计算

英伟达CUDA原生Python支持革命：手把手教你用Python直接操控GPU加速计算重磅消息！2025年GTC大会宣布：CUDA现在原生支持Python了！这意味着什么？

emmm形成中·2025-04-17 19:08

GPU 算力：驱动数字时代的核心引擎（下篇）

接上篇，GPU算力正以破竹之势渗透更多关键领域，成为产业升级的核心驱动力。本文将继续解析其在金融科技、智能制造等领域的深度应用，并揭秘劲速云如何构建"触手可及"的顶尖算力生态。

·2025-04-17 12:54

GPU 算力：驱动数字时代的核心引擎（上篇）

当传统CPU面对大规模并行计算力不从心时，GPU算力以其独特优势，成为推动各行业突破的关键力量。本文将解析GPU算力本质，揭秘其核心应用。

·2025-04-17 11:51

3DGS之渲染管线

渲染管线（RenderingPipeline）是计算机图形学中将三维场景转换为二维屏幕图像的核心流程，涉及CPU与GPU的分工协作。

whuzhang16·2025-04-17 09:02

手机性能全解析：从CPU到屏幕分辨率的选购指南

CPU与GPU：处理器背后的故事在日常接触手机时，我们常常听到诸如MTK、高通、海思等处理器品牌，以及HelioP10、骁龙820、麒麟960等处理器

2501_91510632·2025-04-17 07:44

OBS 中不同编码器的预设作用与设置方法详解

更快的预设（如ultrafast）：占用更少CPU/GPU，速度更快，但压缩率较低、画质较差。更慢的

吃面不喝汤66·2025-04-17 05:33

PyTorch的benchmark模块

•Timer类：精确测量代码运行时间，支持CPU/GPU时间统计，并自动处理CUDA异步执行的同步问题。fromtorch.u

小小毛桃·2025-04-17 01:40

GpuGeek：重构AI算力基础设施，赋能产业智能升级

GpuGeek凭借创新的技术架构和运营模式，重新定义了AI算力服务的价值边界，为算法工程师和企业用户构建了集弹性算力、开发工具和模型生态于一体的新一代AI基础设施平台。

Newfocus！·2025-04-17 01:10

云原生周刊：K8s 中的 GPU 共享

KubeSphere 云原生·2025-04-16 21:40

在ARM架构Mac上部署Python 3.12与Conda环境的全链路指南！！！

环境的全链路指南（M1/M2芯片实测｜含性能调优+避坑手册）核心价值点•原生ARM支持：突破Rosetta转译的性能损耗•环境隔离：Conda虚拟环境管理+多版本Python共存方案•工业级优化：MetalGPU

小丁学Java·2025-04-16 20:36

大模型训练显存压缩实战：ZeRO-3 vs 梯度累积 vs 量化混合策略

一、显存瓶颈的本质与挑战大模型训练面临的核心矛盾是模型参数量指数级增长与GPU显存容量线性提升之间的鸿沟。

学术猿之吻·2025-04-16 10:02

【收藏】KVM GPU虚拟化技术

一、基础概念与实现方式GPU虚拟化是指将物理GPU资源分配给虚拟机，以提高图形处理性能和计算能力。KVM支持多种GPU虚拟化方式，包括直通模式、SR-IOV和半虚拟化。

玄学魔术师·2025-04-16 09:27

DeepSeek-R1 私有化部署 ubuntu22.04 3060显卡

减少GPU依赖：DeepSeek有效降低了大规模训练对GPU资源的依赖，推动了AI产业链的重塑。国际

第十人i·2025-04-16 09:26

利用多GPU计算探索量子无序及AI拓展

量子无序系统的领域是凝聚态物理学中一个引人入胜的前沿。与它们完全有序的对应物不同，这些材料表现出量子力学和内在随机性的复杂相互作用，导致了许多令人着迷且常常难以理解的行为。量子自旋玻璃就是一个典型的例子，在这种系统中，磁矩（自旋）随机耦合，导致了一个“受挫”的能量landscape和许多竞争的基态。理解这些系统的临界性质不仅具有基础科学意义上的重要性，而且对于新兴的量子计算领域，特别是在量子退火解

亚图跨际·2025-04-16 06:35

性能优化实践

而现代API（如WebGPU）通过更底层的硬件控制和并行计算能力显著提升了性能与稳定性。以下从技术对比、优化策略和案例分析三个方面展开。技术对比：We

Eqwaak00·2025-04-16 06:33

GPU服务器声音很响可以怎么处理

当GPU服务器运行时噪音过大，通常是由于高负载下散热风扇高速运转所致。

会飞的土拨鼠呀·2025-04-15 22:11

cv::cuda::GpuMat 中的 flags、data、refcount、datastart、dataend 和 allocator 含义

在OpenCV的cv::cuda::GpuMat类中，成员变量flags、data、refcount、datastart、dataend和allocator分别承担不同的角色，以下是对它们的详细解析：1

Ring__Rain·2025-04-15 21:36

【架构解析】深入浅析DeepSeek-V3的技术架构_deepseek 参数

运行这个DeepSeek-V3需要的显存资源，我先去找更大的GPUVM去了…一、DeepSeek-V3的架构详解1.模型总体概述DeepSeek-V3是一款采用Mixture-of-Experts（MoE

程序员一粟·2025-04-15 21:06

云原生周刊：K8s 中的 GPU 共享

·2025-04-15 17:14

云算力：重塑各行业数字化转型的核心引擎（上篇）

当摩尔定律逼近物理极限，GPU并行计算与云服务的融合催生算力革命。云算力以按需付费、弹性扩展的模式打破物理边界，让顶尖算力触达全行业。

·2025-04-15 13:40

一文剖析AI大模型技术架构的全景视图：从基础实施层、云原生层、模型层、应用技术层、能力层、到应用层

一、基础设施层AI大模型技术发展离不开坚实的基础设施支持，涵盖了GPU、CPU、RAM、HDD、Network等关键硬件

程序猿李巡天·2025-04-15 11:34

推荐频道

gpu

Windows 图形显示驱动开发-WDDM 1.2功能—Windows 8 中的 DirectX 功能改进（四）

Windows 图形显示驱动开发-WDDM 1.2功能—Windows 8 中的 DirectX 功能改进（一）

Windows 图形显示驱动开发-WDDM 1.2功能—Windows 8 中的 DirectX 功能改进（二）

Pytorch与深度学习自查手册1-张量、自动求导和GPU

平板个人计算机的品牌和配置,比较热销十大平板电脑排行榜

conda创建虚拟环境并安装GPU版torch全过程(cuda11.8+py3.10+torch2.4.1+torchvision0.19.0)

在企业级部署中如何优化NVIDIA GPU和容器环境配置：最佳实践与常见误区20250414

Tensorflow、Pytorch与Python、CUDA版本的对应关系（更新时间：2025年4月）

深入理解DeepSeek与企业实践（二）：32B多卡推理的原理、硬件散热与性能实测

yolov8复现

树莓派超全系列教程文档--(29)config.txt介绍

CUDA_全局内存及访问优化

linux运行程序开启了opencl,Linux上使用AMD的OpenCL开发运行环境

PoCL Runtime开发笔记

大模型面试题

使用docker 安装向量数据库Milvus

spring boot+mybatis-plus 时间查询精确到分秒

在Ubuntu服务器上部署xinference

ubuntu 20.04上docker 使用gpu

GPU 在机器学习中的应用优势：从技术特性到云端赋能

Qt 性能优化总结

查看 GPU 与 NUMA 节点的绑定关系

4090租用，各云GPU平台价格对比清单及建议

边缘计算硬件架构介绍

深入浅出谈cuda

YOLOV8 OBB 海思3516训练流程

pytorch-lightning使用笔记

多网卡场景智能路由新思路：批量自动配置？

开源项目faster-whisper和whisper是啥关系

英伟达CUDA原生Python支持革命：手把手教你用Python直接操控GPU加速计算

GPU 算力：驱动数字时代的核心引擎（下篇）

GPU 算力：驱动数字时代的核心引擎（上篇）

3DGS之渲染管线

手机性能全解析：从CPU到屏幕分辨率的选购指南

OBS 中不同编码器的预设作用与设置方法详解

PyTorch的benchmark模块

GpuGeek：重构AI算力基础设施，赋能产业智能升级

云原生周刊：K8s 中的 GPU 共享

在ARM架构Mac上部署Python 3.12与Conda环境的全链路指南！！！

大模型训练显存压缩实战：ZeRO-3 vs 梯度累积 vs 量化混合策略

【收藏】KVM GPU虚拟化技术

DeepSeek-R1 私有化部署 ubuntu22.04 3060显卡

利用多GPU计算探索量子无序及AI拓展

性能优化实践

GPU服务器声音很响可以怎么处理

cv::cuda::GpuMat 中的 flags、data、refcount、datastart、dataend 和 allocator 含义

【架构解析】深入浅析DeepSeek-V3的技术架构_deepseek 参数

云原生周刊：K8s 中的 GPU 共享

云算力：重塑各行业数字化转型的核心引擎（上篇）

一文剖析AI大模型技术架构的全景视图：从基础实施层、云原生层、模型层、应用技术层、能力层、到应用层